陈爱明,樊旭东,赵逸君
(湖北省地质调查院,湖北武汉 430034)
PDF格式地形地质图到MAPGIS格式转换方法探讨
陈爱明,樊旭东,赵逸君
(湖北省地质调查院,湖北武汉 430034)
通过讨论PDF文件特性,提出了PDF格式地形地质图到MAPGIS格式转换途径,介绍了三种不同PDF矢量图形转换软件,简述了其选项设置及转换流程。通过对两个不同形式的PDF格式地形地质图进行转换实践,对比研究了转换的实际效果。笔者认为,先将PDF矢量图形转换为DXF格式,再将DXF导入到MAPGIS软件中进行必要的编辑处理,是比较可行的PDF文件利用方案,对实际工作具有一定的现实意义。
地质图;PDF;MAPGIS;格式;转换
随着PDF格式在地质行业归档中的不断应用推广,地质专业技术人员使用的地质图件电子数据将越来越多地碰到PDF格式。如何有效地利用这些PDF图件电子数据,使之转换成我们习惯的MAPGIS格式进行编辑处理,而不需要耗费大量时间和金钱重新矢量化,将是我们面临的技术难题。从文献检索的情况来看,大多讨论的是如何将现有文档转换为PDF格式,从PDF格式转换为可编辑处理的矢量图件则鲜有文献涉及。由于工作需要,要求将收集到的PDF文档中等高线、水系、地层界线、断层、文字等转换为MAPGIS矢量数据作为编图底图。笔者对PDF格式地形地质图到MAPGIS格式转换方法进行一些探讨,算是抛砖引玉。
PDF作为一种开放的电子文件格式,具有跨平台、高压缩、描述的真实性和完整性、安全性、开放性、多语种性、通用性、易转换性、前瞻性、兼容性、适合屏幕阅览及网络传输、电子批阅、打印输出质量高等优点[1-2]。PDF文件支持 Type1,Truetype,Opentype等多种字体,支持表单技术和递增更新,支持Javascript可编程脚本及多种事件类型和控制、多种标注,尤为重要的是可以内嵌光栅图像、声音、视频、动画、3D对象等多媒体对象,矢量图形采用基于Postscript描述型语言的二维矢量透明模型,支持图层划分等[3]。使用ADOBE公司出品的acrobat软件还能对PDF文档中的相关内容进行编辑处理,Illustrator还能打开PDF的矢量图进行编辑处理。但是,如果转换为PDF前这些内容已经是栅格格式,那么我们是无法在以上软件里进行编辑处理的。
从这些特性看来,PDF格式文档尤其是该格式的地形地质图中包含中大量可编辑的矢量信息,这是转换处理的基础。MAPGIS数据输入接口包括MAPGIS的明码格式数据接口、DXF格式接口、DLG接口、STDF格式、瑞得全站仪格式、MAPINFO格式接口及ARC/INFO接口,不能直接接受PDF格式的文件转换,需要找到一个中间格式。AutoCAD的DXF格式被很多软件广为使用,DXF格式输入接口可以将其转换为MAPGIS的标准数据格式,达到数据共享的目的。因此我们只需要将PDF格式转换为DXF格式即可实现PDF到MAPGIS格式转换的目的。
DXF是Autodesk开发的图形交换格式,以方便AutoCAD不同版本间及其它CAD/CAM/CNC系统之间的CAD图形交换。由于它是最先推出的图形交换格式,逐渐成为了行业的通用标准,大多数GIS软件程序都能读取DXF文件。有许多DXF格式转换研究的相关文献,在网络上也可找到一些转换软件,利用它们可以实现PDF格式到DXF格式的转换,但由于地形地质图的特殊性,哪一种软件才更适合于这种图件的转换?转换中及转换后存在哪些问题?还需要做哪些工作?笔者选择了较为流行的三款软件,对现有PDF格式的某国外地形地质图及某矿区规划图进行转换研究,下面分别介绍。
Adobe Illustrator作为全球最著名的矢量图形软件,以其强大的功能和体贴用户的界面,已经占据了全球矢量编辑软件中的大部分份额。据不完全统计全球有37%的设计师在使用Adobe Illustrator进行艺术设计[4]。尤其基于Adobe公司专利的PostScript技术的运用,其强大的功能和简洁的界面设计风格都是其他同类软件所无法比拟的,目前 Adobe Illustrator己发展到了CS6版本。由于其与PDF格式均为同一公司产品,因而在进行矢量转换时会首先想到它。
Illustrator矢量图形软件提供绘制各种图形所需的工具,可以使我们获得专业性的图形质量效果,它的优势在于处理矢量图形方面,能够非常精确地控制矢量图形的位置、大小,是工业界标准的绘图软件。具有丰富的图表类型和强大的图表功能,增强的画笔效果,增强的混合工具,通过链接调板,可以识别、选择、监视和更新Illustrator画板中的链接到外部文件的图像以及识别被嵌入到Illustrator文件的图像。动作调板可以使任务自动化,类型取样功能,智能参考线等几大特点。
Illustrator打开需要转换的软件后,在“文件”菜单中选择“导出”,在保存类型中选择AutoCAD交换文件,设定相应的保存位置和文件名称,点击“保存”,在弹出的选项页面中设置AutoCAD版本,图稿缩放比例,使用的颜色数目,栅格文件格式,以及是否保留最大可编辑性等,按“确定”即开始转换。
pdf2cad是由荷兰的一家名为Visual Integrity公司开发的一款专门用于转换PDF文件到DXF格式的工具,转换后的DXF可以用于常规的CAD工具中,比如AutoCAD 和Microstation。
pdf2cad界面简单,功能单一,采用向导式操作,每次只能转换一个PDF文档。软件安装后运行,只需添加要转换的PDF文档即可。转换前可以选择是否将文本转换为字符串或是曲线;是否忽略内嵌的光栅图像以减小文件大小;是否忽略文字而只输出矢量图形;是否仿真PDF进行图形叠加裁剪;是否忽略路径以在输出结果中删除矢量图形。用户还可选择输出结果的旋转角度;输出页边的宽度;也可定义只输出指定的矩形框内的图形。也可以选择字库映射表;定义输出的页面大小;设置DXF文件的最小线宽;设定填充对象的处理方法(保留,删除,轮廓线);是否打断虚线和点线线型。设置完成后,点击“next”,确定输出文件的位置与名称,点击“convert”即开始转换为 DXF格式文件。
PDF2DXF是由德国CAD-KAS Kassler计算机软件公司开发的一款用于转换PDF文件到DXF格式的工具。该软件公司自1996年以来,向市场上推出了多款共享软件。PDF2DXF软件推出后相继被多家国外网站评为“编辑选择奖”,“五星”级软件。
PDF2DXF界面相对复杂,有多种语言界面可以选择,但简体中文界面翻译不完全,汉字显示也不全,繁体中文界面稍强但也有许多菜单没有翻译。软件功能更加强大,能够对PDF文档进行各种常见的编辑、选择、查找、移动、镜像、变形、旋转、操作、色彩等等。也提供了更多的用户定义选项,能够根据PDF文档的实际情况最大化地定义适合自己需要的文档。打开PDF文档后即弹出显示与输出窗口,能够显示文档内容,可以设定输出页面,设置字体,文本转换为对象或矢量,使用毫米或英寸单位,是否生成弧段。其3.0版还可以检测图像中的线条并自动识别为矢量图形,但识别效果与原栅格图像的内容有关。设置完成后点击“DXF Export”,选择输出路径及文件名,点击保存即可完成转换。
现有PDF格式的某国外地形地质图(以下称样本一)及某矿区规划图(以下称样本二),进行转换对比研究,下面分别介绍。
样本一是典型的地形地质图,文件大小约12.68 Mb,页面大小为110.4 cm ×67.1 cm,包含有地形等高线、高程点、水系等基本地理要素,地质界线、断层、产状、地质代号、岩性花纹等地质要素,还包含有图框、图例说明、角图、地质年代表、比例尺、方位角等整饰要素(图1)。
样本二文件大小约 2.31 Mb,页面大小为27.7 cm ×41.3 cm,居民地、等高线、高程点、公路、水系等基本地理要素较齐全,其它规划要素则相对简单,另外包含责任签、规划表、图框等整饰要素,且整体图形顺时钟旋转了90°(图2)。
图1 某国外地形地质图(样本一),左为PDF,右为DXFFig.1 Foreign terrain and geologic map
图2 某矿区规划图(样本二),左为PDF,右为DXFFig.2 Plan map of a mining area
使用前述的三种软件分别对两个样本进行了DXF文件格式转换,转换时间均少于2 min,速度较快,转换前后图面显示变化较小(图1,图2),对于输出、显示等均无多大影响,但部分文字在DXF中为多段线,难以编辑修改。转换后的DXF文件特性列表如表1。
从转换结果来看,等高线、水系、地层界线、断层、文字等基本都能够转换出来,总体转换效果令人满意。但转换结果受原始文档的影响较大,特别是PDF中嵌入的光栅图像,无法转换为矢量。为了验证转换后矢量线坐标的准确性,我们选择了样本一中某条封闭等高线,对三种软件转换的DXF分别查看坐标点数,均为853个点,说明转换结果均未丢失坐标信息。
综合分析DXF转换结果,笔者认为使用pdf2cad软件进行转换是理想的选择,不仅转换结果数据量小,且能够保证文字的字符串特性,最大限度地保证后期的可编辑修改性。当然,转换结果中包含了其它不需要的内容,需要在后面的编辑处理中删除。
表1 转换后DXF文件特征Table 1 Characteristics of DXF file after conversion
DXF文件到MAPGIS格式的转换比较简单,在文件转换系统中进行。步骤为“输入”—“装入DXF”—选择需转换的DXF文件—选择不转出的图层—复位窗口即可看到转换后的结果文件—另存文件,用MAPGIS文件格式保存—在编辑子系统打开转换后的文件可看到是否转换满意。如果确定了子图的对应,在转换DXF文件前不要对原图的块作爆破处理;转换前对原图中的样条曲线,要作爆破或转换为多段线处理;对含有圆弧的多段线,也应作爆破处理,否则转换后会与原始数据结果有偏差。DXF中的块、形、图层、颜色,也可与MAPGIS的子图、线型、图层、颜色对应。由于此方面的文章较多,在此不再赘述。
需要强调的是,由于转换后页面大小与原始文档有差异,我们最终需要在MAPGIS中生成标准图框,利用原文档中的图框进行比例缩放并校正,才能保证最终成图的精度。
通过三种不同软件的转换效果对比实践,以DXF格式为桥梁,将PDF格式地形地质图转换为MAPGIS格式,用于地质技术人员日常编图工作中,能够大大节约矢量化等高线的时间,是一种行之有效的方法。需要说明的是,这种转换并不完全可行,尤其是当PDF文件内嵌的等高线内容为栅格图像时。目前有一些光栅矢量化软件,可以直接将图片转换成DXF,但转换质量取决于原图质量和计算机能力,但转换效果一般都不是很好。随着科学技术的发展,相信有朝一日,人们能够象如今文字扫描识别一样,能够自动识别扫描地形地质图。
[1] 田学军.PDF文件格式及其转化方法探讨[J].荆门职业技术学院学报,2005,20(3):30 -32.
[2] 田海月.PDF文件格式研究[J].中国高新技术企业,2009(6):27-28.
[3] 熊雨前,徐红轮.PDF技术及应用[J].数字与缩微影像,2011(1):37-40.
[4] 王小敏.如何使用Illustrator软件中的钢笔工具[J].电脑知识与技术,2012,8(7):1557 -1559.
(责任编辑:陈文宝)
Discussion on Transformation PDF Format of Terrain and Geological Map into MAPGIS Format
CHEN Aiming,FAN Xudong,ZHAO Yijun
(Hubei Geological Survey,Wuhan,Hubei430034)
By discussing the PDF file properties,the authors propose transformation approach from PDF format to MAPGIS format,introduce three different PDF conversion software of vector graphics,briefly outline option setting and conversion process.The authors believe transformation of PDF vector graphs into DXF format,and then introduction DXF into MAPGIS are feasible utilization plan of PDF file.It is of certain significance to actual work.
geological map;PDF;MAPGIS;format;conversion
P285.1;P208
B
1671-1211(2013)06-0821-04
2012-10-16;改回日期:2012-11-23
陈爱明 (1971-),男,高级工程师,硕士,地质学专业,从事信息化与遥感地质工作。E-mail:mailcam@163.com