字库在文书检验中应用

2010-09-23 09:35喻彦林王宇嵘
湖南警察学院学报 2010年6期
关键词:字库宋体印章

徐 晗,喻彦林,王宇嵘

(西南政法大学刑事侦查学院,重庆 400031)

字库在文书检验中应用

徐 晗,喻彦林,王宇嵘

(西南政法大学刑事侦查学院,重庆 400031)

机制文书及印章的制作越来越依赖于计算机系统,而其文字形态、细节特征反映了计算机系统的字库种类,间接反映了计算机的操作系统、排版软件等软件环境以及文书制作过程。因此,通过对计算机字库的系统研究,对由文书上反映的字库特征判断其制作过程、制作软件环境具有重要意义,它为文书检验提供一种新的视角以及方法手段。

字库;文书检验;应用

机制文书及印章印文的检验是文书检验的重要内容。随着计算机技术高速发展,利用计算机进行文字处理得到广泛的应用,如各种现代印刷排版系统、计算机文字处理系统、印章制作系统等等。计算机系统进行文字的处理、输出时,根据文字的编码,调取指定字库中对应编码的字形信息,生成最终的输出图像。字库特征受知识产权的保护,不同字库中的相同单字字形特征存在或多或少的差异,并最终反映到制作出来的文书上。由于字库技术与计算机操作系统、文字处理以及印章制作软件版本、甚至打印机具的型号相关,因此,对机制文书以及印章印文中文字的归属字库的检验对认定文书的制作软硬件环境具有重要意义。

一、计算机字库概述

计算机所显示和输出的文字来源于其操作系统所安装的字库。计算机字库是文字的字体以及相应的字符符号的集合[1],它定义了文字输出的大小、分辨率等等,决定了字体形状[2]。

(一)字库种类

计算机字库根据演变的历程、使用的字形描述技术、显示效果可以分为点阵字库、轮廓矢量字库以及曲线字库[2]。

点阵字库是以点的虚实来显示每一个文字,根据其显示的精细程度有16*16、24*24直到96*96以及更大,数字越大显示质量也就越高。点阵字库在早期的显示屏幕、打印设备、排版印刷系统中有着广泛的应用[3]。但由于其显示质量存在局限性以及随着显示质量提高,其占用存储空间也变大,读取速度则变慢,不适用于高质量的显示以及印刷。因此,随着计算机技术的高速发展,点阵字库逐渐失去主流地位,应用范围也越来越小。

轮廓矢量字库主要是以小段直线来描述文字轨迹,其精细程度比点阵字库高但是比曲线字库低[2],由此,其应用范围越来越小,渐渐退出了计算机字库的舞台。

目前,曲线字库是计算机字库的主力军,其制作原理以及显示方式与点阵字库和轮廓矢量字库存在较大的区别,即不是以点的虚实或是小段直线来描述文字,而是以起始和终止坐标、半径、弧度等参数来对一个字的笔画轮廓进行描述,笔画边缘轮廓清晰、平滑,也不受放大倍数的限制和不失真[3],同时曲线字库存储量小、输出质量高。根据输出的质量以及应用范围不同,主要有三种类型的曲线字库,即 PostScript字库、TrueType格式字库、OpenType 格式字库[2]。

1.PostScript字库是按PostScript页面描述语言语法定义的曲线字库,其被认为是质量最高的字库,主要运用在高质量输出中,如照排机、CTP等设备[2]。

2.TrueType格式字库由微软与苹果公司合作开发,它与PostScript字库相比,在技术处理上,前者采用两次曲线来描述字形轮廓,而后者采用三次,因此前者占用的存储空间较小,但后者对文字的还原质量更高。TrueType字库作为一种标准字库格式兼容于所有流行的文字、图形处理软件,比如“Microsoft Word”文字处理软件,用户可以用它进行文字编辑,也可进行低精度的打印输出[2]。

TrueType格式字库为微软的windows操作系统和苹果的MAC系统的官方字库格式,并预装在操作系统中。目前应用于windows操作系统的中文曲线字库格式主要为TrueType格式的字库,在系统文件下的FONT文件下,后缀为“.TTF”格式。

3.OpenType格式字库为Adobe公司与微软公司于1995年合作开发出来的曲线字库,是在TureType格式字库基础上的扩展,具有较强的兼容性以及丰富的排版特性,成为目前国际上流行的字库格式。微软公司从Windows 2000操作系统开始兼容OpenType字库,其系统自带的西文字库都已升级到了OpenType字体格式[2],笔者相信未来的中文字库也必将升级到这种格式。

(二)汉字字库标准

汉字字库标准主要是指汉字编码标准,我国的汉字字库标准从最早的GB2312-80标准经历了几代的扩充发展到2000年最新的GB18030-2000标准。其中GB2312-80标准为“基本集”于1980年发布,是中文信息处理的国家标准,该标准共收录6763个简体汉字,682个符号。GBK编码兼容GB2312,共收录21,003个简/繁体汉字,883个符号,并提供1,894个造字码位[4],windows95、windows98中的汉字字库就使用的这个编码标准。GB18030-2000标准于2000年3月17日发布,其作为国家强制性标准于2001年正式生效实施,该标准收录了27,484个汉字,总编码空间超过150万个码位,为解决人名、地名用字问题提供了方案,为汉字研究、古籍整理等领域提供了统一的信息平台基础,同时该标准与GB2312标准一脉相承,能够实现新旧更新转换[5]。

(三)windows操作系统中文汉字字库概述

长期以来在计算机操作系统占主导地位的windows系列,其字库兼用点阵字库和曲线字库,在%:windowsfonts中,以“.FON”和“.TTF”为字库文件名后缀,其中,前者为点阵字库,后者为曲线字库。

在1995年,也就是从Microsoft windows 95操作系统开始,微软公司使用中国中易中标电子信息技术有限公司(以下简称中易公司)的汉字字库作为其简体中文版windows系统的汉字字库,其中中易宋体作为其操作系统和其他相关软件的默认汉字字体,此时的中易字库是基于当时的国家标准规定的汉字字型,在此称为中易1995年字库,总共包含两种字体,即宋体和黑体。在此之后的windows98、windows2000/NT、windows XP 以及相关的软件如office系列的默认字体都是使用的中易公司的1995年字库[6]。

2000年,我国颁布了一项新的标准,即GB18030-2000,中易公司在此标准上开发完成了新的版本的字库(5.00版本),在此称为中易2001年字库,该字库相比之前的字库增加了新的汉字,即对支持的字符集进行了大量的扩展,使一些生僻的或是以前老版本中没有的文字能够显示并输出,同时对字型进行了重新的设计[7]。同时,微软在其windows Vista和windows 7操作系统和相应的office 2007软件VP中使用了中易公司新开发的宋、黑、仿宋、楷体四种字体,但是其windows Vista和windows 7系统的默认字体则使用了由微软自己发行的“微软雅黑”字体,这款字体也随着这两款系统的简体中文版同时发布。在2008年5月6日,微软发布了适用于Windows XP的微软雅黑字体版本[8]。

Windows操作系统中的字库都存放在%:windowsfonts下,在安装例如office软件时,其office自带的各种字库将自动安装到该目录下,同时,电脑使用者可以根据自己的需要往该文件夹下安装其他字库文件,让使用者在使用例如Word文字处理软件时可以有更多的字体选择。

二、字库对比分析概述

(一)Microsoft Windows操作系统字库对比

根据对以上各个版本的操作系统中Fonts文件夹的对比查看,可以将windows操作系统以Vista为分界线分为两个时期,即windows 95至windows XP为一个时期,windows Vista与windows 7为另一个时期,其中前者中所使用的是依据GB18030-2000之前的旧标准制作的汉字字库,操作系统默认字体为1995年中易字库的中易宋体,同时还包括同时期的中易黑体,以及长城楷体(GB2312)、仿宋体(GB2312)等;而后者则为依据GB18030-2000标准制作的汉字字库,其中中易宋体、黑体为2001年中易字库,同时也使用了新标准下的中易楷体、仿宋体。但是其默认字体则使用了微软公司自己开发的微软雅黑字体库,这又是一个区别较大的方面。

(二)Microsoft Office文字处理软件字库对比

Word软件为Office系列软件中的文字处理软件,其根据不同的操作系统的发行而同步发行,在计算机文字处理领域占有主导地位,使用较为广泛。笔者以Microsoft Word97到2007这几个版本的软件为对象,并分别将其安装到对应的操作系统以及能够兼容使用的操作系统中。在安装该软件时,其自带的字库自动添加到%:windowsfonts下。之后进行对比查看,其所反映的字库使用情况与操作系统类似。

1.在Windows Vista之前的操作系统下,Word97到Word2003所使用的字库都是基于GB18030-2000之前的旧标准,其常用字库如宋体、黑体、楷体、仿宋体等都与操作系统字库所反映的情况相同。

2.在Microsoft Windows Vista以及技术更为成熟Microsoft Windows 7操作系统下,Microsoft Word2007所使用的字库则为新标准下的字库,其常用字库如宋体、黑体、楷体、仿宋体等都为中易公司2001年字库,其与之前的Microsoft Word系列软件所使用的字库在字符数量和字型上存在了一定的差异,同时也新增了微软雅黑字体库。

(三)不同生产厂家字库对比

Microsoft Word软件在安装的同时也会把其自带的其他生产厂家的字库安装到%:windowsfonts下,使其在进行文字处理时拥有更多的字体选择,同时根据使用者自身的需求也可以自己安装系统能够识别兼容的字体到该字体文件夹下,这就使不同厂家生产的字体进入Microsoft Word软件的文字处理中。

众所周知,字体库的设计制作具有一定的创作性质,各个字库也具有自己的版权,因此,各个厂家的相同字体会存在一定的差异,但这种差异相当细微,因为同是宋体,各个生产厂家都必须按照宋体字本身的特点和规范进行制作,而细微的差异就在于字库中的相应字的节点、曲线、线上的控制点以及每个点的坐标值这些参数不同[1],这就如同手写字迹的书写人各有各的书写习惯,书写人在按照规范书写样式下书写的字迹的起笔与收笔位置、形态,连笔方式、形态笔画间的搭配、比例关系,各部首间的位置排列关系都会存在差异。笔者在此通过专业的字体设计解析软件“FontLab”对不同生产厂商的字库文字进行解析以了解其差异的真正原因。以下为笔者选取不同厂家(厂家名称均以其简称代替)字库的相同字体进行解析得出的图例,其中楷体字为图1,仿宋体字为图2,微软雅黑字以及黑体字为图3,宋体字为图4:

图1

图2

图4

四、字库在文书检验中的应用之初探

通过以上关于字库的简要介绍以及不同字库间的对比分析,可以看到其中的差异在哪些方面,这些差异特点正是文书检验方法应用的切入点,笔者主要从以下方面进行探索。

(一)对文书形成方式的检验应用

在文书司法鉴定中,常常涉及到对于文书的形成方式进行检验鉴定,尤其是机制文书。例如是否伪造证书证件、是否一次打印形成,是否存在添页换页等等。

1.正规渠道发布的证书证件在印刷中会采取各种防伪措施,同时也是专门的印刷器械制作,其制作所使用的排版印刷系统当然会有其自己的字库,如方正兰亭字库等等,因此除了在检验过程中重点检验其印刷用的纸张、油墨、特殊图案、细微的背景底纹外,检验其上印刷文字的字库特征也是一种初步检验方法,具有极高的否定价值,即如果被检证书证件的印刷文字与真实的证书证件上的印刷文字属于不同的字库,那么该证书证件肯定不是真实的,而是伪造形成。

2.在对打印文书的形成方式进行鉴定案件中,常常涉及到单页打印文书是否存在添加打印的内容而非一次打印形成,以及多页打印文书是否存在换页、添页等情况。这类文书的检验方法主要是采取文件编辑格式的对比分析,以及打印机具的特征分析方法。例如字体字形、字间距、行间距、页边距、标点符号等编辑格式,以及打印机具造成的打印痕迹。在字体字形方面,一般来说伪造者肯定是按照原文本制作,做到字体的同一是很容易,但是做到字库的同一却绝非易事,因为纸质上的字迹没有任何字库信息的反映。

例如,同是宋体,不同生产厂家的宋体字库也会存在差异,如果一个是中易宋体,一个是华文宋体或是方正宋体,都会存在差异。因此,在进行这类文书检验时,相同的字体也不能轻易放过其可能存在的差异,从而直接否定了文书为一次打印形成。添页、换页也是如此。

(二)对文书制作时间的检验应用

在文书司法鉴定中,文书形成时间的鉴定也是一个热点难点。首先,其对文书本身的条件要求很苛刻,因为所采取的仪器分析方法对于文书字迹的形成成分有针对性,有些形成成分根据现有的仪器分析原理或者技术水平无法进行形成时间鉴定。其次,对于形成时间的精确程度不可能达到很高,只能确定一个时间段。在此,通过对字库特征信息的分析虽然也面临一些条件限制问题,以及无法做到很精确,但是其在初步检验中所具有的否定性结论价值很高,这不失为一种文书制作时间的检验方法,具有运用的价值。

利用字库特征进行文书形成时间检验,存在一个前提条件问题,即该文书所用的字库具有时间特性,如前文所说的windows Vista系统和windows 7系统的发布时间,其同时使用的字库因此也具有时间特性,如微软雅黑字体库的使用;同时根据新的标准制作的新的字库,若文书中使用了相应的字库,则其发布时间便可作为其时间特性,如中易公司根据新标准制作的新的字库,其也被收录到微软新的操作系统中。另一个方面,通过字库特征进行文书形成时间鉴定,也主要是运用在仪器分析步骤之前的无损检验,同样是具备极高的否定价值,如发现该文书所用字库为微软雅黑字体,而其时间鉴定要求是要鉴定其是否是在2006年的某一时期形成,那么可以直接否定,无需进行仪器分析。

(三)高仿真印文甄别的应用

在印章印文的司法鉴定实践中,高仿真印章印文的检验是一个难点问题,容易出现错误。究其原因,还得从其制作方式入手,目前主流的印章的制作方式为激光刻章机、光敏印章机制章,这比以前的徒手雕刻的精度更高。激光刻章机的工作原理是激光管产生激光及其携带的高温同步作用下,在印章材料上逐行扫描雕刻形成印章的图文。光敏印章机的工作原理是将利用光敏垫的感光性,将文字、图案通过曝光印在光敏垫上[9],再将光敏垫放入相应的章壳内注入标量光敏印油后制成印章。在激光刻章机和光敏刻章机制作印章过程中,二者都需要利用计算机中的印章制作软件设计印稿,并通过印稿中图文的数据信息来控制激光束对印章材料进行雕刻以及调节光敏印章机对光敏印章垫进行曝光,由此在印章材料和光敏垫上形成与印稿图文基本一致的图文[10]。其中,印稿上的文字都需要运用计算机中的印章雕刻软件进行设计或处理,其对字库的运用也与Microsoft Word等文字排版软件相似,因而刻出的印章上之文字必然反映出印章雕刻软件的字库特征,从而为检验人员运用字库特征对印章印文进行检验提供了依据。

对于制作高仿真印章的伪造人来说,其也应采取与其相同的制作方式进行伪造,因此,在制作印文印稿时会出现使用的印章雕刻软件不同而使字库不同,或者在使用相同的印章雕刻软件时使用了不同字库生产厂家的相同字体而造成字库不同。从印文的字库特征入手可以作为高仿真印章印文检验的一个视角,寻找到的不同字库特征继而可以作为甄别高仿真印章印文的确定性依据。

五、结语

字体字库是机制文书以及印章印文的重要信息,同时又是制作方式、制作软件环境的反映,为追踪机制文书以及印章印文的制作过程提供了新的线索。在文书检验过程中,通过对文书制作过程及原理的清晰认识,能够透过被检文书材料的外在特征反映而抓住其本质特性形成的真正原因,从而为检验过程中所做出的推理提供依据,对提高检验过程的科学性以及保证检验结论的正确性具有重要意义。因此,本文对计算机字库进行探索,并将字库分析引入文书检验方法中来,以作为文书检验中的一种视角以及方法手段。

[1]蒋玉宏,贾无志.计算机字库的著作权保护及侵权判定[J].电子知识产权,2008,(9).

[2]孙帮勇,周世生.谈谈当前流行的字库[J].印刷世界,2008,(2).

[3]殷笑秋.电脑汉字字体赏析与应用[M].上海:华东理工大学出版社,2001.12-25.

[4]信息交换用汉字编码字符集[EB/OL].百度百科,(2009-12-30).[2010-04-13].http://bai-ke.baidu.com/view/25492.htm.

[5]GB18030[EB/OL].百度百科,(2010-03-24).[2010-04-10].http://baike.baidu.com/view/889058.html.

[6]中易宋体[EB/OL].维基百科,(2010-02-26).[2010-04-03].http://zh.wikipedia.org/wiki/%E4%B8%AD%E6%98%93%E5%AE%8B%E4%BD%93.

[7]字体门[EB/OL].百度百科,(2009-11-17).[2010-04-10].http://baike.baidu.com/view/2997688.htm.

[8]微软雅黑[EB/OL].维基百科,(2010-03-29).[2010-04-03].http://zh.wikipedia.org/zh-cn/%E5%BE%AE%E8%BD%AF%E9%9B%85%E9%BB%91.

[9]殷军华.激光刻章机与光敏印章机的3点区别 [EB/OL].(2008-12-01).[2009-05-01]ht-tp://www.lcgyjg.com/news/newsshow_138.html.

[10]贾智辉.利用激光刻章机雕刻、光敏印章机制印伪造印章印文的鉴定[J].中国司法鉴定,2009,(5).

Abstract:The making of documents and seals by machines becomes more and more dependent on computer system.The character form and detailed features reflect the types of word stock of computer system and indirectly reflect such software environment as operating system and typesetting software as well as the making process of documents.Therefore,systematic study of computer word stock is of great meaning for judging the making process of documents based on the characteristics of word stock reflected in them,and has offered a new visual angle and means of testing documents.

Key words:word stock;test of documents;application

(责任编辑:王道春)

The Application of Word Stock in the Test of Documents

XU Han,YU Yan-lin,WANG Yu-rong

(Southwest University of Political Science and Law,Chongqing,401120)

G201

A

1008-7575(2010)06-0110-04

2010-10-16

徐晗(1986- ),男,四川通江人,西南政法大学刑事侦查学院硕士研究生,研究方向为物证技术学;喻彦林(1980- ),男,河南周口人,西南政法大学刑事侦查学院博士研究生,讲师,研究方向为物证技术学;王宇嵘(1986- ),男,浙江东阳人,西南政法大学刑事侦查学院硕士研究生,研究方向为物证技术学。

猜你喜欢
字库宋体印章
我们有印章咯
No.2 喜茶联合汉仪字库推出微型书和书签
论计算机字库单字的著作权保护
——以方正诉宝洁案为例
自制橡皮印章
印章
老家的惜字库
大象的印章
再议字库知识产权保护
福布斯中国大陆50富豪排行榜
武汉迅通集邮收藏品有限公司——售品目录