电子书格式标准化问题刍论

2011-04-13 09:47
河南图书馆学刊 2011年6期
关键词:电子图书阅读器电子书

李 云

(新乡学院图书馆,河南 新乡 453003)

1 互不兼容的电子书格式

据不完全统计,目前电子书的格式有近30种。比如 ,EXE、PDF、CHM、BRM、PDB、TXT、UMD、JAR 等 。在国外比较知名的电子书格式有索尼公司Reader的专有格式BBeb、亚马逊公司Kindle的专有格式AZM、微软公司的HLP格式、CHM格式和Adobe公司中的PDF格式等。虽然部分电子书可以兼容其他一些格式,但是通常都需要相关软件的转换。当然,国外也有诸如EPUB这样的开放格式标准。EPUB格式由亚马逊公司、Adobe公司、美国图书馆协会、兰登书屋、索尼公司等联合开发。然而,迄今为止,EPUB格式还未被业界完全接受。

在国内,电子书格式同样呈现出“群雄割据”的状态。比如,清华同方公司的CAJ格式、北大方正公司的CEB、XEB格式、华康公司的WDL格式、维普公司的VIP格式、超星公司的PDG格式、上海通力公司的ABM、BOK格式,以及国家图书馆的NLC格式等。此外,书生公司、博库公司等也有自己的电子书格式。

电子书格式不统一带来的问题是:其一,使用的不便利性。比如,如果读者从网上购买了微软公司MSReader格式的电子书,就需要同时下载并安装相应的软件。又比如在国内,超星公司的电子书只能用SSReader来阅读。即使是同一家公司的电子书产品,也存在类似的问题。比如,方正公司电子书的格式是CEB,需要Apabireader软件阅读,方正自己生产的手持阅读器也不能下载其本公司的电子书。其二,增加了阅读成本。由于电子书格式不兼容,读者在阅读不同公司生产的电子书时,就需要购买不同的电子书阅读器或者付费下载不同的软件。其三,造成资源的浪费。格式不统一,使得电子书生产商每年都要投入资金用于其本身电子书格式的维护,出版社同样要按照各个电子书生产商的电子书格式制作不同的电子书,这都提高了生产代价。其四,信息的传播受阻。电子书格式的不兼容,制约了其内容的广泛共享。其五,版权管理的弱化。由于没有统一的格式标准,使得对电子书版权的监管形同虚设,这也是当前电子书存在严重侵权问题的原因之一。其六,不利于共赢发展。由于各个电子书生产商都坚持自己的电子书格式,使得各自的市场规模都难以得到拓展。比如,亚马逊公司试图将Kindle的专有格式AZM打造成行业标准,但是却在很大程度上受到了EPUB格式的挤压。其七,影响后续服务。比如,许多电子书的数据与图书馆的书目MARC格式不兼容,不利于图书馆对电子书服务工作的开展。

2 国外电子书格式标准化的部分进展

20世纪90年代,泛欧书业、美国出版商协会就在书刊电子贸易中推广技术标准,比如EDI、ONIX等。进入21世纪,部分国家层面的标准得以颁布。比如,美国的《数据词典——数字静态图像的技术元数据》、《数字对象标识结构》等。OEBF(Open eBook Forum)和 EBX (The Electronic Book Exchange)Working Group是目前国际上制定电子书标准的两个主要组织。OEBF成立于1998年,又称“开放电子书论坛”,目标是研发非专利性的电子书系统格式,OEBF系列标准规定了eBook的文件格式与结构,保证了电子书文档可正确显示在任何阅读系统中。OEBF在1999年发布了基于HTML与XML的OEB1.0标准,该标准结合 XML1.0标准、HTML4.0标准、Dublin Core和USMARC描述语言与unicode字符集的一些标准,为阅读器厂商、出版商、作者和用户提供了初步的指南。2001年7月,OEBF发布了OEBF1.01标准,对旧版本中的模糊和错误的概念作了纠正。

2005年后,OEBF更名为 “国际数字出版论坛”(International Digital Publishing Forum,IDPF)。IDPF已经发布了三项标准,即开放容器格式1.0版(Open Container Format V1.0,OCFV1.0)、 开放出版物结构(Open Publication Structure,OPS)2.0 版和开放包裹格式(Open Packaging Format,OPF)2.0 版。这三项标准共称为EPUB标准,其主要内容是:OPS2.0提供开放式电子书内容的标准,保障电子书跨平台阅读;OPF2.0提供描述电子书内容单元的标准,提供更多结构和语义来描述电子出版物,主要同元数据、文件清单、主线、指南与漫游组成,存放在OPS文件中;OCFV1.0将电子书所有相关的OPS文件、OPF文件按规范要求放入容器中,建成一个后缀名为.epub的压缩文件。作为一个开放格式,EUBP具有良好的兼容性,可以自动对内容重新编排。同时,EUBP允许电子书生产商将其电子书格式转换成其他格式,并支持数字版权管理(DRM)。目前,EPUB格式有了许多成功运用的案例。比如,亚马逊公司的下属子公司Lexcycle开发的阅读软件Stanza,Adobe公司发布的Adobe Digital Editions(ADE)等。除软件外,国外支持 EPUB的阅读器逐步增多。比如,艾利和公司的iriver story、巴诺公司的Nook、罗技公司的Plastic Logic等。

2002年,美国出版协会AAP(Association of American Publishers)颁布了“开放式电子图书标准方案”(Open eBook standard project), 方案中强调了数字对象标识码 (DIO)、ISBN以及从现有数字对象创建电子书的作用。此外,EBX Working Group在2000年7月发布了0.8版标准,提出了电子书从出版、发行、销售到使用全过程中版权保护的技术方案。

在美国之外,其他许多国家同样在推动电子书格式的标准化工作。比如在韩国,使用最多的电子书格式是Adobe公司的PDF格式。但是由于PDF格式一经制作就不能修改,不容易扩展,而且PDF是Adobe公司的专有格式,因此韩国将基于XML的EBKS(KSX6100)电子书格式确定为国家标准。该格式具有公开性、兼容性与可扩展性,能够对文件进行结构调整。但是,该标准仍然是一个比较宽泛的格式规范,还不能完全解决电子书格式兼容的问题。

3 对我国电子书格式标准化的思考

1998年起我国在国家质量技术监督局、全国信息技术标准化研究所等部门主持下开始了电子书标准的制定工作。2001年9月,北京大学计算机技术研究所与方正公司联合承担了国家“863”计划“多媒体数据的版权保护技术”课题研究。2002年,《开放式电子图书出版物结构》(GB/Z 18906-2002)、《电子图书阅读器通用规范》(GB/T 18787-2002)得以颁布。《开放式电子图书出版物结构》对电子图书的内容进行了描述,用于确保各种格式的电子书可以在不同电子书平台上读取。《电子图书阅读器通用规范》规定了电子阅读器的技术要求、试验方法、检验规则等,适用于各种类型的电子阅读器和便携式阅读设备。然而,目前这些标准已经不能适应电子书发展的需要。

2005年5月,电子书产业系统认证标准 “NKWOLF”颁布。2007年底新闻出版总署启动了《数字资源唯一标识符(DOI)预研》项目。同年,信息产业部对《非结构化操作置标语言》(UOML)项目立项,该标准建立了一个抽象出版物格式模型,使数字内容的存储不受格式的影响。2008年10月,该标准成为国际产业联盟组织(OASIS)的官方标准,并于2009年得到国际标准化组织(ISO)的立项。

2010年3月5日,全国信息技术标准化委员会发布通知,成立“电子书标准工作组”,重点推动相关基础标准以及内容质量、版式规范、管理服务、版权保护等方面的标准制定工作。随后,电子书标准的基础组、设备组、格式组、平台组、电子课本组等专业领域的工作小组得以成立。2010年12月13日,国家标准化管理委员会正式下达国家标准化公益科研项目《电子书标准体系研究》和电子书设备规范、格式规范、标识、元数据等四项国家标准制、修订项目。据悉,我国电子书项目的核心标准,将在一年之内完成。

我国电子书格式标准正在努力向国际先进标准靠拢。比如,方正Apabi的CEBX格式就是以OEBF格式标准为依据,能够保留原文件的字符、字体、版式与色彩等信息,比PDF格式具有更强的数据交换与解析能力。又比如,国内著名的电子书网站掌上书苑以EPUB格式为基础,推出了EPUB Reader阅读软件。在硬件方面,支持EPUB格式的阅读器有翰林公司的eReader、联想公司的天玑iBook等。

电子书格式标准化是电子书产业发展的现实要求。鉴于出版商参与电子书出版的热情不高,而电子书生产商又力求将自己的封闭的格式标准转化为行业标准,甚至是国家标准的状况,我国电子书格式标准化建设应采取政府引导,电子书产业链上各主体为主导的推进模式。一方面发挥政府在电子书标准建设中的组织能力、控制功能、权威发布的作用,另一方面发挥产业链上各主体在资金、技术等方面的优势。特别是对电子书产业链中各主体的地位不可忽视,因为这些主体既是标准的执行者,又是标准的体验者,他们的意见不仅来自于对国际先进做法的准确把握,还来源于脚踏实地的实践经验。

电子书格式标准化建设要处理好引进和自力更生的关系。一方面,在电子书发展中应积极引进、借鉴、消化国际标准,力求同国际标准接轨。但是,参与国际标准化首先是有门槛的,加入相关组织需要交纳不菲的会员费和专利费,我国大多数生产商未必能承担得起。其次,国外的技术与标准未必能完全满足我国中文电子书出版的需求,中文电子书无论从信息符号、编排规范,还是从流通渠道、读者的阅读习惯等方面,跟国外电子书都很不一样。因此,要协调好引进和自建的关系,立足国内,放眼国际,创建出既有国际竞争力,又适合国情的电子书标准。

统一电子书格式标准要注重协调各方面的利益关系。比如,清华同方公司就认为,如果建立一套新的电子书标准,将意味着其在电子书格式开发上的巨额投资无法收回,而且将面临新的投资。又比如,方正Apabi依靠自己强大的技术力量研发了较为完整的电子书格式标准,也不愿放弃这些已有的成果。标准是整条产业链的问题,标准是产业链条上各方主体利益协调与平衡的结果。任何电子书生产商试图垄断格式标准或者阻碍标准统一的做法都不仅损害产业链上其他主体的利益,而且最终会损害自身的利益。2003年,曾与微软、Adobe并称“电子书三巨头”的Gemstar公司,终因受其电子书格式封闭之累,黯然退出市场。对照之下,我国辽宁出版集团的“掌上书苑”采用国际通用的OEB标准,能阅读XML、HTML、TXT等多种格式的电子书,从而把握住了发展的空间。可以讲,标准化建设的核心问题是在如何选择适宜的路径来达到格式兼容这个目的的过程中协调与平衡各主体的利益关系。

还应该认识到,电子书格式的标准化、统一化不是唯一化,标准化、统一化的目的是兼容化。不同的电子书格式有其不同的特点与功能,带来不同的阅读体验,强求使用某种,或者某几种格式标准是不符合实际的。比如,PDF格式页面美观、图像清晰,而EXE、TXT、HTM格式则制作简单,对阅读软件要求不高,适合于自助阅读与手机阅读,另外有许多电子书格式更适合于公式、图表、多媒体文件的处理。所以,标准化的着眼点是格式之间的兼容,或者提供易于不同格式转换的平台,使读者通过不同生产商的电子阅读器或软件可以阅读多种格式的电子书。

[1]臧国全.网络出版的有关标准研究[J].图书情报工作,2003(1):105-110.

[2]路云强.呼唤我国电子图书统一标准[J].科技文献管理,2009(4):35-42.

[3]郑滢瑜,丛挺,缪婕.电子书格式标准研究[J].出版科学,2010(4):90-93.

[4]张书卿.数字出版物格式标准化之路有多长[J].出版参考,2008(9):11.

[5]张海涛,赵准胜.电子图书的发展趋势[J].情报科学,2001(11):1220-1222.

猜你喜欢
电子图书阅读器电子书
基于反向权重的阅读器防碰撞算法
The Magna Carta
一种高效的RFID系统冗余阅读器消除算法
打造自己的电子书架
出版社纸质图书与电子图书出版的价值链比较
一种RFID网络系统中消除冗余阅读器的高效算法
基于电子书包的学习分析探究
电子书 等
PDF格式电子书的制作
电子书是否会取代传统图书?