文 / 沈水荣 人民出版社
随着信息技术革命的深入发展,人类进入了一个知识爆炸的时代,知识加速增长积累与人的阅读学习能力有限之间的矛盾日显突出,知识资源的低效率使用和浪费日趋严重。于是,人们采用以信息化为代表的现代科技手段,对知识信息进行大规模地加工处理,生产出一系列更加便于人们阅读学习的数字化、网络化产品,大幅度提高知识信息的使用价值。由此正在带来一个新型产业的兴起,这就是现代知识资源开发产业。
自从人类发明文字,形成了知识积累,就有了开发利用知识资源的现象。但知识资源开发的规模和深度,依赖于承载和利用知识的物质技术条件的发展。随着物质技术的条件逐步改进,人类知识积累越来越丰富,人的阅读学习越来越需要借助外部物质条件而进行,也就越来越有必要把知识作为一种资源进行开发利用。如,我国古代就有文献编目、图书编纂;近现代出版中有“编、印、发”;图书馆有“采、编、典、借”,等等,这些都是由于知识积累到一定程度,为了帮助人们更加方便地阅读使用知识所进行的工作、形成的行业,都有知识资源开发的性质。但以往时代由于知识资源开发的规模和深度也很有限,人们没有提出“知识资源开发”这个概念。
随着信息化时代的到来,与计算机技术相伴随,人类用于承载和利用知识的物质技术条件又一次产生了革命性演变,知识信息的储存、处理、传播、应用等大大突破了时间、空间的限制,其效率无数倍地大幅提高,从而使知识总量开始以不可思议的几何级数增长和积累,知识资源的大规模深度开发成为必然。据联合国教科文组织对全世界4000本杂志研究发现:十九世纪,每隔50年知识更新一次;到了第二次世界大战的时候,知识更新的周期缩短到15年;上世纪九十年代以后则缩短到3到4年。出版物是知识增长的一个重要标志。我国出版图书总量1990年约8万种,2012年达到约40万种,22年间增长了5倍。与上述关于知识增长速度的预测基本吻合。
这些数据和预测表明,人类已经淹没在自己创造的知识海洋中。尴尬的是,人的阅读能力却极为有限。于是,这些人类文明的精华,要么被束之高阁、落满岁月的尘埃,要么大量堆积在库房内,最终销毁。近年来,人民出版社为承建国家重大项目“中国共产党思想理论资源数据库”,从国家版本图书馆等有关方面,对确定范围内的党政类图书进行调查,发现建国以来出版的此类图书大约100万册,但长期以来,这些图书资源存在着“低效率”使用的问题。据抽样调查,这100万种书中,目前一般书店和网站上比较容易买到的实体书只有约1‰,也就是还有999‰被尘封在仓库里,有不少已经被打成了纸浆,许多出版不到10年的图书已经寻无下落。
可见,知识,已经如同深藏地下的石油、天然气一样,成为一种需要大力开采、开发,才能发挥效用的宝贵资源。
历史上每一次信息技术的革命,都使得人类大大拓展了知识加工、传播和利用广度和深度。“语言”的产生,带来了人类声音信息的语义化、规范化,使得人类的经验、知识可以面对面地相互交流,共同享用。“文字”的产生使人类的语言向符号化、标准化、存储化、通用化方向发展,使知识可以超越时空的限制而传递和利用。“纸”的发明,使人们有了方便记录文字、图像等知识信息的载体,使得知识加工整理、传播和利用的数量、质量大幅度提高。“印刷术”发明后,文字、图像的等知识信息大量复制、存储、传递成为可能,知识在全世界范围内实现了更为广泛地传播和利用。
现代以信息技术为代表的新技术革命,为知识资源开发利用准备好了一切物质技术条件。计算机技术使文字、图像、声音等知识信息数码化、虚拟化,它与现代通讯技术、传感技术、复印技术、机读技术、缩微技术、声像技术、新材料技术等相结合,使知识加工、传播、使用在更广泛、更深入的程度上得到迅速发展。
2.1 信息储存海量化。储存器从磁盘、光盘,发展到闪速存储器、固态硬盘等,目前容量最大的硬盘已经能达到1000—2000gb的容量。在可以预见的未来,纳米储存、磁盘冗余阵列技术、云储存技术、DNA硬盘等更高数量级储存技术将逐步走向市场。DNA硬盘 1克存储量将等于300万张CD。
2.2 信息处理自动化。可以借助相关技术,将计算机、复印机、打字机、终端机、缩微机、声象设备、光电、电磁、自动控制设备、印刷装订设备、编辑翻译设备,用光纤、电缆、卫星、微波、电子线路连接起来,实现信息的自动记录、整理、存贮、交流和利用。可以进行分类自动化、主题标引自动化、信息编码自动化、信息著录自动化等。
2.3 信息传递瞬间化。无线互联网、有线互联网、卫星通信,以及即时通讯软件、数字传输、数字电视等手段,使知识信息在地球任何地点之间、地球与太空之间传递的距离概念几乎不复存在。即使是超大容量数据传播、高分辨率音视频和图片文件传输也越来越十分便捷,甚至人类在遥远的太空可以为地球上的几亿人同时授课,进行互动交流。
2.4 信息展现融合化。信息化声像技术、模拟语音技术、三维动画技术、物联网技术等,可以把同一主题的文字与图像、声音、视频、动画以及直接来自自然源头的信息有机融合起来,创作成一部作品,在同一终端同一屏幕展现给读者。这是一种更加客观真实、生动具体,全方位、多角度地反映和揭示事物的方式。几千年前,人类把对客观世界的认知抽象成文字进行交流;现今,多种形式信息的融合化展现,又将使人类回归到对客观世界直接认知的状态中去,这是一种人类认识世界方式的螺旋式上升。
2.5 信息保护永久化。随着缩微技术的发展,以及DNA储存等技术成果的诞生,并逐步投入应用,电子数据难以长久保存的问题也有望迎刃而解。信息化缩微技术可以将数据保存几百年。英国一个研究小组研发的“DNA硬盘”,有可能使文件保存时长达数千年,比纸质书保存的时间还要长。这样,信息化手段无论对于知识信息的加工、处理、传递、利用,还是保存,都有可能达到十分完美的程度,为现代知识的开发利用提供了前所未有的巨大空间。
信息技术条件下知识资源开发围绕实现知识资源的深度加工、高效利用,在国内外产业实践中形成了以下一些方面的基本形式:
3.1 知识存在规模化开发。传统技术条件下,一柜之中只能架起几百本书,一囊之内只能装载几十本书,一桌之上只能展开几本书,一掌之中只能翻阅一本书,读书只能一本一本地读。作品的分散存放、传播和使用,导致了原本应该紧密联系的知识之间相互隔离,影响了知识的使用效率。现代信息化技术条件下,经过规模化开发,方寸之间可以同时承载和传播几万、几十万甚至更多的作品,读者可以把成千上万本书捆绑到一起,作为一本书来读。不同作品之中知识的关联性大大增强,知识传播和使用效益大大提高。作品资源规模化开发的主要工作,就是通过解决著作权、寻找相关版本等工作,大量收集各种介质的作品,进行统一格式和标准的数字化并建成资源库,使其形成一定的规模。规模化不宜追求兼收并蓄、通吃天下(实际也做不到),而应当突出重点,按照一定的主题、知识体系、质量标准,比较系统完整而有代表性地将相关作品收集入库。如人民出版社围绕党的两大理论成果以及反映“重大理论创新、重大历史事件、重大战略举措、重要历史人物”的线索,系统完整地将优秀作品和有代表性作品收集入库,使数据库覆盖了党的思想理论领域所有主要著作文献和知识点。
3.2 知识表现融合化开发。纸质出版条件下,知识在一个作品中只能以比较单一的文字或图像等形式表现出来,人们对知识的接受和理解受到极大的限制。知识表现融合化开发,就是采用多媒体技术,把图书、文章、图片、音视频、动画以及来自自然源头的知识信息融合起来展现,帮助读者全方位、多角度感知和了解世界。一部融合化作品的开发是一个复杂的创作过程,需要确定主题,整体构思,撰写脚本,采集、筛选、剪裁素材,开发软件,标引知识单元,等等,把多种知识表现形式的单元链接起来,制作成一个数字化阅读产品。目前一些厂家已经生产出这样的融合式电子书产品,这些产品通过方寸之间的轻松点击,可以感知多种形式的知识信息,达到更好认知世界、掌握知识的效果。人民出版社计划开发一套名为“中国共产党思想理论库书”的融合式产品,将毛泽东、邓小平、江泽民、胡锦涛同志主要著作中的主要知识点(预计共13万个)与相关的其他图书、文章、录像、图片、歌曲等作品相链接,使这些重要著作成为整个理论数据库多媒体展现的中心平台。
3.3 知识授受微距化开发。知识的传授和接受之间存在空间距离和时间距离。传统纸质出版条件下,一个作品编辑完成后,需要通过排版、印刷、仓储、运输、门店等环节,到达读者手中,这中间存在漫长时空距离。而在现代信息化条件下,一个作品完成后,一点鼠标即可从授者的桌面到达受者的桌面,几乎消灭了知识传递的时间距离和空间距离。这种变革对于提高知识使用效率的作用和意义是无可估量的。知识授受微距化开发的主要工作,首先,要建设适合知识信息传递的信息化通道,当前特别要注重建立起能够瞬间传递大容量、高清化、实时化信息的通道;其次,要开发阅读软件,这些软件既要能够有效地防止盗版,又要能够满足各种格式、标准文字信息的展现阅读,还能够用于融合式产品的阅读使用。第三,要加强数据建设,通过数码化加工,使所有知识信息以数字代码的形态存在,并且具有多种标准和格式,能够适用于各种硬件和软件条件下的传播。第四,要加强标准建设,在数字化、网络化等知识传播领域形成全国统一,并与国际接轨的标准,使知识信息在传递过程中畅通无阻。
3.4 知识发现瞬间化开发。知识的检索发现,历来是人们为提高知识应用效率着力研究解决的一个重要问题。传统纸质书条件下,人们检索发现一个知识点,几乎都需要依照“相关图书馆(资料室)→相关图书类型→相关图书→相关章节”这样一个秩序费力寻找。该过程不仅缓慢,而且其终点一般只能是“章节”。经过信息化技术开发的知识资源,一个小小检索框加关键词,就可以省去纸质出版条件下的一切检索过程,而且使检索的对象从章节检索发展到以语句为单位的知识点检索。这是文献检索史上的一个飞跃。知识发现瞬间化开发要做的工作,除了依赖于信息化通道,首先,要对知识资源进行高质量的数字化。根据知识资源本身的特点、用途以及相关媒体的技术特点,采用相应的标准、格式对作品资源进行数字化。作品数码化有不同的深度,以一本文字作品为例,人民出版社从6个层面上对图书进行了编码:每个文字编码、每个语段编码、每个章节编码、每页作品编码、每件作品编码、每个作品体系编码。作品数码化开发越深,知识资源的用途就越大。其次,对数字化的作品资源进行结构化加工。按一定的逻辑结构,特别是按学科体系、用户需求和使用习惯,在数据库中对作品资源进行有序存放和展现。同样的知识信息排列结构不同,形成的产品也不同;结构化程度越高,越能实现知识元素相互之间的关联,越有利于实现阅读求知方式的智能化。知识资源结构化与非结构化相比,其使用价值可以以几何级数增长。人民出版社对近20000本党政类图书的电子数据,按照逻辑体系、发展历程、知识点关联三种方式进行分类排序,展现出整个理论体系的内在有机联系,每一部作品都不仅仅是一个独立的个体,而是被放到完整的理论体系中来展现和传播。第三,碎片化加工。采用现代标引技术以及词库开发技术等,把作品加工成以段落、句子等为单位存在的元素,并通过相应的软件,使读者可以快捷方便地检索使用。碎片化难在语义化,即使检索出来的文字碎片具有一定的含义或主题。近年来,人民出版社在承建“中国共产党思想理论资源数据库”的过程中开创了机器标引加入适当人工的办法,研发成功了“人民金典语义查询系统”,把党的思想理论文献加工成近亿个可供准确查询的知识点,使文字检索的语义准确率达到了70—95%准确率。
3.5 知识学习互动化开发。也就是使承载知识的网络化产品带有读者之间互动交流功能。传统纸质书是一个承载知识的独立产品,其本身不存在与人交流的功能。现代信息技术条件下,可以通过开发,使网络化阅读软件上附带相应通信功能,人们可以用于向特定或广大的其他读者推送自己的认识和见解,与对方进行交流,相互学习提高。知识学习互动化开发,除了需要利用良好的通信条件,还需要通过挖掘用户的需求,对作品资源进行特定加工,开发出相应的互动软件。■