, ,
中医药信息资源建设是我国中医药事业的基础性工作,也是中医药科技创新体系中不可缺少的重要组成部分。
随着计算机、现代通讯技术和生物医学信息技术等的飞速发展,中医药信息资源数字化已经成为中医药事业发展的必然趋势。本文在介绍我国中医药信息资源数字化建设取得成就及存在问题的基础上,提出了下一步的发展对策和建议。
我国中医药信息资源数字化建设始于20世纪80年代[1],经过几十年的发展,已经取得了不小成就,同时也存在不少问题。
1.1.1 以数据库为主体的数字化资源类型多样
中医药信息资源数字化产品包括数据库、知识库、电子期刊、电子图书、网站等,而数据库是目前中医药信息资源数字化建设的主体。
首先,建成数据库数量可观。我国的中医药信息资源非常丰富,根据上海辞书出版社出版的《中国中医古籍总目》,我国共有中医图书13 000余种,其中产生于1911年以前的中医古籍共8 927种[2]。
范为宇、崔蒙、陈守鹏等参照相关标准,将我国中医药资源分为5个一级类目(主题域)、40个二级类目(主类)、143个三级类目(亚类),5个一级类目为:中医药事业、中医、中药、针灸、古籍[3]。中国大陆地区的代表性中药主题数据库见表1。
根据笔者的网络调研,目前我国有37家中医药高等院校图书馆或图文信息中心已将或者正在将自身中医药信息资源进行数字化,如本校学位论文数据库、教师论文数据库、馆藏目录数据库。不少院校建设了特色数据库,如广西中医药大学的壮医壮药数据库、江西中医药大学的江西省道地药材数据库、福建中医药大学的闽港澳台中草药图谱数据库、云南中医学院的云南地产中草药(民族药)数据库及云南少数民族医药单验方数据库等。
表1 中药主题数据库
另一方面,建成了多个具有代表性的数据库,如中国中医科学院中医药信息研究所的“中国中医药数据库检索系统”(http://cowork.cintcm.com/engine/windex.jsp),该系统包括中医药数据库48个,数据总量达120余万条[4]。大力开发中医药数据库,符合信息资源数字化的大趋势。
1.1.2 资源内容丰富,古籍资源得到有效开发
我国的中医药信息资源是一个巨大的知识宝库,目前数字化建设涵盖了古代与现代的中医药信息资源。其中,古籍资源得到了有效开发,已经建成的中医药古籍数字化产品有书目型数据库、全文型数据库、图像型数据库、图文型数据库、古籍知识库[5]。中国中医科学院中医药信息研究所自2002年至今,已建成中医药珍善本古籍多媒体数据库和中医药古籍资源数据库,实现了部分中医古籍的数字化保护与利用[6]。其中,“全国中医药珍善本古籍档案管理系统”、“海外古籍书目数据库”为书目型数据库,“中医药珍善本古籍多媒体数据库”为图文型古籍数据库。
古籍知识库的建设突破了其他数据库仅有的阅读与查询功能,“用户可以进行深层次的知识挖掘,实现由书目到全文等多个知识点的关联检索,也可以由一个作者检索到其他相关作者等”[7],为深层次的知识挖掘开辟了新的道路。中国中医科学院中国医史文献研究所中医古籍数字化研究室的“中医药古文献知识库”是其中的代表。该知识库目前已经建成中医古籍本草知识库、中医古籍方剂知识库,以及张仲景、陈士铎、新安医学、妇科、医案、蒙医药等6个中医古籍专题知识库[5]。中医古籍知识库的开发与应用将促进我国中医药信息资源的开发与运用。
1.1.3 建设队伍扩大,部门合作加强
我国的中医药信息资源数字化建设已经形成了多部门参与、协调合作的建设格局。研发队伍得到了有效扩充。以中医药院校图书馆和研究院所为主,中医医院、商业机构等也都加入了开发的队伍。如中医医院利用自身的临床经验、病历等资源优势,开发了数据仓库和平台。多部门的加入,使中医药信息资源的数字化产品类型更为多样、内容更为丰富。机构之间的交流与合作得到加强,中医药类机构之间合作建设数字化信息资源,如我国已经建立了中医药虚拟研究院[8],在研究内容与项目管理等方面具有极大优势[9]。在虚拟研究院中,组织了全国30余所省级中医药院校和研究院所的数百位中医药专业人员共同建设数据库,并研制了中药科技数据库的技术规范、操作规程及远程管理模式,实现了在线人员监控、数据安全管理、用户权限控制;在虚拟管理控制下,建立了数据加工、初级审校与终审等不同职责管理制度,实现了无障碍远程办公,超越了地域限制,成为直观管理人员与数据的控制台。同时单位之间资源共享,减少了重复开发,目前很多中医药大学的图书馆机构都购买了中国知网、万方医学网等电子期刊,以及读秀、超星等电子图书[10]。
1.2.1 资源开发深度有待提高
中医药信息资源数字化建设在开发的深度上有待提高。具体表现为具有深度挖掘、知识组织等功能的知识库、数据仓库、数据分析平台的建设刚刚起步,仅有中国中医科学院及其下属医院、北京中医药大学及其下属医院等少数机构开发了一些数字化产品,其他机构尚无具有应用意义的产品。从中医药古籍知识库建成的产品来看,具有挖掘功能的仅有以“中医药古文献知识库”为代表的少数几种。万方医学网的“中医药系统”号称“可以从症状、体征和证候检索到其与什么疾病相关,可查到同时包含几味中药、治疗疾病的方剂群,可查到具有某种功效、性味、归经、药理作用的中药,包含有具有君臣佐使、方剂以及配伍等信息的经典方;方剂数据库中含有病症对应关系的经典方与方剂歌诀,整理了方剂中加减中药与症的关系”[11],但该知识系统主要是整合了万方医学网的相关资源,并没有完全达到知识组织的层面。中国知网的“中国医院知识仓库”也存在这方面的问题。
1.2.2 缺少音频、视频类产品
目前的数字化中医药信息资源以文字为主,音频、视频类产品非常少,代表性资源仅有万方的“医学视频数据库”。该数据库虽然解决了权威性、版权纠纷等问题,但视频数量有限且费用较高。单靠看书、阅读难以参透中医药知识,需要辅以口耳相传等方式,学生大部分时间需要自学,视频与音频是自学的重要资源,研发中医药的音频与视频产品可以促进中医药继续教育的发展。
1.2.3 资源的可获取性较低
非公开获取与收费服务削弱了信息的可获取性。目前权威、综合的数字化资源多是收费服务,数字图书馆则除了收费之外,还需要安装特殊的阅读器,这都影响了资源的可获取性。该问题主要有两方面的原因:一是研发这些数字化产品的多为商业机构,收费服务是其生存的必然要求;二是技术标准尚未统一,目前电子期刊基本上采用CAJ或PDF阅读器,电子图书出版商多使用自身的阅读器。数字化产品技术标准的不统一容易导致用户放弃使用。
加强中医药信息资源的深度开发,是中医药信息资源数字化建设的当务之急。今后中医药信息资源的数字化建设应该从中医药文献的分类与汇总转向智能分析。一是整理、评估现有资源。目前各建设机构的资源之间存在孤立的现象,首先要整理自身的资源。在此基础上,对其产品进行相应的质量评估,以确定进一步开发的对象。中医药信息资源的深度开发是一项大工程,各单位由于人力和财力的限制,需要有选择地进行深度开发。二是加强中医药信息资源数字化的理论研究。中医药与现代科技的融合尚有不少理论问题需要解决,中医学的知识结构、知识表示、知识获取等理论尚未取得实质性的突破,这制约了中医药信息资源的深度开发。以中医药本体研究为例,中医药本体的构建非常复杂,仅国家知识基础设施(CNKI)课题中,中医本体划分就有中医诊断方法、中医术语、中医证、中医脉象、中医病机等30多个中医本体类[12]。每一类本体的构建都只能从其子领域进行,工作量巨大。虽然有人进行了基于历史文献的中医药本体的自动构建研究[13],但其研究进展较为缓慢,理论的滞后制约了应用的发展。
各单位要在了解自身优劣势的基础上,开发具有特色的数字化资源。如在教学视频建设方面,中医药高校具有一定的优势,可摄制更多权威性、高品质的中医药课程教学视频。在道地药材的数字化建设方面,各地区的信息资源建设机构无疑具有先天的优势。
任何资源只有用户使用才能显示价值。用户的阅读习惯、信息需求、知识获取行为等在不断变化,需要我们充分了解。只有做好用户研究工作,才能开发出用户需要的产品。
中医药信息资源数字化能使中医药的海量信息得到全面、高效的存储、采集、利用,有利于中医药知识的传播。目前,我国中医药信息资源数字化建设已经取得了一定成就,促进了中医药事业发展,但由于中医药信息资源的特殊性,今后的数字化建设需要加强资源开发深度,做好用户研究工作,并注重特色资源的建设。