中国共产党思想理论资源数据库
——人民金典语义查询系统(人民出版社)
中国共产党思想理论资源数据库,是按照党中央、胡锦涛总书记关于在网上建设具有广泛影响力的思想文化传播平台的重要指示精神,在新闻出版总署的高度重视和有力推动下,于2008年由国家财政立项启动建设的。
“人民金典”语义查询系统就是为了方便广大用户查询和使用这个数据库中的内容,提供强大的信息检索功能。
本项目属于语义检索技术领域,主要做法是依托中国共产党思想理论专业领域的专家知识和经验,把传统文献编目的方法引入计算机检索,模拟人脑的思维模式,构建基于语义分析的模型,形成了该领域的知识库。目前该知识库的主要内容资源是马列著作、领袖著作、中央文件文献及相关中国共产党思想理论的重要资源。
该系统包括若干检索子系统,目前有:
“人民金典语义查询”系统:能够按语义对著作文献资源,实现从篇目章节、段落层次到语句等知识点的查询。
“人民金典概念关联”系统:可供用户在研究问题、构思文章时,找到一个概念与其它概念之间的语义关联,获取所需要的语段。
“人民金典自动比对”系统:用户能在网上把所要引用的经典论述与电子书进行自动对照,迅速发现引用对错。
本项目的主要特点有,将传统文献编目方法引入计算机知识点编目,提出了一种面向政治理论文献的知识点标引模型。该模型成功创建了由上位词与下位词共同展现知识点的主题词目录、由检索词与相关词共同展现知识点的连带词目录,可大幅度提高了语义自动识别准确率。
该模型的推出和在政治理论文献中的成功应用,可延伸到其他领域文献的语义建模。
在知识点标引模型的基础上,创建和实现了多个独具特色的模拟人脑思维过程的语义检索模型,有效地解决了关键词检索技术存在的多种不足,可以向用户提供高质量的信息检索服务。
“人民金典”语义查询系统适合应用于经典文献的检索。采用该系统中的“人民金典语义查询”子系统,已实现了对中国特色社会主义理论体系重要著作(邓小平、江泽民、胡锦涛同志的著作文章约200万字)的知识点编目及精确语义检索,可检索知识点达到7万个。
采用该系统中的“人民金典概念关联”子系统,实现了对中国共产党思想理论主要理论文献全部在用版本的知识点编目及语义检索,可检索知识点达到约200万个,可检索文献数量达到70多种、约500多本,约 13万千字。
未来几年,计划将该系列工具进一步拓展到学术类、文化类经典文献的知识点编目及检索。目前,正在以此为重要技术基础,筹划建设“中华经典文献数字化开发传播工程”。
“人民金典”语义查询系统首先在“中国共产党思想理论资源数据库与传播工程” 中得到成功应用,于2009年5月上线试运行,2010年6月正式上线运行。其中的“人民金典语义查询”系统于2009年出版发行光盘发行3000张。该系列工具,成为整个理论数据库工程的鲜明亮点和特色。李长春、刘云山同志的视察观看网站演示并作重要指示,新闻出版总署柳斌杰署长亲自为理论数据库主持举办上线仪式并作了重要讲话,全国新闻媒体60多次对理论数据库作了报道,在上述领导讲话和媒体报道中,大多数突出赞扬和肯定了该系列工具的知识点查询作用。
一些单位原来摘编一份学习资料需要个把月,现在从人民出版社网站上一搜,稍加整理,用半天时间就解决。许多学者写文章查资料、搞校对,找到我们网站之后,不再跑资料室、图书馆。如,北京军区空军去年下半年在按中央部署组织进行关于政治体制改革的学习教育时,利用“人民金典语义查询”系统搜索编印了一份《邓小平、江泽民、胡锦涛关于政治体制改革的论述摘编》下发领导干部使用。