王 星 赵 捷
(中国科学技术信息研究所,北京 100038)
国家科技报告服务系统构建研究
王 星赵 捷
(中国科学技术信息研究所,北京100038)
国家科技报告服务系统建设是国家科技报告制度建设的重要工作之一。为构建国家科技报告服务系统,从系统功能、资源体系、收藏与服务管理流程等对系统构建需求进行调研分析,提出系统基本架构、功能框架、统一认证机制等关键设计,并给出系统技术实现的基本方案。
科技报告;信息系统;系统设计;资源体系
目前,我国正在建设统一的科技报告制度。要实现科技报告规范产生、持续积累、集中收藏和开放共享等主要目标,需要建立集科技报告完整保存、关联加工和开放共享于一体的科技报告服务系统,面向科研人员和社会公众开展科技信息资源的公益服务与增值服务。基于此,本文详细介绍了国家科技报告服务系统的建设实践,通过调研分析国外已有系统和我国科技报告收藏管理流程,形成国家科技报告服务系统功能开发设计,据此构建国家科技报告服务系统框架和实施方案,从而关联整合各类资源,并实现服务功能,以期为我国社会公众的科技报告应用搭建服务平台,为相关信息服务系统建设提供参考借鉴。
1.1国内外相关研究与实践
西方国家科技报告制度建设起步较早,目前已经形成了较为完善的制度体系。为促进科技报告的传播与交流,许多国家建立了科技报告服务系统,并按照一定的服务机制向公众提供科技报告共享服务[1-2]。美国作为科技报告服务最完善的国家,其相应的服务体系和系统值得借鉴。美国针对公开、受限和涉密科技报告提供分级分类服务:国家技术信息服务局(NTIS)通过国家技术报告图书馆(NTRL)集中向用户提供可公开的科技报告,服务方式分为开放(Open)、公共(Public)、个人付费和机构付费[3],主要功能如表1所示;其他美国政府部门通过各自科技报告服务系统向用户提供本部门可公开的科技报告,如美国国家航空航天局(NASA)通过NASA Technical Reports Server (NTRS)向用户提供检索浏览、免费全文下载、信息推送等科技报告共享服务[4],美国能源部(DOE)通过SciTech Connect向用户提供包括语义检索、术语检索、高级检索、科技报告全文免费下载等文献服务,利用集成于SciTech Connect的信息桥和能源引文数据库,用户可从科技报告、书目引文、期刊论文、会议论文、图书、多媒体数据及其他关联数据中检索获取所需内容[5]。
欧盟的科技报告制度建设是在1980年,由英国图书馆文献提供中心、法国原子能委员会所属的核研究中心及德国的能源、物理、数学情报中心共同协商,欧洲经济共同体资助,建立了欧洲灰色文献信息系统SIGLE(System for Information on Grey Literature in European),科技报告也被认为是一种灰色文献包括在其中。
我国科技报告制度建设起步较晚,正处在研究、探索与初创阶段。20世纪80年代国防科技报告体系率先建立[6],但是,科技报告服务体系尚不健全,特别是缺少可向公众提供科技报告共享服务的服务系统。目前,相关研究十分活跃,许多研究成果为科技报告服务系统的建设提供了十分重要的参考依据。贺德方等提出了科技报告体系基础框架结构[7],胡红亮等提出了科技报告传播使用中知识产权保护的思路和措施[8],曾建勋详尽阐述了科技报告技术标准规范体系[9],周杰等论述了科技报告资源的构成及产生机理[10],侯人华详尽阐述了科技报告政策体系及服务方式[11],陈传夫等围绕科技报告开发利用提出了完善科技报告使用授权制度、利益分享制度、安全管理制度、监管制度及反馈制度等措施与建议[12]。
表1 美国国家技术报告图书馆主要服务功能
与国外科技报告服务系统,特别是美国科技报告服务系统相比,在系统功能方面,两者相同之处是均要按照各自的分级分类服务模式面向公众提供科技报告共享服务,两者不同之处是国家科技报告服务系统需要向服务管理机构、项目课题承担单位以及相关科技管理部门提供相关的服务管理、报告管理等管理功能;在服务方式方面,美国NTIS通过NTRL集中向公众提供科技报告及相关科技文献的共享服务,而我们采用的是集中与分布相结合的方式向公众提供科技报告共享服务,即公众可以通过国家科技报告服务系统共享国家科技财政投入所产生的科技报告和地方/部门呈交给国家的科技报告,也可以通过地方/部门科技报告服务系统共享相关地方/部门科技财政投入所产生的科技报告。
1.2我国科技报告管理流程
我国科技报告管理工作包括:报告上传、数据验证、相似性检测、任务分配、加工规范、质量检查、仓储保存、报告上网、证书制发等环节,具体如图1所示。其中,报告上传应支持报告作者的在线提交和呈交机构的在线批量上传,数据验证由程序按照已定制的校验规则自动完成,相似性检测由具有相应职责人员借助专业工具进行检测,通过检测后由加工管理员将任务分配给相关人员进行加工规范,审核人员对加工规范的数据进行质量检查,后由系统管理员按照一定规则集中仓储报告,不合格数据退至初始环节。最终,系统管理员从数据仓库中提取并发布科技报告,至此报告作者可申领证书,报告管理人员则根据证书领取申请完成制证发证。
1.3我国科技报告服务系统需求分析
1.3.1基本服务功能
由于科技报告分为公开科技报告、受限科技报告和涉密科技报告,我国不同类型不同使用范围的科技报告需要进行分级分类管理[14]。因此,对于公开科技报告需向社会提供全文检索与在线浏览服务,面向特定用户提供受限科技报告目录查询服务,涉密科技报告则完全被纳入保密信息管理体系,实行受控使用。因此,国家科技报告服务系统应借鉴国外已有系统和我国科技报告收藏管理实践,主要面向科技人员、科技管理人员和社会公众进行开放共享服务,提供满足相关需求的基本服务功能(表2)。
图1 我国科技报告管理与服务流程示意图
具体而言,针对社会公众,需提供科技报告摘要浏览服务,社会公众不需注册,即可检索科技报告摘要和基本信息,了解科技投入产出的科技报告基本情况及相关科研项目成果信息,进而认识国家科技实力;针对专业人员,在保护科技报告作者知识产权的前提下,需经实名注册并通过身份认证,即可检索并在线浏览科技报告全文,从而向专业人员展现科技报告的技术内容和科研项目执行过程,展示科研项目产出的学术成果和研发成果;针对科技管理人员,需提供面向科研管理的统计分析服务,管理人员通过实名注册并经科研管理部门授权,即可享有检索、查询、浏览以及批准范围内的统计分析等服务,使管理人员既能了解科技计划局部情况与进展,又能全面把握科技计划的整体情况与进展。
表2 国家科技报告服务系统基本服务功能
此外,为强化知识产权保护意识、防止科技报告的恶意扩散,系统在线浏览功能应实现动态水印技术,监测用户在线浏览科技报告全文时,其使用痕迹将会自动添加到报告中,一旦扩散,可依此追溯至扩散源头。
1.3.2高级服务功能
由于科技报告是在科研项目研究活动的不同阶段产生的,因此一个科研项目可能会产生多个科技报告,其类型包括专题技术报告、技术进展报告、最终技术报告和组织管理报告四大类。按照资源颗粒度,可将科技报告全文内容分解为辑要信息、报告作者、目录、图形、表格、引文、数据片段(Dataset)等知识要素,通过科技报告唯一标识关联相关知识要素,如图2所示。此外,一个科研项目不但会产生多个科技报告,还会产生如期刊论文、会议论文、学术著作科技成果以及专利、标准、软件著作权、科学数据等事实型数据,上述成果和数据间也存在着关联关系,通过科研项目课题编号可对相关数据进行关联,如图3所示。这样,利用科技报告知识要素及其相关成果间的关联关系可向公众提供基于科技报告的知识服务。
图2 以辑要信息为中心的科技报告知识要素关联关系
图3 以科研项目为中心的国家科技报告资源体系数据关联关系
2.1基本框架
为整合部门与地方科技报告服务系统,并使之与国家科技报告服务系统互联互通,国家科技报告服务系统的基本框架遵循开放原则,主要由统一认证系统、前台服务系统、后台管理系统和检索服务系统构成,如图4所示。
其中,统一认证系统由系统管理员通过后台管理系统设定接口参数、访问控制参数等,既是与部门/地方科技报告互联互通的接口,又是用户访问国家科技报告服务系统的统一控制接口。该系统允许普通用户一次注册账户即可登录国家、部门、地方科技报告服务系统并可查阅使用登入系统的科技报告资源,而无需逐一在相关系统中注册登录,科技报告申报系统用户访问国家科技报告服务系统无需注册账户即可以科技人员角色检索浏览、在线浏览科技报告全文。前台服务系统是国家科技报告服务系统的用户服务接口,包括标准版系统、移动版系统和专题服务系统,用户所使用的科技报告资源、所提供的服务功能等由系统管理员通过后台管理系统进行授权与分配。检索服务系统是国家科技报告服务系统的检索服务平台,用来实现前台服务体系的浏览服务功能,具有快速检索、高级检索、关联检索、检索结果分面导航与筛选等特点,使用户能够在科技报告资源体系中查找所需的科技报告、项目进展、项目成果等信息。后台管理系统是国家科技报告服务系统的服务管理门户,既保证用户正常使用统一认证系统和前台服务系统各项功能,又支撑服务管理机构对系统参数、注册用户、用户服务、系统资源、网站内容、证书发放、阅点赠送等业务进行管理。
此外,国家科技报告服务系统通过专门的数据接口与身份认证系统、收藏管理系统、数据仓储系统等管理系统进行连接。通过身份认证系统能够使服务人员对注册用户真实身份进行核查;通过收藏管理系统使服务管理人员能够及时了解报告加工审核情况,以便尽快向报告作者发放证书并赠送阅点;数据仓储系统是国家科技报告服务系统的数据支撑平台,向整个系统提供了充分的数据存储能力和数据交换能力,以保证数据在系统间的顺畅流动。
图4 国家科技报告服务系统基本框架
2.2功能设计
国家科技报告服务系统的功能分为:前台服务系统功能和后台管理系统功能两大类。前台服务系统面向各类用户查阅、使用科技报告及相关文献与信息提供所需的各项功能,后台管理系统面向服务管理人员开展各项业务管理提供所需功能,系统功能设计如图5所示。同时,国家科技报告服务系统设置浏览导航和检索结果导航功能。浏览导航系统属静态导航系统,导航树按一定的规则预先规划,根据需要固定呈现在相关网页内。检索结果导航系统属动态导航系统,导航树根据检索结果由检索系统动态生成。导航系统按来源、学科、类型、地域4个维度对相关科技报告进行组织。为方便用户浏览,导航树的层级设置一般不超过3级,如科技部——科技计划——科技领域。
国家科技报告服务系统采用B/S架构,其中全文检索采用了基于JAVA的RMS CLOUD引擎,运行于Linux系统,其他功能使用.Net Framework 3.5版本的C#语言进行开发,开发环境是Microsoft Visual Studio 2013,开发模式为迭代式开发。
3.1国家科技报告服务系统技术架构
在综合考虑易用性、开放性、安全性、可扩展性、可维护性等因素的基础上,国家科技报告服务系统按照信息系统的结构进行划分的系统构架如图6所示。物理层中,为了保证系统安全,整个系统的物理架构采用的是应用网站和数据库服务的分布式部署,前台网站部分部署在单独的WEB服务器上,并使用负载均衡技术保证WEB服务的稳定性,后台的数据存储服务部署在数据库服务器上,同时全文检索服务使用了单独的服务器,科技报告的全文存储在单独的磁盘阵列上,在与公网的网络连接上使用了硬件防火墙,以防止外网的网络攻击。
图5 国家科技报告服务系统功能设计
OS及工具层中,使用基于Windows的IIS作为发布服务,使用Microsoft Sql Server关系型数据库来支撑数据的管理和存储,使用了基于Linux的RMS CLOUD作为全文检索引擎来提供数据检索和结果分面的功能。
数据层按照元数据、全文和全文索引等不同类型数据进行存储和管理,关键数据按照安全要求进行加密,并按照运行维护的要求进行日常备份及还原测试。
业务及功能层分为服务系统和统一认证系统,用户通过统一认证系统进行注册、登录,然后访问服务系统的各项功能,其中统一认证系统与全国公民身份证号码查询服务中心通过Web Service进行连接,可即时核查用户身份证注册信息的真实性。
用户层中不同用户可通过PC浏览器、移动设备浏览器和移动设备APP访问国家科技报告服务系统,其中PC浏览器支持IE、Firefox和Chrome等主流浏览器,移动设备浏览器支持IE Mobile、Android Browser、Android Chrome和IOS Safari等主流浏览器,移动设备APP支持Android和IOS系统(图6)。
3.2科技报告资源实体关系
科技报告资源涉及6类实体对象,分别是科技计划/基金、项目/课题、承担/完成单位、项目承担/联系人/科技报告作者、成果(包括期刊论文、会议论文、学术著作、发明专利、科技成果、标准规范、软件著作权、科技奖励等)、科技报告,每一类实体均有若干属性,相互作用与关系如图7所示。针对每一类实体及其属性,均定义有一组数据表,数据表之间的关系如实体关系,科技报告数据库系统由这些数据表及关系共同构成。
图6 国家科技报告服务系统架构图
3.3国家科技报告服务系统导航功能
国家科技报告服务系统设置浏览导航和检索结果导航功能。浏览导航系统属静态导航系统,导航树按一定的规则预先规划,根据需要固定呈现在相关网页内。检索结果导航系统属动态导航系统,导航树根据检索结果由检索系统动态生成。导航系统按来源、学科、类型、地域4个维度对相关科技报告进行组织。为方便用户浏览,导航树的层级设置一般不超过3级,例如:科技部——科技计划——科技领域。
图6 科技报告数据实体关系图
在国家科技报告服务系统的构建过程中,采用了分阶段的迭代式开发模式和公众化参与模式,每一阶段开发成果均以征求意见版的形式投入试运行,试运行期间利用有奖在线征求意见的方式不断征集社会公众的意见与建议,吸取有建设性的意见与建议,及时调整和完善系统的设计方案。这种方式让使用国家科技报告服务系统的最终用户参与到网站的建设过程中来,使得系统的功能能够得到最终用户最大程度的认可,并不断优化国家科技报告服务系统。
[1]周萍,刘海航.欧盟科技报告管理体系初探[J].世界科技研究与发展,2007,29(4):94-100.
[2]刘春燕,杜薇薇.美国技术报告与NTIS服务及对我国的启示[J].中国科技资源导刊,2014, 46(1):40-44.
[3]National Technical Reports Library. Basic and Premium Access Comparative Chart [EB/OL].[2015-05-31].http://www.ntis.gov/assets/pdf/NTRL_ACCESS_ CHART_No_ Future.docx.
[4]NASA.NASA Scientific and Technical Information-Program[EB/OL].[2015-05-31].http: //www.sti.nasa. gov/fnd-sti/#ntrs.
[5]DOE Office of Scientific and Technical Information. What Is SciTech Connect? [EB/OL].[2015-05-31]. http://www.osti.gov/scitech/faq.
[6]国防科技报告管理办公室. 国防科技报告是国防科技发展的重要资源[J].航空科学技术, 2004(1):11-14.
[7]贺德方,胡红亮,周杰. 中国科技报告体系的建设模式研究[J].情报学报,2009,28(6): 803-808.
[8]胡红亮,宋清林,龚春红.科技报告知识产权保护问题研究[J].科技进步与对策,2009, 26(1):97-102.
[9]曾建勋.科技报告技术标准体系研究[J].情报学报,2013,32(5):459-465.
[10]周杰.科技报告资源的构成及产生机理研究[J].情报学报,2013,32(5):466-471.
[11]侯人华.科技报告政策体系及服务方式研究[J].情报学报,2013,32(5):472-477.
[12]陈传夫,代钰珠,曾建勋.科技报告开发利用与知识产权问题研究[J].情报学报,2014, 33(8):793-799.
[13]科技部.国务院关于改进加强中央财政科研项目和资金管理的若干意见[EB/OL]. [2015-05-31]. http://www.most.gov.cn/kjbgz/201403/t20140312_112280. htm.
[14]贺德方.中国科技报告制度的建设方略[J].情报学报,2013,32(5):452-458.
Research on the National Science and Technology Report Service System
Wang Xing, Zhao Jie
(Institute of Scientifc and Technical Information of China, Beijing 100038)
The national science and technology report service system is one of the important activities of the national science and technology report system. For the purpose of developing the national science and technology report service system, this paper analyzes the system needs on the system functions, resources system, collections and service management processes. In addition, it presents the key basic design of the system architecture, functional framework and unified authentication mechanism, and gives a system technology program.
science and technology report, information system, system design, resources system
G311
A DOI:10.3772/j.issn.1674-1544.2015.05.005
王星*(1977-),男,中国科学技术信息研究所工程师,研究方向:信息管理与信息系统;赵捷(1959-),男,中国科学技术信息研究所信息资源中心副主任,研究馆员,研究方向:数据挖掘与知识服务。
2015年6月19日。