安 源,翟夏普,龙艺璇
(1.中国铁道科学研究院集团有限公司 科学技术信息研究所,北京 100081;2.中国国家铁路集团有限公司 科技成果知识产权管理办公室,北京 100081)
铁路行业快速发展过程中,铁路科技创新发挥了关键作用[1],而高效、安全、智能的科研管理信息系统一直是我国铁路行业科技创新发展的坚实保障。2006年,原铁道部编制并下发《铁路科技管理信息化专项规划》(科技运〔2006〕71号),在此指导下首次开展初代铁路科研管理信息系统开发工作。2008年,该系统完成技术验收(科技综〔2009〕75号),并在铁路推广试用[2]。如今,在大数据智能浪潮的强力冲击之下,跨学科合作密集、学科交叉明显、科研数据量与日俱增,数据关联关系日渐复杂[3-4]。此外,伴随着科研环境的变化,用户需求开始向个性化、定制化、精准化、扁平化、快速响应化迈进[5]。
现阶段已有不少学者针对大数据环境下的科研管理服务进行了研究。杨晓刚等人[6]从社会媒体环境出发,针对科研人员知识共享开展了相关平台研究;韩丽华等人[7]分析了大数据环境下信息资源管理模式的转变;解海燕[8]针对大数据背景下科研环境的变化,提出了精准科研信息服务体系。但现有研究多以理论研究为主,从宏观角度为科研管理服务发展指明方向,鲜有从平台构建或系统设计角度出发,探索如何落地科研管理智能服务模式。
本文在初代铁路科研管理信息系统的基础上,经由中国国家铁路集团有限公司(简称:国铁集团)统一部署,结合当前铁路行业科研管理服务面临的挑战,开发了以科研项目管理为基础,集立项管理、合同管理、执行管理、变更管理、结题管理于一体,并具备科技专家管理、知识产权管理、科技资源数字化加工、科技成果共享及科技门户等功能的科研管理智能服务平台,2021年通过技术评审(信技网技函〔2021〕29号),并在铁路推广使用。实践证明,该平台为铁路科技创新提供了更广阔的空间。
科研管理智能服务平台集云平台、数据汇集层、信息关联层、信息分析层、知识组织层以及创新服务层为一体,总体架构如图1所示。
图1 科研管理智能服务平台总体架构
为实现海量科研信息资源的高效处理与分析,以开源架构为基础,以云平台作为支撑,优先国产化替代,采用国产化组件,利用Nginx、Tomcat等中间件,设计前后端分离架构和内外穿网部署,通过场景化、差异化流程模版配置,提供科研管理云服务。其中,后端数据库部署在中国铁路主数据中心内部服务网;前端资源在铁路内部服务网和外部服务网各部署一套。在充分保障安全的同时,解决内外网使用割裂的问题,提高数据资源计算效率,保障铁路行业科研管理智能服务平台的数据安全和运行流畅。
数据汇集层包含科研全创新要素信息和铁路领域语料库2部分。
1.2.1 科研全创新要素信息
科研全创新要素信息主要分为以下3类。
(1)科研项目和成果数据:根据国铁集团科研管理相关办法,依托科研管理信息系统,高效汇集铁路内部数据,包括国铁集团、中国铁道科学研究院集团有限公司、18 个铁路局集团公司的立项、合同、结题、评审、奖励、科研成果等涉及科研管理全流程的数据,保障数据的权威性,同时引进专利、标准、期刊、会议等外部数据,保障数据全面性。
(2)创新人才和机构数据:包括科研人员、企业人员、领域专家等人员类型及研究机构、企业公司、第三方等机构类型数据。
(3)产业市场数据:包括铁路产业链上各企业的产品数据。
通过“科研信息+创新主体+行业市场”的数据关联,打通科研项目到行业市场的通道,从源头提高科技资源利用效率,解决科技成果转化问题。
1.2.2 铁路领域语料库
铁路领域语料库涉及铁路行业的理论基础、科学研究方法、相关政策、新闻动态等多维度完备的领域信息,是机器理解领域知识的基础,可为科研信息分析提供先验知识,有利于提高信息分析的智能性和准确性。
信息关联层以科研项目为核心,对铁路科研全创新要素数据进行系统表达和建模,其架构如图2所示。
图2 信息关联层架构
该层负责描述科研项目全生命周期中存在的实体及实体间的关系。其中,科研项目中的实体包括课题基本信息、参与人员、参与机构、资助机构及研究成果;实体之间的关系包括人员与项目之间的负责/参研关系、机构与项目之间的主持/参与关系、资助机构与项目之间的资助关系、项目与成果之间的产出关系等。
平台通过信息关联层理清数据之间的逻辑关系,关联科技大数据的知识、技术、人才、资本全创新要素,打通国铁集团及其所属单位各类科研数据之间的壁垒,从而实现铁路行业科研数据一张网的目标。
信息分析层是整个平台的核心技术支撑。在数据汇集层及信息关联层的基础上,通过数据融合、关联分析、机器学习、自然语言处理等信息技术,开展科研实体识别、关系抽取与知识表示学习,为知识组织层模型库、本体库与规则库奠定基础,完成领域知识图谱的绘制,并基于知识图谱与知识推理技术,实现科研信息的智能服务。
传统的科研信息组织只包含“用代属分参”关系,难以揭示科研信息中复杂的语义信息。因此,本文使用算法模型及知识图谱的方法组织信息。
(1)模型库中的算法模型主要采用数据挖掘、机器学习等方式自动生成,存储成计算机可理解的、以数字符号形式呈现的知识,用于计算机对未知信息的预测分析。
(2)采用自然语言处理技术、知识表示学习等结合人工配合的方式生成的知识图谱,以本体库与规则库为基础,包含了科研信息语义分析、科研知识可视化以及科研知识推理等功能,用于存储人类可理解的、以文字、图形或符号形式呈现的知识。
创新服务层指依据实际科研需求,智能感知用户偏好,敏捷应对外部需求变化,为用户提供个性化、定制化、专业化的科技情报服务。
(1)个性化科研知识推送:主动抓取用户需求,为科研人员推送课题内容相关的最新科研成果。
(2)智能检索式构建:通过语义计算提供满足科研用户全方位科研需求的检索结果。
(3)颠覆性技术分析:提供科学研究主题的关键技术知识图谱,揭示关键技术突破可能带来的颠覆性技术创新机会。
(4)全要素知识图谱:提供人才—科学—技术—成果四维一体的全创新要素关联知识图谱,满足成果转移转化过程中产学研创新主体及风险投资机构个性化的技术、人才和机构的信息需求。
(5)潜在合作推荐:提供研发合作网络知识图谱,揭示研发合作网络的机构、热点领域和核心团队分布。
(6)产业发展态势追踪:提供面向重大产品全创新链的“科学—技术—产业”成长知识图谱,协助科研用户及时了解产业发展态势和学术研究发展动态,为铁路行业重大新产品研发、科技成果技术成熟度评价、科技成果信息的知识管理与运用提供决策支持。
平台通过创新服务,初步实现了智能化科研、网络化协同、场景化配置、服务化延伸及数字化管理,促进了铁路行业科研管理向更加柔性化转变。
科研管理智能服务平台为所有用户提供统一的登陆门户与身份认证平台,其功能如下。
在科研管理活动中,科研管理智能服务平台可提供从科研项目立项、执行、结题到成果产业化全流程中每一环节的定制化、配置化专属流程服务。
科研管理智能服务平台提供丰富的面向课题研究的服务。
(1)课题立项阶段:为科研人员提供国家重大专项、重大计划、科学技术部项目等基金项目信息,并基于科研人员的研究方向制定个性化的基金项目推送。
(2)课题执行阶段:为科研人员提供课题研究内容相关的信息推送,及时跟进研究最新动态,推进科研项目研究进展。
(3)课题结题阶段:依据合同要求评价课题完成情况,使用语义查重系统鉴定课题成果的原创性。
(4)课题成果产业化阶段:利用平台为企业需求与科研成果对接提供机会,加速科研成果的转移转化,推动铁路行业高质量发展。
科研管理智能服务平台可根据科研用户实际需求,提供智能检索、研究趋势预测及知识图谱展示等功能。
(1)在智能检索模块,基于知识图谱对用户检索式进行语义扩展,提高检索查全率。
(2)在研究趋势预测模块,基于权威专家判断结论、文献和专利计量的统计与聚类分析结果、权威机构发布的研究报告、科学技术奖励等统计数据及多维度分析指标,分析研究前沿与研究热点,发现潜在的突破性或颠覆性技术。
(3)在知识图谱可视化模块,基于国家重大科技专项和重点研发计划项目成果信息及相关产业创新发展信息,实现关键技术突破、研发合作网络、全创新要素关联及面向重大产品全创新链等多种类型的知识图谱展示。
科研管理智能服务平台已在国铁集团、中国铁道科学研究院集团有限公司、兰州局集团公司、太原局集团公司、广州局集团公司等单位成功应用,社会效益显著。
该平台汇集了国铁集团及各所属单位的科研项目立项、合同、结题、技术评审、奖励等科研全过程数据,铁路企业主要产品等产业链数据,铁路行业全领域的论文、专利等公开数据,数据条数达千万级别,最早可追溯至1957年。通过开发自动化数据加工平台,基于铁路技术词表和产业词表对科研数据进行标引,构建机车车辆、牵引供电、通信信号等行业细粒度专题库。利用数据挖掘、自然语言处理等信息技术,对各类资源进行关联分析,尝试实现创新链、技术链、知识链、产业链之间的互联互通,改善了铁路各单位系统分散、技术标准不统一的现状,形成了铁路行业科研资源知识服务生态体系,如图3所示。该平台的应用为铁路行业工作人员提供了智能、精准、及时的个性化定制科研信息服务,为实现科研决策提供支撑。
图3 铁路行业科研资源知识服务生态体系
本文结合铁路行业科研管理现状,构建了集云平台、数据汇集层、信息关联层、信息分析层、知识组织层及创新服务层于一体的铁路行业科研管理智能服务平台,并面向铁路行业开展了应用实践。该平台将面向科研成果的被动知识服务升级为面向科研用户需求的主动知识服务,以科研为主线,贯穿科研项目管理、科技成果管理、科研项目后评估等活动,为不同等级、不同角色的科研管理人员设定不同权限,实现科研全流程数字化管理,极大地提高了科研管理工作效率。
未来,将继续围绕铁路科技创新生态体系,进一步从科研管理信息服务的精准度、及时度、专业度、智能化及个性化等角度升级完善平台的数据与服务;进一步集成科技专家、知识产权、科技评价、科技奖励、技术标准、质量抽查、产品认证等业务子系统,对其整合并实行分级分类授权,以提高科技资源使用率,为铁路科研成果的高效管理与科技成果的转移转化提供有力支持。