面向医学科技评价的本体模型构建研究

2018-03-21 01:32,,,,,2
中华医学图书情报杂志 2018年10期
关键词:不端本体语义

,,,,,2

医学科技评价是医学科研活动中的重要组成部分,是医学科技管理工作中的核心内容。好的科技评价方法与体系可以优化科技资源的配置,提高科研人员的积极性,并对推进科技制度创新的完善和发展、营造良好的科研氛围具有重要的作用。

本体(Ontology)最初是哲学领域概念,是对现实真实存在的客观描述。20世纪90年代,本体概念被逐步引入人工智能、图书情报和知识工程等领域,同时也被赋予了新的含义。图书情报学领域专家张秀兰通过对国内外各领域本体定义的深入研究,认为本体是通过描述、捕获领域知识,确定领域内共同认可的概念和概念间的关系,以用于领域内不同主体之间的交流与知识共享的形式化规范说明[1]。

医学科技评价数据涉及科研机构、项目、科技人才、基金、专利等多项内容,不同概念间关系较为复杂。当前我国科技评价研究中存在科研数据组织系统性欠缺、关系揭示程度差等问题。现存科研本体概念层次体系较为复杂,概念、属性存在形式各有不同,这对本体的复用造成较大阻碍。构建面向医学科技评价的科研本体,能够更好地满足评价工作的实际需求,进一步完善科技资源的组织方式,展示领域内部的语义关系,从而提高医学科技评价的效果。

本文拟借鉴现有科研本体相关概念及本体构建方法,在搜集、整合多来源科研信息的基础上分析科研本体划分的不同概念层次;通过复用现有科研本体及重构科研信息,构建面向医学科技评价的科研本体,全方位展示医学科技评价研究中科技评价对象之间的多种关系;以科研本体为基础,指导医学科技评价工作,为建立高级别的医学科技评价本体提供思路。

1 科研本体研究现状

当前科学研究工作已经发生变化,大量数据出现并需要管理[2],医学科技评价研究工作亦是如此。随着本体技术的日益成熟,科研本体越来越多,但很多本体中同类概念及属性仍以不同的形式存在和存储,使本体之间的共享、复用存在较大问题。现有科研本体,如康奈尔大学构建的VIVO(http://vivoweb.org)本体被定义为可语义探索的科研网络,但VIVO本体的管理、更新、复用较为复杂,关系属性类目繁多,不适用于科技评价需求,目前没有解决学科领域本体的建设;BIBO[3]本体对期刊、书目概念做了较好的层级体系划分,但关系属性揭示程度不强。

针对科研本体研究现状及医学科技评价实际需求,本文在借鉴VIVO、FOAF[4]、EuroCRIS[5]、BIBO、AMiner[6]等相关科研本体或知识图谱中关于科技评价概念及属性的同时,根据当前医学科技评价工作的实际需求,将当前科研领域的关注热点——学术不端类别和科技创新纳入本体模型的基础上,确定医学科技评价本体应包含的体系框架(以下简称“框架”)(图1)。

图1 医学科技评价体系框架

2 医学科技评价本体构建流程

目前并没有统一的本体构建方法,应用比较广泛的本体构建方法主要包括骨架法、METHONTOLOGY法、IDEF5法、TOVE法以及七步法[7]。Protégé具有图形化的用户界面,操作简单,提供详细的帮助文档,支持模块化设计[8]。本文拟结合骨架法和七步法,利用Protégé5.1构建医学科技评价本体。其流程见图2。

2.1 医学科技评价对象

医学科技评价本体的相关概念、属性、关系主要来自文献调研、国外科研本体以及医学科技评价领域专家。对国内外医学领域开展的评价研究进行调研时,可将当前医学科技评价主体划分为医学科技机构评价、人才评价以及成果评价(表1)。

2.2 医学科技评价本体类及其层次体系的构建

医学科技评价本体层次体系的构建主要是完善框架所包含大类的子类,分析子类的概念,定义子类的对象属性及数据属性。

图2 医学科技评价本体构建流程

在医学科技评价本体中,评价维度是指科研投入、科研产出及学术影响。科技投入反映机构的基础实力,是开展科技活动的前提和基础,包括人、财、物等的投入,该维度包括科研平台和科研项目等方面;科技产出则是衡量科研机构和科研人员创新能力的关键,是科技活动所产生的直接成果,该维度包括专利、专著、临床指南等方面;学术影响是科技成果以及科研人员在学科领域内产生的直接或间接影响[15],反映知识传播的广度和深度,该维度包括科研奖项、荣誉称号、团队称号等方面(表2)。

表2 学术影响及下位概念(部分)

本文中科研机构有明确的研究方向和任务,同时具备开展研究工作的基本条件,并组织一定水平的学术带头人和一定数量、质量的研究人员长期从事医学相关研究与开发活动。

科研人员具备一定的生物医学科学理论知识并从事科学研究工作,以及医疗健康设备开发、生命科学研究、流行病调查研究等。医学科技评价所涉及的科研机构和科研人员主要按照研究领域进行划分,因而本文选择医学学科中概念外延更加广泛的学科分类,如“临床医学”、“基础医学”及“预防医学及卫生学”等。

学术不端行为也称“不正当的研究行为”,指学术共同体成员违反学术准则、损害学术公正的行为[16]。近年来有关中国研究学者学术不端的报道屡见报端,国内相关机构、高校陆续出台学术不端管理方法、学术风气建设意见。其中《关于加强我国科研诚信建设的意见》《学位论文作假行为处理办法》《高等学校预防与处理学术不端行为办法》等多项文件明确定义了学术不端的类型,进一步规范了科研学术生态环境。本文在总结分析国家政策文件、高校及期刊学术不端管理办法的基础上,总结了适用于医学科技评价的学术不端类型(表3)。

根据上述类别概念划分类的层次体系,在Protégé中进行构建(图3)。

表3 医学科技评价本体“学术不端”类别概念及定义

图3 医学科技评价本体层次体系的划分

2.3 医学科技评价本体关系属性构建

本体关系属性的构建是本体具有语义关系的关键,关系属性一般连接两个实体。本文主要是通过各类实体之间的实际关系和参照各类科研本体及知识图谱之间的语义关系确定关系属性。具体确定为21种关系,其中关系“vivo:has_affiliated_organization”、“vivo:has_collaborator”、“vivo:is_predecessor_of”及“ vivo:participates_in”复用于科研本体“VIVO”,关系“affects与affected_by”、“funds与funded_by”以及“teacher_of与student_of”这3对类间关系为互逆(inverse)关系。

在8类语义类型21种关系中,高频类是“科研机构”与“科研人员”,“科研机构”与除“学术不端”之外的6个类都有语义关系,“科研人员”与除“地理区划”之外的6个类都有语义关系;中频类是“科研产出”“学术影响”,“学术影响”与另外5个类产生联系,“科研产出”与另外3个类产生联系;低频类是“科研投入”、“医学学科”、“地理区划”以及“学术不端”,“科研投入”与另外3个类产生联系,“医学学科”、“地理区划”以及“学术不端”分别与另外2个类产生联系。

利用Protégé设置关系属性,定义属性的定义域(domain)和值域(range)(表4)。

2.4 专家咨询过程

根据本文目的,邀请中国医学科学院医学信息研究所等单位共10余名专家作为咨询对象。专家遴选的标准如下:对医学科技评价及相关指标体系具有深入认识及了解,长期从事中国医院科技量值(Science and Technology Evaluation Metrics)评价研究,具有丰富的实践经验。

表4 医学科技评价本体关系属性

通过现场展示的方式展示本体模型,收集专家有关本体的意见反馈。专家就本体划分的维度、语义关系的设置展开了讨论,提出以下建议:一是考虑医学研究的全面性,指标体系中“医学学科”维度参照教育部学科分类,能够较全面地揭示当前医科科研内容,诸如“生物信息学”“互联网+医疗”等交叉学科研究领域的揭示需深入思考;二是优化科研网络的揭示效果,传统指标体系中各指标彼此互不干涉,通过构建各语义类型之间的关系有助于科研网络的揭示,进一步丰富语义关系类型。

3 医学科技评价本体检索及可视化展示

Protégé作为本体建设软件,能够进行推理、检索以及可视化展示。本文在完成本体层次体系构建以及关系属性定义后,已初步构建完成医学科技评价本体,但仍需验证各语义类型之间的关系揭示效果。本文选择“科研机构”和“科研人员”作为检索词进行展示。 在检索框中输入“科研机构”和“科研人员”的结果如图4、图5所示。分别展开上位类,出现与之相关的各类实体。通过语义关系,证明“科研机构”不仅与各上位类语义类型存在关系,其下位类之间也存在关联。“科研人员”不仅能够通过参与科研项目、产出科研成果对学术影响产生积极作用,其本身学术不端行为亦会对“学术影响”造成负面影响。语义关系的揭示是本文研究的重点。通过梳理医学科技评价相关概念及属性,构建完成适用于医学科技评价的本体模型,发现各语义类型之间的相关关联。图6展示了8类语义类型及21种语义关系之间的关联。

图4 医学科技评价本体“科研机构”检索结果

通过可视化可直观展示了解高频语义类型及其彼此之间的关系,同时高频概念的统计能够为医学科技评价研究提供新的研究角度。如通过对“学术不端”的分析,发现其对“科研人员”“科研机构”“学术影响”均造成重要影响。

4 讨论

本文从医学科技评价实际需求入手,建立了医学科技评价本体,采用模块化的方法从评价维度和基本信息两方面构建了包含科研机构、科研人员、学术影响在内的8大类语义类型,每类语义类型可重复使用并易于更新维护。同时完善了科研机构、人员、学术影响之间的语义关系,将学术不端纳入本体模块,从而进一步完善了医学科技评价体系,明确了医学科技评价研究领域的研究方向。

但本文仍存在着一定的局限性,如本体语义关系揭示不足、推理效果欠佳等,对于科研评价的信息需求不够明了,对于科研产出相关信息未明确标准化。下一步应在扩展语义类型及关系的基础上,创建医学科技评价实例,完善语义推理规则。

猜你喜欢
不端本体语义
关于采用《科技期刊学术不端文献检测系统(AMLC)》的声明
眼睛是“本体”
语言与语义
论文作者学术不端行为类型
《中国粮油学报》关于学术不端稿件的认定和处理办法
基于本体的机械产品工艺知识表示
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
“吃+NP”的语义生成机制研究
《中国医疗美容》学术不端检测方法