面向企业产品创新的科技论文语义知识本体构建研究

2023-02-17 09:46崔靖华朱学芳
新世纪图书馆 2023年1期
关键词:科研人员本体语义

崔靖华 朱学芳

0 引言

产品创新是企业发展的动力,能否开发出符合市场需求的新产品,是一个企业发展的根本。企业科研人员在进行产品创新时需要用到科技论文,科技论文是国家科技竞争力的重要体现,因此有效使用科技论文对于进行产品创新的企业科研人员来说十分重要。然而,目前由于科技论文语义知识纷繁复杂,企业科研创新人员在获取相关知识要点、技术创新知识及研究发展前沿热点方面需要手动检索、搜集、阅读,其过程繁琐,耗费了许多时间和精力。若是能够针对企业科研人员的创新方向,对相关科技论文进行语义知识组织,并形成语义知识库,使企业科研人员可直接查阅知识库中的相关产品知识,则能有效提高对科技论文知识的利用率,进而提高产品创新效率,为企业创新发展做出贡献。

为了方便企业科研人员更加快速、全面地获取关于创新产品的相关科技论文中的相关知识,本研究以智能机器人产品为例,选取该产品国内核心科技论文,构建了面向企业产品创新的科技论文语义知识本体,对其进行可视化,并利用情景分析法探讨企业科研人员如何利用可视化结果进行产品创新,希望能够提高企业科研人员对科技论文语义知识的利用率,进一步提升企业的产品创新效率。

1 科技论文语义知识研究

目前,国内外关于科技论文研究的侧重点在于对科技论文的用词、词频、语义特征等方面进行分析,以构建完善的检索体系,为科研人员提供科技论文检索、个性化推荐等服务。马慧芳等[1]考虑到研究人员难以定位到感兴趣的科技论文,就此提出了一种融合作者与文献影响力的科技论文推荐方法;路永和等[2]基于段落层级结构,分别在词级和句级使用双向GRU对写作需求和参考文献进行语义建模;王宇[3]完成了面向科技文本的预处理,主要包括短文本化、去除文本噪声、分词、去停用词等,为后续的科技文本分类工作提供数据质量的保证和文本数据的形式化支持;宋东桓等[4]采用文本挖掘方法对选取的英文科技论文中的单词、动词、三词词块、四词词块等进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。国外有Boger等[5]学者在Cite ULike数据集上通过实验表明基于用户的协同过滤算法能取得更好的效果;Y.K.Meena等[6]利用科技论文句子特征构建了不同类型的要素识别模型;Chen等[7]使用CNN来提取科技论文文本特征,并使用RNN来产生标签序列;另外还有国际上一些非常成熟的常用词表等[8-10]。但目前尚没有关于企业产品创新的科技论文语义知识本体构建研究。若能有效地整合企业科研人员进行产品创新时所需的科技论文语义知识资源,那么对科研人员自身创新水平的提高、对企业创新竞争能力的提升将产生巨大影响。

2 科技论文语义知识结构

产品在设计过程中的知识可分为需求、功能、作用原理、结构等具体方面。需求反映了产品在市场中的一种现有状况;功能来源于用户的主观意愿,体现设计任务和要求,是产品最终的目的;作用原理则是对功能、结构中冲突现象的解决进行详细说明;结构描述产品的结构组件、结构组件的属性,以及它们之间的连接[11]。为了描述科研人员在具体设计产品过程中所表现出的这种空间知识结构,悉尼大学Gero[11]提出了关于产品设计的“功能—行为—结构”FBS模型,在后来学者的不断完善下,最终形成FBS模型“需求—功能—作用原理—结构”关系[11]。本研究为能很好地使科研人员进行产品创新时检索到所需的科技论文知识,根据FBS模型中的相对应模块含义来映射科技论文的语义知识结构,以求在检索中形成科技知识关联本体。

本文以“智能机器人”为主题的国内核心科技论文为例,对其题目和摘要进行分词,再根据人工校对分词后的结果进行研究主题提取,共总结出“智能机器人”产品领域的主要研究内容,包括设计研究(与FBS模型中的结构知识趋同)、技术研究、应用研究、综述与趋势研究、法律问题研究。同时,根据FBS模型的相对应模块来映射“智能机器人”产品领域科技论文的语义知识结构,如图1所示。

图1 科技论文语义知识结构

3 科技论文语义知识本体类别及其语义关系

本文从企业科研人员需要创新的产品的核心概念出发,根据科技论文语义知识结构,确定产品的“类别”“需求”“功能”“作用原理”“结构”“技术”“应用”“综述”“法律”共9个顶层概念。定义这9个顶层概念及其等级体系,形成科技论文语义知识本体[12]的类别及其等级体系,如表1所示。

表1 科技论文语义知识本体的类别及其等级体系

根据上述科技论文语义知识本体的类别及其等级体系,企业科研人员就可在一个产品的开发设计上系统地了解创新产品的核心知识,并对产品的结构、技术、应用、进展、法律等相关知识有一个全面而深刻的认识。通过产品需求,可及时了解学术需求,并考虑是否可以转化为市场需求,以进行新产品研发。企业科研人员还可以进一步地根据产品功能了解作者要实现的功能意图,可以通过产品的作用原理加深对实现产品功能所应用的相关知识的了解。继而企业科研人员可以依次分别了解关于产品的结构、技术、应用、进展、法律等方面知识。具体来说有:(1)可根据产品结构知识了解产品是如何制备的,智能机器人是由哪些机械零件、硬件、软件等构造而成;(2)可根据产品技术知识,了解目前智能机器人关键技术的研究情况,从而可以在目前研究不足的地方进行创新;(3)可根据科技论文作者对产品应用领域、应用效果的研究,看是否能够对该领域的产品结构、技术等进行优化,以达到创新;(4)可通过产品综述与趋势知识了解智能机器人的现有研究情况,以及未来可能的发展方向、待解决的问题、改进建议,以进一步推动创新发展;(5)可通过产品法律知识了解目前智能机器人所存在的一些法律问题,进而避开雷区。

科技论文语义知识较现有的市场产品技术具有一定的超前性,这将激发企业科研人员产生更多的创新想法。根据上述分析,形成语义类型之间的语义关系集,具体如表2所示。

表2 科技论文语义知识本体语义关系集

4 基于Protégé的本体可视化结果及其产品创新

本文选取以“智能机器人”产品为主题的国内核心科技论文,根据中国知网上的核心期刊、博硕士论文、会议文献等数据进行检索,并将检索到的论文进行前文的相关处理,构建科技论文语义知识类别及类别之间的语义关系,而后利用本体构建工具Protégé[13],分别在Protégé的OWL Classes和Object Properties中编辑科技论文语义知识类别及其语义关系,并根据编辑好的类别及其等级体系、属性及其关系,利用Onto Graf形成可视化本体图,如图2所示。

图2 “智能机器人”产品的国内核心科技论文可视化本体图

当企业科研人员想要进行有关图书馆智能机器人方面的创新设计时,可根据图2所示进行创新活动。具体的创新流程可用情景演绎法来进行演绎[14]。以企业科研人员想要改善图书馆智能机器人的产品结构作为情景演绎的创新目的,具体演绎流程如下。

(1)明确本产品是应用于图书馆体验区的智能机器人。

(2)通过可视化本体图了解目前人工智能在各个领域的渗透情况,知道目前机器人已开始具有自主学习的智能交互能力,并且智能机器人在图书馆已经有所应用,如沈阳市图书馆智能机器人“伴读”、上海图书馆前台咨询机器人“图小灵”。

(3)研究智能机器人在图书馆体验区的应用功能,主要包括书籍检索、导航指引、读者信息查询、智能迎宾及问答,以此为智能机器人在图书馆中的应用研究提供参考。

(4)了解智能机器人所用到的作用原理,包括图像处理原理、传感器原理、信号采集原理、语音识别原理、机器视觉原理及其他原理。

(5)关于应用于图书馆体验区的智能机器人的结构设计方面,要清楚了解智能机器人的系统电控设计,包括本地化的智能云平台、机器人客户端等;在硬件的具体设计上要清楚了解传感器、核心控制板等;在软件设计上要知道包含感知处理模块、系统报表模块、外部查询模块等。

在上述逐步引导下,可帮助企业科研人员更快、更高效地了解图书馆智能机器人的相关知识,有助于企业科研人员全面系统的掌握相关知识,进而启发企业科研人员的创新想法。其相关设计研究的具体创新流程路径如图3所示。

图3 图书馆智能机器人的设计研究

5 结语

为了给构建企业产品科技论文语义知识库做铺垫,本文以当前的热点项目——智能机器人为例,构建了面向企业产品创新的科技论文语义知识本体。通过实例,我们知道一篇产品科技论文中大多有描述需求知识的研究背景、研究现状,描述功能知识的研究目的、意义、结论,描述原理知识的一些相关原理,描述结构知识的产品的具体设计。为此,需要根据不同领域产品的科技论文的主要研究内容来构建语义模型,形成该领域产品的科技论文语义知识本体。进一步来讲,我们将在后续研究中与相关企业合作,让企业科研人员在具体开发新产品的过程中,通过利用相关产品科技论文语义知识本体,构建起关系型知识数据库,并基于关系型数据库的查询,结合Web检索、本体推理等技术构建企业产品科技论文语义知识库,为企业科研人员提供知识资源,并在企业科研人员的不断反馈下修正该知识库。

猜你喜欢
科研人员本体语义
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
语言与语义
广东公安科研人员风采
基于本体的机械产品工艺知识表示
“上”与“下”语义的不对称性及其认知阐释
《我应该感到自豪才对》的本体性教学内容及启示
认知范畴模糊与语义模糊
专题