融合专利数据与社交媒体数据的潜在颠覆性技术识别——基于深度学习模型

2024-03-11 07:18冯立杰秦浩王金凤刘鹏仵轩张芷芯
情报学报 2024年2期
关键词:关注度影响力专利

冯立杰,秦浩,王金凤,刘鹏,仵轩,张芷芯

(1. 郑州大学管理学院,郑州 450001;2. 上海海事大学物流工程学院,上海 201306;3. 河南省创新方法工程技术研究中心,郑州 450001;4. 上海海事大学中国(上海)自贸区供应链研究院,上海 201306)

0 引 言

颠覆性技术被认为是推动技术创新和经济增长的重要驱动力[1]。作为技术创新的重要内容,颠覆性技术具有强烈的破坏力,能够打破原有技术生命周期,构建新的技术轨道,并逐渐取代现有主流技术,从而对社会产生深远影响[2]。因此,通过科学方法识别潜在颠覆性技术,将有助于定位重要的研发方向,合理分配资源配置,指导科技决策与规划,从而进一步提升企业竞争力,帮助国家抢占发展先机[3]。

对此,有学者尝试采用多种方法识别颠覆性技术,主要包括基于专家经验的识别方法、基于模型的识别方法以及基于数据挖掘的识别方法等。基于专家经验的识别方法主要是德尔菲法[4]、技术路线图[5]、调查问卷法[6]等。这些方法囿于专家知识范围的影响,具有较强的主观性,且专家资源较为稀缺,难以实现颠覆性技术识别的准确性与全面性。基于模型的识别方法主要是以一定的理论框架和标准为基础,结合统计方法构建相关模型以识别颠覆性技术。例如,于光辉等[7]采用专利引用信息和Bass模型构建了对颠覆性技术识别和判断的新方法,并用技术扩散的S形规律进行验证;Cheng等[8]基于SIRS(susceptible, infectious, recovered, suscepti‐ble)流行病模型,提出了一种颠覆性技术扩散模型,用于识别潜在的颠覆性技术。但这些方法受限于学者自身领域专业知识与市场信息,难以抽象颠覆性技术的核心内容或者属性,从而影响颠覆性技术识别的准确性。随着数据驱动概念的深入,基于数据挖掘的识别方法越来越受到关注。当前,基于数据挖掘的识别方法主要是结合统计学、文献计量学以及指标评估等方法识别颠覆性技术。例如,陈育新等[9]基于技术与市场构建颠覆性潜力测度指标,通过结合滑动窗口与LDA(latent Dirichlet allo‐cation)主题模型,提出了一个能够动态识别具有颠覆性潜力的技术,并用IPC(international patent classification)关联强度验证识别结果;李乾瑞等[10]基于专利视角,运用熵权法和模糊一致矩阵方法,从4个维度构建了一套系统的颠覆性技术识别体系,并对5个技术领域展开了3个维度的对比分析以验证模型的可行性;Dotsika等[11]以科技文献为数据源,依据关键词在共现网络中的接近度和远离度来识别颠覆性技术。这些方法具有较强的客观性,在一定程度上降低了专家对于识别结果的影响。但颠覆性技术早期特征信号较弱,识别难度较高,且上述方法主要考虑技术本身,较少考虑市场等因素。

为进一步弥补仅考虑技术本身导致的颠覆性技术识别的低准确性,部分学者结合多源数据进行颠覆性技术识别。例如,马永红等[12]运用LDA主题模型从专利中提取技术主题,并采用4个特征识别候选颠覆性技术,基于网页新闻数据分析技术的市场属性,进而识别出颠覆性技术;谭晓等[13]基于论文、专利与项目等数据源,结合社团发现、主题识别、主题演化等方法,构建了科学-技术-市场模型用于识别颠覆性技术;吕璐成等[14]基于专家知识和技术层次体系确定候选颠覆性技术,结合专利、论文、基金、企业与舆情等数据源评估颠覆性潜力,并界定了两类颠覆性技术。综上所述,已有文献从多源数据出发,从多个维度开展颠覆性技术的识别,进一步提升了颠覆性技术识别的准确性。

显然,现有颠覆性技术的识别文献从多方面进行了有益探索,但仍存在以下不足。一是鲜有研究考虑社交媒体数据对于颠覆性技术识别的重要性。颠覆性技术在发展的过程中,以满足用户需求为导向,能够吸引主流用户[15],而社交媒体是社会大众反映对颠覆性技术关注度与情感倾向的重要平台。通过社交媒体数据,能够对潜在颠覆性技术作进一步分类,以提升颠覆性技术早期识别的准确性。二是鲜有研究利用深度学习模型分析颠覆性技术的指标特征,从海量专利中挖掘出深层次的复杂非线性颠覆性技术关键特征,并运用该特征来识别未来潜在颠覆性技术,从而进一步减少专家经验的主观性,并提高潜在颠覆性技术识别的效率。

鉴于此,为避免专家经验评估带来的主观性以及上述研究较少考虑社交媒体数据等问题,本文拟基于专利与社交媒体双数据源,通过结合深度学习模型、BERTopic主题建模等,提出一种潜在颠覆性技术的识别路径。具体研究路径如下:首先,基于专利数据,划分数据集,构建出专利指标与技术影响力之间的关系;其次,依托双向长短时记忆循环神经网络(bi-directional long short-term memory,Bi-LSTM)拟合专利指标与技术影响力之间的关系,预测出候选颠覆性技术,并结合BERTopic提取技术主题;再其次,通过BERTopic基于社交媒体数据提取出社会主题,并通过关注度和情感倾向对社会主题进行评价;最后,通过语义相似度,将社会主题与技术主题匹配映射,并将技术主题分为高关注度-积极态度、高关注度-消极态度、低关注度-积极态度与低关注度-消极态度4种类型,根据4种类型技术主题各自的特点,识别出潜在颠覆性技术。

1 理论基础

1.1 双向长短时记忆循环神经网络(Bi-LSTM)

长短时记忆循环神经网络(long short term memory,LSTM)是一种基于循环神经网络(recur‐rent neural network,RNN)结构的改进模型,相较于RNN,LSTM解决了RNN存留的“梯度爆炸”和“梯度消失”等问题[16],并考虑了输入和输出之间的时间关系[17]。LSTM由遗忘门Ft、输入门It和输出门Ot共3个门结构组成,并由这3个门来更新网络。LSTM中的内存单元Ct和隐藏状态Ht由前状态Ct-1和Ht-1更新得到,具体更新过程计算公式[18]为

其中,Xt为t时刻输入LSTM的数据;Ht为LSTM在时间t更新网络的输出;W为每个门单元的权重矩阵;b为每个门的偏置向量;σ为sigmoid函数;tanh为tanh函数。LSTM模型结构如图1[19]所示。

图1 LSTM模型结构[19]

LSTM模型只能通过上一时刻的时序信息预测下一时刻的信息,为了充分利用文本信息,本文引入双向长短时记忆循环神经网络(Bi-LSTM),该模型由两个方向相反的LSTM模型组成,同时处理文本信息,以获得具有相反时间序列的两个隐藏层状态,并将其堆叠以获得相同的输出。Bi-LSTM模型结构如图2[20]所示。

图2 Bi-LSTM结构模型[20]

截至目前,Bi-LSTM已被广泛应用于变压器故障诊断[21]、交通事故检测与状态分析[22]、医疗保健数据监测[23]、专利数据效应匹配[24]等众多领域,且在不同领域均表现出了良好性能。但该模型有较高的技术环境要求:一是需要质量和数量较高的数据集,并进行有效的数据清洗与预处理;二是Bi-LSTM在训练过程中需要大量的参数调整和优化,以达到最佳性能。

随着科研大数据的发展,人们能够获取更多颠覆性技术的特征,相较于人工定义颠覆性技术特征,深度学习模型依据自身多层非线性结构,在处理复杂数据时,能够更加全面、准确地提取数据特征,从而预测出候选颠覆性技术[25]。鉴于此,本文拟运用Bi-LSTM拟合专利指标数据与技术影响力之间的关系,以预测候选颠覆性技术。

1.2 BERTopic主题建模

BERTopic是一种主题建模技术,能够从海量专利文献中提取技术主题及其关键词。由于其能在提取技术主题时保留重要的词汇,且相较于LDA、STM(structural topic model)[26]等模型,能够充分考虑文本语义信息。因此,众多学者利用BERTopic提取了专利主题[27]、在线评论主题[28]、论文主题[29]等,这些研究均验证了BERTopic应用在不同文本的普适性。故本文使用BERTopic主题建模模型提取潜在颠覆性技术主题。BERTopic模型在BERT(bi-directional encoder representation from transform‐ers)基础上,使用了UMAP(uniform manifold ap‐proximation and projection)降维、HDBSCAN(hier‐archical density-based spatial clustering of applications with noise)文本聚类和c-TF-IDF(class-based TFIDF)提取主题词3个步骤,其运行原理如图3[30]所示。

图3 BERTopic运行原理[30]

鉴于此,本文拟运用BERTopic主题建模,分别基于专利数据提取候选颠覆性技术主题及主题关键词和基于社交媒体数据提取社会主题及主题关键词。考虑到专利数据和社交媒体数据不同主体、不同诉求和不同关注等因素导致的差异,本文通过语义相似度对两者进行匹配映射,并从社会大众关注度和社会大众情感倾向两个维度对社会主题进行评价,从而实现对技术主题的分类。

2 研究路径

本文通过融合专利数据与社交媒体数据,并依托Bi-LSTM与BERTopic主题建模,构建了潜在颠覆性技术识别研究路径,如图4所示。

图4 研究路径

2.1 专利数据收集及数据集划分

本文通过制定与具象技术主题相关的检索策略来收集相关专利数据。为提升数据分析的有效性,在正式分析之前,需要对已经收集的专利数据进行预处理。首先,对检索到的专利进行甄选,剔除与具象技术领域相关度不高的专利;其次,由于最短颠覆性技术认证时限为6年[31],本文按时间段将专利数据集划分为训练集与预测集,并保证每个数据集的时间跨度至少为6年;最后,保存每个专利对应的指标,为后续构建深度学习模型奠定基础。

2.2 颠覆性技术特征选择

2.2.1 颠覆性技术指标选取及体系构建

在文献计量领域中,许多学者从技术、科学、市场等多种角度出发,综合多个指标描述颠覆性技术[32]。结合颠覆性技术特性和现有专利指标体系,同时考虑指标的可获得性,本文使用技术类、科学类以及市场类3类共8项指标对颠覆性技术各方面特征进行测度,构建颠覆性技术的技术指标体系。各类指标名称以及衡量方式如表1所示。

表1 指标名称及衡量方式

(1)技术类指标[33]:技术类指标包括技术新颖性(technological novelty,TN)、技术价值(techno‐logical value,TV)、技术涵盖度(technological scope,TS)、专利权人数量(patentees,PAT)、发明人数量(inventors,INV)等指标。技术新颖性描述了目标专利对其他技术的参考程度,即引用其他专利的数量越多,其新颖性就越低;技术价值描述了目标专利对其他技术的影响程度,即被其他专利引用的数量越多,其影响力就越高;技术涵盖度描述了目标专利技术覆盖的范围,即专利所属类别数越多,其技术范围度就越广;专利权人数量描述了目标专利的未来技术发展力与影响力,专利权人的能力与水平将影响技术的未来发展与影响力,即专利拥有的专利权人越多,其技术未来发展力与影响力就越高;发明人数量描述了目标专利的未来技术发展的潜力,拥有多个发明人的专利往往具有更大的发展潜力。

(2)科学类指标[34]:科学类指标包括科学关联度(scientific relevance,SR)指标。科学关联度描述了目标专利与科学文献的关联程度,即专利引用非专利文献的数量越多,其与科学的关联度就越高。

(3)市场类指标:市场类指标包括专利族大小(number of patent families,NF)、专利竞争力(pat‐ent competitiveness,PC)等指标。专利族大小描述了目标专利在全球布局的广度,即专利的专利族越大,其在全球布局区域越广,花费成本越高[35];专利竞争力描述了目标专利在市场的竞争能力,通常用权利要求数来表征,即专利的权利要求数越多,其竞争力越强[36]。

2.2.2 颠覆性技术影响力评估

高技术影响力作为颠覆性技术的核心特征,常常被专利的前向引用次数所衡量。即若一项技术越被频繁、广泛地应用到未来技术中,则意味着其具有越大的技术影响力[37]。但针对特定领域而言,高被引专利并不一定是被本领域所引用,也有可能是被其他领域所引用。即对于其他技术领域而言是颠覆性技术,对本领域而言只是高价值专利。此外,有些颠覆性技术早期影响力较弱,意味着前向引用次数较少。因此,直接使用专利的前向引用次数来衡量技术的影响力并不妥当。鉴于此,本文采用黄鲁成等[38]提出的NPCIA(novel patent cross-impact analysis)法,用于衡量技术间的交叉影响及技术影响力(technological influence,TI),计算公式为

其中,N(j)为包含技术j的专利数量;N(i∩j)为同时包含技术i和技术j的专利数量;Si为技术影响力系数;n为技术数量;i和j为技术的子集;aij为技术i对技术j的交叉影响。

本文将技术影响力按大小分为高和低两个等级。为了更加准确地设置技术影响力大小之间的阈值,需探究不同阈值大小与模型预测准确率之间的关系。因此,本文使用回归分析,通过比对不同阈值大小对预测模型准确率的影响,确定合理的技术影响力大小的阈值[39]。将大于等于该阈值的专利样本视为高技术影响力专利,并贴上标签“1”,其余专利样本视为低技术影响力专利,并贴上标签“0”,为后续深度学习模型的构建提供数据源[40]。

2.3 候选颠覆性技术预测

2.3.1 深度学习模型训练

一个技术领域会存在海量的专利,且有较多指标对其进行衡量及描述。作为一种神经网络分类器,深度学习模型能够处理大量数据[41]。因此,本文使用深度学习模型来预测候选颠覆性技术,而使用深度学习模型预测候选颠覆性技术的关键是构建出专利指标和专利未来影响力之间的关系。

为了进一步提高识别精度以构建合适的深度学习模型,本文将专利数据集划分为两个部分——数据集1和数据集2。其中,数据集1用于帮助深度学习模型拟合专利指标与专利未来影响力之间的关系。其具体训练步骤如下:首先,从训练集中依据前述构建的指标体系提取相应的指标;其次,依据前述未来影响力算法,人工计算并标注每个专利的未来影响力;最后,使用未经训练的深度学习模型拟合技术指标与专利未来影响力之间的关系。深度学习模型的构建如图5所示。

图5 深度学习模型构建

在建立深度学习模型之初,首先,需要对模型的各种参数进行初始化设置,具体包括神经元数量、Epoch以及Batch size等;其次,使用数据集1对深度学习模型进行训练,从而实现模型的迭代与参数的更新;最后,完成训练,保存深度学习模型。

2.3.2 深度学习模型测试

为了评估深度学习模型的训练效果,本文随机将数据集1按8∶1∶1划分为训练集、验证集与测试集[42],并使用准确率、精确率、召回率和F1-score共4个指标对训练效果进行评估。计算公式为

其中,Acc为准确率;Pre为精确率;Re为召回率;TP和TN分别为判断正确的正样本和负样本;FP和FN分别为判断错误的正样本和负样本;P和N分别为正样本和负样本。

2.3.3 候选颠覆性技术预测及技术主题提取

依托上述深度学习模型的训练预测候选颠覆性技术。其具体步骤如下:首先,提取数据集2中的专利指标;其次,将指标信息输入完成训练的深度学习模型中,并输出相应的技术影响力;最后,将具有高技术影响力的专利视为候选颠覆性技术,并使用BERTopic模型提取候选颠覆性技术的技术主题,其具体流程如图6所示。

图6 候选颠覆性技术预测流程

2.4 潜在颠覆性技术识别

通过专利数据预测出的候选颠覆性技术,难以反映社会大众对其的关注度与情感倾向。已有研究表明,除去技术改进的自身动力,技术发展本身也是一项社会行动[43]。社会大众往往基于自身利益,动态、持续性地关注某个主题领域。即如果某项科学研究的社会大众关注度较高,态度较为积极,那么意味着该研究具有较高的社会影响力。颠覆性技术作为科研活动的成果表现之一,也同样适用[44]。因此,本文以社交媒体数据为数据源,探究社会大众对前述预测出的候选颠覆性技术的关注度与情感倾向,以进一步提升潜在颠覆性技术的准确性及全面性,具体步骤如下。

Step1.数据获取及社会主题提取。以社交媒体数据库为数据源,利用Python爬取与目标技术领域相关的内容及阅读量,并使用BERTopic提取出相应的社会主题以及文本-主题概率矩阵。

Step2.社会主题关注度与情感分数计算。基于文本-主题概率矩阵匹配社会主题与文本,并分别以文本阅读量的算术平均数作为社会主题的社会大众关注度,以文本情感分数的算术平均数作为社会主题的社会大众情感分数。

Step3.二维坐标构建与技术主题分类。构建二维评价坐标,从4个象限出发对社会主题进行分类,并基于语义相似度将上述技术主题与社会主题进行匹配映射,进而依据社会关注度与社会情感分数两个指标将技术主题划分为高关注度-积极态度、高关注度-消极态度、低关注度-积极态度以及低关注度-消极态度4种。

Step4.基于各指标的潜在颠覆性技术识别。基于专家意见阐释4种技术主题类型的颠覆性潜力,并识别潜在颠覆性技术。

具体流程如图7所示。

图7 潜在颠覆性技术识别流程

2.4.1 社交媒体数据获取及社会主题提取

本文通过制定与具象技术主题相关的检索策略,收集相关社交媒体数据,并获取社会主题。具体过程如下:首先,对获得的数据进行清洗,去除与主题相关度不高和无关的数据;其次,对清洗过后的数据进行预处理,包括HTML(hyper text markup language)解码、删除标点符号等,并进行规范化储存;最后,使用BERTopic模型提取社会主题及文本-主题概率矩阵,并结合相关领域专家意见,去除相关度不高的主题,得到最终高相关度的社会主题。

2.4.2 社会主题关注度与情感分数计算

社会主题的关注度为该主题下的所有文本的阅读量算术平均数。具体过程如下:首先,基于文本-主题概率矩阵,并结合相关领域专家意见,筛选出每个主题下的文本;其次,统计每个文本的阅读量,并计算算术平均数;最后,将每个主题的阅读量作为社会大众的社会关注度。

本文使用Python中的SnowNLP来计算社会大众对社会主题的情感分数[45]。具体过程如下:首先,根据先验概率和条件概率,使用朴素贝叶斯算法计算每个词语对于正面情感和负面情感的概率;其次,根据文本-主题概率得到每篇文本所属每个主题的概率,依据每个文本所属主题概率大小并结合文本具体内容,匹配主题与文本;再其次,根据文本每个句子中所有词的情感极性进行加权平均,计算每个句子的情感分数,将每个句子的情感分数加权平均得到每个文本的情感分数,从而基于主题与文本的匹配结果计算每个主题的情感分数;最后,设置情感分数阈值,将高于该阈值的主题视为社会大众具有积极态度的社会主题,将低于该阈值的主题视为社会大众具有消极态度的社会主题,将等于该阈值的主题视为社会大众具有中性态度的社会主题。

在计算每个句子的情感分数时,需要将该句子中的所有词语的情感极性进行加权平均,从而得到该句子的情感分数。每个词语的权重大小根据其出现频率而确定,频率较大的词语权重较大,频率较小的词语权重较小,这样可以更好地反映每个词语在整个句子情感分数计算中的贡献程度。句子的情感分数计算公式为

其中,sen为情感分数;wi为词语的权重;pi为情感概率;n为一个句子中包含的词语个数。

在计算每个文本的情感分数时,同样需要将每个句子的情感分数进行加权平均,从而得到每个文本的情感分数。每个句子的权重根据其出现在文本中的位置而确定,出现在文本首句和末句的句子权重较大,并将剩余权重分配至其他句子中。这样可以更好地反映每个句子在整个文本情感分数计算中的贡献程度。文本的情感分数计算公式为

其中,pas为情感分数;seni为句子的权重;vi为句子的权重;m为一个文本中包含的句子个数。

2.4.3 二维坐标构建与技术主题分类

以主题关注度为横坐标、以主题情感分数为纵坐标构建二维评价坐标。基于各社会主题的指标大小,将各社会主题映射到二维坐标中。通过社会主题与技术主题进行匹配映射,从而将技术主题按照高关注度-积极态度、高关注度-消极态度、低关注度-积极态度以及低关注度-消极态度分为4类。

技术主题与社会主题之间的匹配映射是基于二者的语义相似度实现的,其具体计算过程如下:首先,使用BERT模型对技术主题与社会主题分别进行编码以得到其向量;其次,按照余弦相似度的计算公式计算社会主题与每个技术主题之间的余弦相似度;最后,将技术主题与每个社会主题中余弦相似度最大者进行匹配映射,并基于相关领域专家知识对其进一步阐释说明。

2.4.4 基于社会主题的潜在颠覆性技术识别

本文依据社会大众对技术主题的关注度与情感倾向,预测未来技术主题的颠覆性潜力。技术主题的关注度大小与情感倾向和数量广泛的社会大众自身利益息息相关,即技术主题的关注度大小与情感倾向在一定程度上代表了社会影响力。而颠覆性技术相较于主流技术,能够改变技术的发展方向,离不开其对社会产生的巨大影响,从而得到大规模的扩散并被社会广泛接受[46]。因此,社会大众对技术主题的关注度大小与情感倾向和其颠覆性潜力有很大的关系。

(1)高关注度-积极态度的技术主题:高关注度意味着社会大众持续关注该技术主题,积极态度意味着社会大众对该技术主题较为满意。该类技术主题可能拥有较大的技术先进性,从而导致拥有较高的社会影响力,并且未来有较大可能性快速占据市场,完成颠覆。

(2)高关注度-消极态度的技术主题:高关注度意味着社会大众持续关注该技术主题,而消极态度意味着社会大众对该技术主题不太满意。该类技术主题往往产生于低端市场,可能初始性能不高,导致社会大众对其态度消极,但因其便宜、简单、方便等特点而受到广泛关注。未来可能会借助成本优势与市场优势向主流市场侵蚀并完成颠覆[47]。

(3)低关注度-积极态度的技术主题:低关注度意味着社会大众尚未关注或较少关注该技术主题,而积极态度意味着社会大众对该技术主题较为满意。该类技术主题具有边缘消费者看重的全新功能或属性,未来,随着性能和功能的不断完善,逐渐满足多数大的需求,有可能完成颠覆[48],也可能因无法满足用户而不再受到关注。

(4)低关注度-消极态度的技术主题:低关注度意味着社会大众尚未关注或较少关注该技术主题,消极态度意味着社会大众对该技术主题不太满意。该类技术主题可能处于萌芽期,因技术的不完善使得人们对其态度不够积极,加之时间原因暂时还未受到广泛关注。但在技术发展的早期,即使颠覆性技术也呈现“弱信号”的特征[49],因此,对于该类技术主题,还需等待时间的验证,亦不能排除其颠覆性的潜力。

综上所述,本文认为高关注度-积极态度、高关注度-消极态度以及低关注度-积极态度的技术主题更有可能成为颠覆性技术;而低关注度-消极态度的技术主题具有较大不确定性,需要等待时间的验证。

3 案例应用——以医疗机器人为例

医疗机器人的出现,打破了常规医疗的现状,有力地推动了医疗技术的变革,越来越多的企业加入医疗机器人产业化队伍[50]。医疗机器人由于具有交叉性、前瞻性等特点,很有可能引起新一轮技术革命,从而催生一系列颠覆性技术[51]。尽管我国近年来大力扶持医疗机器人产业的发展,但是与世界先进水平仍存在一定的差距[52],亟须开展潜在颠覆性技术的识别,以帮助国家和企业明晰未来的发展方向,进而缩小与发达国家的技术差距。鉴于此,本文选择医疗机器人领域进行实证分析,以阐释上述方法的应用过程,并验证其合理性。

3.1 医疗机器人的专利数据收集及数据集划分

本文采用incoPat数据库(http://www.incopat.com)为专利数据源。经初步检索,得到10652项专利。对原始数据进行数据清洗,去除相关度低和重复的专利,最终得到9300项专利。具体检索时间、检索表达式等信息如表2所示。

表2 医疗机器人的专利检索信息

依据2.1节提出的数据集划分方法,本文按时间段进行划分。2011年1月1日至2016年12月31日的专利数据为数据集1,将其称为2020年候选颠覆性技术,共有1982项专利;2017年1月1日至2022年12月31日的专利数据为数据集2,将其称为2026年候选颠覆性技术,共有7318项专利。

3.2 医疗机器人的颠覆性技术特征选择

3.2.1 医疗机器人的指标选取及体系构建

按照2.2.1节中提出的方法提取训练集中专利样本的专利指标。训练集共1982个样本,其中每一个样本都有8维数据,包含8个专利指标的数值。由于各指标数值跨度较大,直接使用该数据会影响模型的训练效果[53]。因此,本文对所有专利指标数值中不为0的取对数处理,数值为0的取0。训练集中各专利样本指标描述性统计如表3所示。

表3 专利样本各指标描述性统计

3.2.2 医疗机器人的专利样本技术影响力评估

按照公式(7)和公式(8)计算每个专利样本的技术影响力,并借助XGB(extreme gradient boosting)模型开展回归分析,以确定不同技术影响力阈值大小对模型预测准确率的影响,从而确立最佳技术影响力阈值。具体结果如图8所示。

图8 不同技术影响力阈值大小对模型预测准确率的影响

由图8可知,在阈值为1.3时,模型预测准确率达到峰值,随后处于下降状态,因此,本文将技术影响力大小的阈值设为1.3,并将技术影响力不低于1.3的专利样本贴上标签“1”,将剩余专利样本贴上标签“0”。部分专利样本的部分指标如表4所示。

表4 部分专利样本的技术影响力

3.3 医疗机器人的候选颠覆性技术预测及主题提取

3.3.1 医疗机器人的深度学习模型训练

由于高影响力和低影响力的专利样本比例为1∶11,样本的不均衡导致Bi-LSTM模型无法充分学习到高影响力专利样本的特征。为了进一步提升Bi-LSTM模型的学习效果,本文在训练集中复用正样本专利数据,使得用于构建模型的训练集中正负样本相对均衡[54]。经训练,最终确定了各模型参数,具体参数设置情况如表5所示。

表5 Bi-LSTM模型训练参数设置

训练完毕之后,需要检验模型的拟合程度。将Bi-LSTM训练集的拟合效果与真实值进行对比可知,Bi-LSTM的拟合程度整体上与真实值差别不大,可以用于下一阶段的候选颠覆性技术预测。具体对比结果如图9所示。

图9 Bi-LSTM的预测结果与实际结果对比(彩图请见http://qbxb.istic.ac.cn/)

3.3.2 医疗机器人的深度学习模型测试

为了评估Bi-LSTM训练效果,按照2.3.2节的公式(9)~公式(12)分别计算准确率、精确率、召回率和F1-score指标,并与RF(random forest)、 VSM(vector space model)与LR(logistic regression)等模型进行对比。评估指标如表6所示。

表6 Bi-LSTM、RF、SVM与LR模型训练效果对比

由表6可知,Bi-LSTM在各项指标表现上均优于其他模型,即该模型在候选颠覆性技术分类任务中整体性能更高,能够更好地拟合候选颠覆性技术指标与其未来技术影响力之间复杂的非线性关系。因此,可将Bi-LSTM用于2026年候选颠覆性技术的预测。

3.3.3 医疗机器人的候选颠覆性技术预测

提取数据集2中的专利各指标数据,经由训练完成的Bi-LSTM模型,得到了数据集2中各专利的未来技术影响力。数据集2中共有7318项专利,预计有395项专利具有高技术影响力,并视为候选颠覆性技术,占预测集专利数量的5.4%。

为了进一步明晰候选颠覆性技术的技术主题及主题关键词分布信息,本文使用BERTopic主题建模来提取候选颠覆性技术的技术主题及主题关键词。在此基础上,结合领域专家意见,可得到9个技术主题。各主题代表的技术领域清晰,具有较好的聚类效果,因此,可根据各技术主题所含主题关键词的内容进行命名。具体如表7所示。

表7 医疗机器人候选颠覆性技术主题及主题关键词

由表7可知,医疗机器人领域候选颠覆性技术的技术主题主要分布在区块链技术、智能感知技术、医学影像采集技术、上下肢外骨骼康复、血管介入手术、自主导航与云服务技术、神经外科手术、柔性微型医疗技术和神经网络技术9个技术主题中。为了进一步提升识别的准确性,需要结合社交媒体数据对其加以研判。

3.4 医疗机器人的潜在颠覆性技术识别

3.4.1 医疗机器人的社交媒体数据获取及社会主题提取

随着互联网的发展,社会大众逐渐在社交媒体中发表有关潜在颠覆性技术的推文,这些推文包含社会大众对其的情感倾向、认知看法与未来期望等,因此具有重要的研究价值[55]。综合考虑数据的可获得性与质量等特点,本文选择以微信公众号中的推文、小红书中的笔记以及知乎中的回答作为社交媒体数据。各社交媒体平台的检索信息及特点如表8所示。

表8 各社交媒体平台的检索信息及特点

因各类型数据庞大,本文借助Python来爬取与医疗机器人相关的社交媒体数据。经数据预处理,滤除重复数据以及与主题相关度不高的数据等,最终获得668条有效推文。具体检索关键词、检索时间等信息如表9所示。

表9 医疗机器人的微信公众号推文检索信息

使用BERTopic主题建模提取上述微信公众号推文、小红书笔记以及知乎回答中的社会主题及主题关键词,初步得到33个主题,删除无关主题及低相关度主题,最终得到7个主题。具体结果如表10所示。

表10 医疗机器人相关的微信公众号社会主题及主题关键词

3.4.2 医疗机器人的社会主题关注度与情感分数计算

基于文本-主题概率矩阵,结合相关领域专家意见,将文本匹配到不同社会主题下。按照2.4.2节提出的方法,分别计算不同社会主题的关注度及情感分数,并将情感分数的算术平均值设为情感分数阈值。经计算,情感分数的阈值为0.65,故将S1、S2、S3、S4主题设为积极态度,将S5、S6、S7主题设为消极态度,各社会主题的关注度与情感分数如表11所示。

表11 社会主题的关注度及情感分数

3.4.3 二维坐标构建与医疗机器人技术主题分类

根据关注度与情感分数两个指标,以情感分数为纵坐标、以关注度为横坐标构建二维评价坐标,以更直观、清晰地了解社会大众对于医疗机器人领域相关主题的关注度与情感分数。依据各指标的平均值,将该二维坐标划分为4个象限,分别是高关注度-积极态度、高关注度-消极态度、低关注度-积极态度和低关注度-消极态度。其中,医疗机器人的辅助治疗属于高关注度-积极态度,处于S2区域;机器人的智能化与精准治疗、临床机器人应用与系统开发以及机器人在外科手术中的应用属于低关注度-积极态度,处于S3区域;其余3个主题属于低关注度-消极态度,处于S4区域。具体情况如图10所示。

图10 医疗机器人社会主题的关注度与情感倾向二维评价坐标

为了将技术主题与社会主题进行匹配映射,需计算其余弦相似度。按照2.4.3节提出的方法,利用BERT模型对其进行编码以得到其向量化表示,并计算每个技术主题与社会主题之间的余弦相似度。医疗机器人技术主题与社会主题之间的余弦相似度计算结果如表12所示。

基于表12的计算结果,依次统计各个技术主题与每个社会主题之间的余弦相似度大小,并将技术主题与社会主题之间余弦相似度中最大者进行匹配映射,并依托相关领域专家知识,对其进一步阐释说明。具体来说,神经外科手术需要非常细致和精细的操作,与机器人在外科手术中的应用相关,故将其匹配;神经网络技术可以帮助机器人系统的学习和优化,从而实线个性化与准确治疗,与机器人的智能化与精准治疗相关,故将其匹配;智能感知技术可以检测患者的生理状态、行为习惯等信息,从而实现更加准确和个性化的治疗效果,与机器人的智能化与精准治疗相关,故将其匹配;区块链技术可以用于记录和管理医疗数据的安全性,并实现数据的可追溯性,从而为医疗机器人提供更加丰富、准确的数据信息,提升机器人的诊断与治疗效果,与医疗机器人的辅助治疗相关,故将其匹配;柔性微型医疗技术可以帮助医生在狭小的空间内对患者进行检查或治疗,与医疗机器人的辅助治疗相关,故将其匹配;自主导航与云服务技术可以帮助医生远程观察并操作临床机器人查看医疗影像与数据以及远程指导手术过程等,与临床机器人应用与系统开发有关,故将其匹配;医学影像采集技术可以帮助机器人获取更加清晰、准确的医学影像系统,与机器人在医学影像技术应用相关,故将其匹配;上下肢外骨骼康复是一种常见的机器人辅助康复方法,与运动康复与机器人技术应用有关,故将其匹配;血管介入手术通常需要在血管内进行精细的操作,与微创外科技术与机器人应用有关,故将其匹配。

为了进一步明晰技术主题与社会主题之间的匹配映射关系,以社会大众关注度大小为横坐标、以社会大众情感态度为纵坐标构建二维坐标系,如图11所示。其中,社会主题中的医疗机器人的辅助治疗因具有较高关注度和较为积极的态度,位于坐标系中的第一象限;又因上述的社会主题与技术主题的匹配结果,将该主题与技术主题中的区块链技术、柔性微型医疗技术进行匹配映射;其余社会主题所处的象限以及相匹配映射的技术主题同理。

图11 医疗机器人技术主题与社会主题匹配映射

3.4.4 医疗机器人潜在颠覆性技术识别

根据上述社会主题二维评价与技术主题和社会主题匹配结果,可将技术主题划分为4类,分别是高关注度-积极态度、高关注度-消极态度、低关注度-积极态度和低关注度-消极态度,具体结果如表13所示。

表13 医疗机器人候选颠覆性技术主题所属类别

依据各技术主题的指标大小,对医疗机器人领域相关技术主题具体阐释如下。

具有高关注度-积极态度的技术主题有2个,分别是柔性微型医疗技术与区块链技术。该类技术主题未来有较大可能性快速占据市场,完成颠覆。

(1)柔性微型医疗技术可以使机器人通过微小的切口或者腔道进行胃肠道、肺部等部位的检查和治疗,相较于传统的内窥镜,柔性微型医疗机器人更加灵活、精确,并减少了手术对患者的伤害和恢复时间。除此之外,柔性微型机器人还可以通过柔性身体结构,实现对患者关节、肌肉等部位的康复治疗。

(2)区块链技术可以为机器人提供更加安全、可靠的数据加密和存储方式,以确保患者个人数据的安全;可以通过智能合约实现医生的资质认证和访问权限控制,从而确保会诊过程的安全性和可信度。除此之外,还可以帮助机器人实现医疗数据的共享和交换,促进病例数据和治疗方案的共享和优化。

具有低关注度-积极态度的技术主题有4个,分别是神经外科技术、智能感知技术、神经网络技术以及自主导航与云服务技术。该类技术主题随着未来性能和功能的不断完善,若能够逐渐满足大部分社会大众的需求,则有可能完成颠覆。

(1)神经外科技术可以帮助机器人实现高精度的运动和立体成像技术,从而实现对神经系统病变部位的准确定位和操作;可以帮助机器人通过MRI(magnetic resonance imaging)和CT(computed to‐mography)等成像技术,实现对脑功能区的影像采集和分析。除此之外,神经外科机器人通过植入电极等装置,实时监测神经元活动和神经信号传导情况。

(2)智能感知技术可以帮助机器人识别患者的身体状态、疾病类型等,进而改变室内温度、适度等参数,提升患者的舒适度和治疗效果,从而实现精准的诊断和治疗。除此之外,还可以帮助机器人智能获取医生的指令,同时将患者的信息同步反馈给医护人员,以便及时调整治疗方案。

(3)神经网络技术可以帮助机器人通过对大量医学数据的分析和处理,预测疾病发展趋势,评估患者疾病风险,提供个性化的治疗方案和干预措施。除此之外,还可以帮助机器人自动学习并模拟医生的手术技巧,提升手术的精度和安全性。

(4)自主导航与云服务技术可以帮助机器人在医院内部自主移动,从而实现对患者与医生的快速响应与服务。除此之外,该技术也可以帮助机器人在云端通过深度学习算法和人工智能技术,对大量的病理图片进行识别和分析,从而提供更准确的病理学结果。

具有低关注度-消极态度的技术主题有3个,分别是医学影像采集技术、上下肢外骨骼康复与血管介入技术。对于该类技术主题,还需等待时间的验证,不能排除其颠覆性的潜力。

(1)医学影像采集技术可以使机器人通过不同的成像技术,获取人体内部的结构、病变及异常情况,从而帮助医生实现精准定位、准确诊断与治疗。除此之外,还可以对人体各个部位的影像进行三维重建,辅助医生进行手术规划与操作,既提高了手术的精度与效率,又减轻了患者的痛苦与风险。

(2)上下肢外骨骼康复可以使机器人通过机械和电气相结合的控制方式,协助患者进行康复训练;可以通过内置的传感器和计算机视觉技术,对患者的步态进行分析和识别。即上下肢外骨骼康复机器人有助于改善患者日常生活中的行走和站立能力,提高康复效果和生活质量。

(3)血管介入技术可以帮助机器人通过微小切口或穿刺进入血管内部,完成血管内手术;或是通过导管和气囊等装置将血管扩大,从而缓解血管狭窄造成的症状。除此之外,该技术还可以帮助机器人进行神经介入治疗,利用导管和支架等装置,恢复闭塞性动脉供血,保护受损脑细胞,从而促进患者的恢复。

4 结论与展望

本文提出了一种基于深度学习模型,融合专利数据和社交媒体数据来识别潜在颠覆性技术的方法,并以医疗机器人领域为例进行了验证,是潜在颠覆性技术识别的重要补充。

本文的学术贡献主要体现在以下两个层面。

一是在候选颠覆性技术预测阶段,本文依托Bi-LSTM挖掘出隐藏在海量专利数据中的颠覆性技术关键特征,并运用这些特征识别候颠覆性技术。该方法不仅能够有效挖掘隐藏在海量数据中的潜在颠覆性技术,并且相较于以往人工归纳颠覆性技术特征的方法,具有更高的效率、更低的成本以及更高的客观性。

二是在潜在颠覆性技术识别阶段,提出了一种融合专利数据与社交媒体数据的潜在颠覆性技术识别方法,该方法综合考虑了技术影响力、社会大众关注度与社会大众情感倾向等,进而将潜在颠覆性技术划分为高关注度-积极态度、高关注度-消极态度、低关注度-积极态度以及低关注度-消极态度4种类型,并对其颠覆性潜力做出了阐释,是现有颠覆性技术识别方法的重要补充,能够为政府决策、产业投资等提供参考依据,具有重要的理论和实践价值。

本文尚存在以下局限性。虽然以医疗仪器人为例验证了本文方法的可行性,但缺乏对多领域技术的系统研究,未来研究有待于扩展补充其他领域的专利数据源,以扩大潜在颠覆性技术识别所涵盖的领域范围,进一步提升研究方法的普适性。此外,本文采用的数据主要来自专利数据和社交媒体数据,虽然这些数据包含了大量的技术信息和社会信息,但仍存在不足;未来可以考虑引入更多的数据源,如新闻媒体、科技网站等,以获得更全面和多样化的数据。

猜你喜欢
关注度影响力专利
专利
发明与专利
天才影响力
雄安新区媒体关注度
全国两会媒体关注度
黄艳:最深远的影响力
暴力老妈
“王者”泛海发布会聚焦百万关注度
3.15消协三十年十大影响力事件
传媒不可估量的影响力