戚湧 孙嘉烨
摘要摘 要:全球汽车行业正在经历巨大变革,电动化、智能化和网联化将成为未来汽车技术发展的潮流。智能网联汽车是国家重点发展的战略性新兴产业,将汽车、电子和信息技术深度融合在一起,对于推进我国制造强国和网络强国建设具有重大意义。如何用科学方法来识别智能网联汽车领域技术主题,指导智能网联汽车产业技术选择,给出相应的政策建议,具有重要的学术价值与应用前景。首先总结归纳了国内外的相关研究,阐述了技术主题识别、技术演化的理论基础,并构建相应的研究模型与框架;然后对智能网联汽车专利数据进行检索分析,再利用LDA模型完成相关专利文献的主题识别,并在此基础上构建HMM模型分析相应技术主题的演化关系;最后得出该领域技术主题的演化路径及规律。针对智能网联汽车领域共识别出20个技术主题,并以此构建技术主题演化关系有向网络图,可为相关企业及研发机构提供决策参考。
关键词关键词:技术主题识别;技术演化;智能网联汽车;专利文献
中图分类号中图分类号:U495;G255.53
文献标识码:A
DOIdoi:10.3969/j.issn.1672-2272.202401053
英文标题Research on the Theme Identification and Evolution of Intelligent Connected Vehicle Technology from the Perspective of Patents
Qi Yong, Sun Jiaye
(Nanjing University of Science and Technology of Intellectual Property, Nanjing 210094,China)
英文摘要Abstract:As the era progresses, the global automotive industry is experiencing significant transformations, with electrification, intelligence, and connectivity emerging as future trends in automotive technology. Intelligent connected vehicles, as a key strategic emerging industry, amalgamate automotive, electronic, and information technologies, playing a crucial role in promoting Chinas ambitions to become a powerhouse in manufacturing and networking. This area also represents a significant aspect of technological research. Thus, applying scientific methods to identify technological themes in the intelligent connected vehicle sector, guiding the industrys technological decisions, and providing relevant policy recommendations hold substantial academic and practical value. This paper begins by summarizing relevant domestic and international research, elucidating the theoretical underpinnings of technology theme identification and evolution, and establishing the corresponding research models and frameworks. It then analyzes intelligent connected vehicle patent data, employs the LDA model for theme identification in related patent literature, and constructs an HMM model to examine the evolutionary relationships of these technology themes. The study ultimately delineates the evolutionary trajectory and patterns of technological themes in this field. In the realm of intelligent connected vehicles, 20 technical themes were identified, and a directed network graph depicting the evolution of these themes was created. This provides strategic guidance and support for relevant enterprises and research and development institutions.
英文关键词Key Words:Technical Subject Identification; Technological Evolution; Intelligent Connected Vehicles; Patent Documents
随着时代的发展,全球汽车行业正在经历巨大变革,电动化、智能化和网联化正成为未来汽车技术发展的潮流。智能网联汽车结合了传统汽车和网联汽车技术的优势,是一种跨越汽车、通信和安全技术领域的创新型产品,具有广泛的应用前景。作为汽车、电子、信息、交通等领域深度融合的战略新兴产业,智能网联汽车将在未来的技术革命和工业转型中扮演关键角色,对于推进我国制造强国和网络强国建设具有重大意义。准确把握相关技术领域中的核心技术或技术体系,能够有效获得竞争优势与市场价值,而这些通常蕴藏于专利、研发成果、专有技术之中[1]。如何对智能网联汽车领域内众多类型的技术成果进行技术的有效识别和分析,已经成为当下研究的重点。
专利文献作为技术创新过程中一种独特的产物,承载着专业技术领域的技术要点与技术内容信息,其内容详实准确且具有一定的长期性、广泛性和趋前性[2],可以提供有价值的信息并有助于了解技术创新中的核心内容,能够有效反映应用研究与应用创新。专利数据包含结构化和非结构化两个部分,并且文献数量庞大,需要选择科学合理的研究方法和分析框架。技术主题作为技术文献的主旨和核心,具有一定的代表性,其演变也遵循着一定的内在规律[3]。通过对专利文献信息的分析与挖掘,识别智能网联汽车领域的技术主题,在此基础上分析这些技术主题的发展状态和演变趋势,进而指导智能网联汽车相关产业的技术选择,实现智能网联汽车产业层面技术预见,具有重要的研究意义。
1 相关研究
1.1 技术识别
目前,国内外很多学者针对不同技术领域开展了各种技术类型的识别研究,比较常见的是通过构建相应的指标体系并基于专家经验来完成技术的识别。
李政等[4]通过使用尖点型突变方程,建立能够预测关键技术的模型,从而实现对关键技术的识别和预见。Porter等[5]通过建立一个指标体系,从燃料电池等领域的专利文摘集合中筛选出关键技术主题。Lee等[6]建立多指标体系,纳入了正向引用、先验信息和专利家族成员数等指标,来确定关键技术。杨大飞等[7]通过构建核心技术:“三力”模型,建立核心技术识别指标体系和识别模型,并基于OLED平板显示产业进行实证研究。此类方法受到一定程度上主观因素的影响,而且比较依赖于相关方面的专家资源。为了降低此类影响,一些学者选择基于图与网络分析的方法,从技术关联的视角完成技术识别,比如Peng等[8]通过使用英文专利数据库,获取GPS技术方面的专利信息,并将这些信息与社会网络相结合,构建引文网络以识别共性技术。李瑞茜和陈向东[9]通过建立非对称的技术知识传递网络研究有效发明专利之间的相似性,并通过分析这些相似性来确定技术之间的相互作用,从而识别出核心技术。纪亚琨等[10]基于专利网络视角,构建“领域-发明-主题”多层分析结构模型以识别潜在颠覆性技术,并以自动驾驶领域为例验证了模型的可行性和有效性。也有一些学者是在以上研究的基础上,通过文本分析进一步获取相关技术,比如张维冲等[11]以区块链为例,面向多种不同科技文献提出基于摘要的主题解析方法,获取主题词并进行数据融合与主题关联分析。马永红等[12]以专利文献为基础,结合LDA算法完成主题聚类,通过技术的共现率来分析技术主题的共性,并利用社会网络分析方法来确定关键技术。吕鲲等[13]通过区块链金融的专利数据,利用组合分词方法和LDA模型识别关键技术主题,并根据产业关键技术特征衡量出区块链金融领域内关键技术。从上述相关研究中可以看出,多数学者基于专利数据展开分析,将多种理论和研究方法相结合,并通过构建相应的模型以实现不同研究领域的技术识别。近些年为了避免相关领域专家资源获取不便的情况,以客观定量分析的方法成为主流,非常具有参考价值。因此,本研究拟选取目前有关技术识别中较为常用的文本分析的相关方法,在此基础上加以改进,选取智能网联汽这一领域实现技术主题的识别。
1.2 技术演化
关于技术演化,国内外学者从多个视角利用不同方法进行了分析论证。大多数学者从专利视角出发,通过构建相应的引文网络展开分析,如Oh等[14]基于专利网络的动态特征,构建了引用专利关系网络,利用 USPTO专利数据对其特征进行研究,可知稳健技术趋势计算的结论与技术发展的历史趋势基本一致。Yoon & Magee[15]利用专利文献及引用关系对技术发展趋势进行了分析,结果显示,对技术发展的规划与评价有一定的参考价值。杨武等[16]以专利家族为研究视角,阐述技术路径动态演化过程中的路径依赖以及受到的干扰,并提出一种修正技术演化主路径的新思路。一些学者在此基础上结合语义文本挖掘进行相关研究,比如李欣等[17]针对目前在新兴技术演化轨迹研究中存在的不足,提出了基于SAO结构语义挖掘的新兴技术演化轨迹分析方法。周源等[18]利用科技文献的文本与引用信息,构建引用网络来进行拓扑聚类,以主题聚类结果为基础,结合各时段网络社区之间的关联,对技术演化路径进行分析。李子彪和张莉[19]借助LDA模型全面挖掘钢铁材料领域技术主题,深入考虑主题在强度、内容方面的动态演化过程,并结合我国工业化发展阶段绘制相关路线图。储节旺等[20]利用专利分析方法与主题模型绘制了颠覆性技术整体演化的路径,以把握技术发展整体态势。伊惠芳等[21]以融入主题生命周期和技术熵要素的分析方法来探析石墨烯技术演化路径,从技术主题状态、主题演化强度变化及主题内容3个维度进行全面分析。李乾瑞等[22]以颠覆性技术为研究对象,引入主题-时序分析和专利引文网络分析,提出了基于突变-融合视角的颠覆性技术主题演化分析模型。以上专家学者在针对技术演化和发展趋势的研究中,以图与网络分析为基础的相关研究方法已经成为主流,但针对技术主题演化的内涵与本质的相关探讨较少。因此本文在考量前文技术识别的相关研究方法后,将主题模型与图与网络分析的方法相结合,对智能网联汽车技术演化进行分析,根据智能网联汽车技术领域特点融入技术主题的演化内涵,以此发掘技术演化路径。
2 模型构建
本文将隐含狄利克雷分布(LDA)和隐马尔可夫过程(HMM)相结合,提出一种基于LDA-HMM的智能网联汽车技术主题识别和演化研究分析模型。通过 LDA主题模型对专利文献数据进行主题建模,训练模型生成技术主题,避免了人工标注法引起的效率和精度问题;在此基础上结合技术主题演化内涵与本质,引入包含双重随机过程的隐马尔可夫模型,结合智能网联汽车技术领域特点,通过隐马尔可夫模型进行相关参数估计,绘制相应网络有向图。以此完成智能网联汽车技术主题识别和演化研究,挖掘技术主题的演化路径。
2.1 技术主题识别部分
LDA主题模型是一种词袋模型,利用隐含狄利克雷分布描述文档的生成,基于词语共现概率最大化以完成词语聚类,能够有效提取文档的隐含主题。在LDA主题模型中,设定专利文献内隐含的技术主题服从分布:
Dirθm|α=Г(∑Kk=1αk∏Kk=1Гαk∏Kk=1θαk-1mk(1)
其中,θmk表示专利文献m在技术主题k中的分布。对每个技术主题k生成主题词项分布Φk~Dir(β),对于每篇专利文献m,所生成的主题词分布θm~Dir(а)。对每篇专利文献中第n个词项生成主题项zmn~Multinomial(θm)和词项 wmn~Multinomial(ΦZmn),LDA模型可以表述为:
pw,z|α,β=pw|z,βpz|α=∏Kk=1Δnk+βΔβ∏Mm=1Δnm+αΔα
(2)
在“文档—主题—词汇”这一路径下,LDA根据主题个数k,在k条路径下进行吉布斯采样(Gibbs Sampling),具体概率如下:
pzi=k|zi,w∝nkm,i+αk∑Kk=1nlm,i+αk.ntk,i+βt∑Vt=1nlk,i+βt(3)
LDA模型的核心是要准确合理地设置文本集合中的隐含的主题数,因为 LDA算法本身无法自主生成最优的主题数目,所以拟通过对构造完成后的模型进行评价来选择最优的主题数量。相关研究中,以困惑度作为判断主题数的标准[23],困惑度一般被用来衡量概率模型中的预测值和样本之间的匹配情况,困惑度越小,匹配精度就会越高,从而可以对各种模型进行对比评价。在语言模型中,该方法主要涉及整句或文本的概率分布,越是专业化的语义库所呈现出的困惑度就越小。而且,LDA模型算法不能根据词语实际意义进行聚类,其主要是根据词语聚类或共现关系来判断词语之间的亲疏程度。所以,本文选择在困惑度相关方法的基础上,结合主题词分布关系和经验法则,对最优主题数的选取进行综合判别分析,具体如下。
2.1.1 困惑度判别
在LDA主题模型中,通常采用困惑度这一指标去选定合适主题数。在一般情况下,随着技术主题数目的增多,其所对应的困惑度降低,困惑度的数值可以看作是文本中每个词语所分得的似然值,在词语分布概率中:
pw=∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ(4)
式中,p(θ; α)是Dirichlet分布,p(zn | θ)是含有参数θ的多项式,p(wn | zn; β)是词的概率分布多项式。该模型的k维Dirichlet参数α=(α1, … , αk)以及矩阵β。
将困惑度模型公式化:
perplexityDtest=exp-∑mlogpwm∑mwm|(5)
将其代入得:
Dtest=exp-∑mlog∫θ∏Nn=1∑kZn=1pwn|zn;βpzn|θpθ;αdθ∑mwm|(6)
以此可知任意主题数量所对应的困惑度值。
2.1.2 主题词分布关系判别
选取合适的技术主题数并可视化后,能够发现主题词间距分布情况均匀、间距疏松、相互覆盖程度较小。主题词间距参考了Sievert等[24]的研究,将主题词距离函数设为:
r(w,k|λ)=λlogkw)+(1-λ)logkwpw(7)
此式中λ是主题k中主题词w的权重值。
2.1.3 综合判别
本文拟将困惑度判别与主题词分布关系判别法则的优点结合起来,因此采用以下方法:选择具有低困惑度的技术主题数目作为参数,并利用这些参数分别计算主题词间距,并将其可视化表示为主题词间距图,并结合以往经验判断中的“手肘法”来选取最优主题数k。
2.2 技术主题演化部分
在本文中,将相关领域技术主题的演变归因于两个方面:一是先前研发所获得的成果潜移默化地启发并支持新创意、新技术的出现;二是在第一种情形的基础上,随着客观研发环境的改变,研发创新主体改变期望而影响到所产生的研发成果,专利文献作为研究成果的载体而显现。在此引入隐马尔可夫模型,探究相关领域技术的发展历程。将隐马尔可夫模型中的隐藏状态转移关系、观测样本与各个状态之间的概率映射关系(混淆关系),与领域技术主题识别结果、各个技术主题在专利文献中的分布一一对应,通过确定隐藏的技术主题间的转移关系矩阵,从而推断出技术主题的演变方式。根据这一思路,技术主题的演变与隐马尔可夫模型之间存在的对应关系具体如图1所示。
根据上述思想,通过构建相应的隐马尔可夫模型λ=[π,A,B],表现技术主题与专利文献的关联模式,具体如下:
(1)隐马尔可夫状态序列集合。
S=S1,S2,…,SN-1,SN(8)
在本文中,N是LDA模型聚类的主题数,且这些状态Si对应了LDA主题聚类结果中的每个技术主题,他们是隐藏且无法被观测到的。
(2)隐马尔可夫可观测状态序列集合。
O=O1,O2,…,OM-1,OM9
在本文中,M是专利文献类型数,在此与技术主题数目相对应,指代了特定技术主题所对应的专利文献数占整个技术领域专利数的比重,它们可直接观测。
(3)状态转移概率分布A。
在隐马尔可夫模型中,各个状态间转换的概率,记为矩阵A=aij,其中aij表示在任意时刻t,若状态为Si,则在下一时刻(t+1)的状态为Sj的概率,在本文中矩阵A指代了研发过程中,研发主题从状态Si转移到Sj的概率,可以表示为:
aij=PSj|Si,1≤i,j≤N10
aij≥0∑Nj=1aij=111
(4)输出观测概率B。
根据当前状态获得各个观测值的概率,记为矩阵B=bij,其中bij表示在任意时刻t,若状态为Si则观测值为Oj被获取的概率,在本文中指的是历年技术主题相关专利文献占比,可以表示为:
bij=POi|Sj,1≤i≤M,1≤j≤N12
(5)初始状态概率π。
模型中隐藏状态在初始时刻出现的概率,记为π=π1,π2,…πN-1,πN,πi表示出现状态Si的概率,本文通过LDA主题识别后,将各个技术主题中主题词共现数的归一化矩阵作为πi的初始迭代值。
(6)Baum-Welch算法。
为探索研究领域的技术演化机理,即对应了隐马尔可夫模型的参数估计问题,所以用Baum-Welch算法来实现这一过程,具体如下:
输入:观测数据Ob=Ob1,Ob2,…,Obt
输出:隐马尔可夫模型参数
①初始化。
对n=0,选取aij0,bij0,πi0,得到模型λ0=(A0,B0,π0)
②递推,对n=1,2,……,
an+1ij=∑T-1t=1ξti,j∑T=1t=1γti13
bn+1ij=∑Tt=1γtjIObt=vj∑Tt=1γtj14
πn+1i=γ1i15
③终止,得到模型参数λ(n+1)=(A(n+1),B(n+1),π(n+1))
3 实证分析
3.1 专利数据获取
本文选取“南京理工大学知识产权大数据平台”对智能网联汽车专利数据进行检索分析,为全面获取智能网联汽车相关专利数据,制定了相应的检索策略。首先,根据智能网联汽车的技术架构进行技术分解;其次,确定检索要素以及检索范围,在本文中主要选取的检索要素是“关键词”和“分类号”,检索范围是“标题名称”“摘要”;最后,构建专利检索表达式,在构建过程中需要不断的阅读专利文献,增添关键词,同时排除杂质因素,确定适合的检索式。
综上所述,构建专利检索表达式:(名称,摘要+=(智能网联汽车 OR (车联网 OR 自动驾驶 OR 无人驾驶 OR 传感器 OR 控制器 OR 图像 OR 检测 OR 采集 OR 安全 OR 通信) AND 汽车)) AND (分类号=(G02C21 OR G08G1 OR G05D1 OR H04L29 OR H04N7 OR B60R16 OR E04H6 OR B62D5 OR G06K9 OR G06F17 OR G01C21 OR H04W04)) AND 申请日=(20140101 to 20221231)。依据所构建的专利检索式进行相关专利检索,在排除重复和信息不完整的专利后,共获得智能网联汽车相关专利18 759项。
3.2 智能网联汽车技术主题识别
本文选取“智能网联汽车”专利数据中的摘要进行相关研究,构建相应的LDA主题模型。因为所选取的数据库对智能网联汽车进行了专题优化,所以参考其中的关键词作为补充词典,并根据专利文本的特殊性建立停用词表,添加诸如“具有”“一类”“本实用新型”“本发明”“提出”“形成”“进行”“申请”等词语,上述词典的完善能够使得技术主题的识别结果更加准确合理。
在确认智能网联汽车技术主题的数目时,首先计算了1-25个主题数时的困惑度,并绘制“主题数—困惑度”函数图像,如图2所示。
又选取主题数16、18、21、22这几个点分别绘制主题词距离图,如图3所示。
根据主题词距离图与“主题数—困惑度”的关系函数图,并结合“手肘法”这一经验法则,可以判断最优的主题数在15~23之间,因此需要对主题数15~23之间的函数图像进行局部放大,具体结果如图4所示。
绘制主题数为20的主题词距离图,如图5所示。
综上,当相关专利文献的主题聚类结果为20时,符合困惑度较低而且主题词间距适中,所以本文选取的智能网联车辆的技术主题数为20个,利用Python中的Sklearn库获取各主题相关专利,并导出关键主题词,因篇幅所限,在此仅列出各个技术主题中前6个关键词。将主题聚类结果与《智能网联汽车技术路线图2.0》研究报告对照,可知这些主题之间的技术领域界限清楚,分类效果理想。为方便指代,本文将各个主题进行编号并命名,具体如表1所示。
基于上述结果,绘制各个技术主题所对应的专利数据分布直方图,具体如图6所示。
可以看出,智能网联汽车领域内各个技术主题所对应的专利数量各有差异,其中安全限位装置、立体车库、车载终端等技术主题具有较多的专利数量,表明该领域内的相应配套设施设备以及安全问题正在受到广泛关注,而技术主题中智能遥控、车载中控系统、电驱系统等专利数量较少,但这不能直接表明它们没有受到关注或者不重要,也可能是由于存在技术壁垒或者技术已经趋于成熟。
3.3 智能网联汽车技术主题演化
主题间之间主题词越相似,主题间出现混淆或转移概率越高[25]。在本研究中使用主题词共现分析方法,根据从智能网联汽车的主题识别结果,提取每一个技术主题中出现概率最高的前40个关键词,然后统计每两个技术主题之间关键词的共现数量,以此来衡量这些技术主题值间相似的程度,各技术主题之间共现关键词数量分布情况具体如图7所示。
由图7可知,对角线上的主题词共现数都是40,这是因为在先前LDA模型的参数设定上,每一技术主题均提取各自概率最高前40个关键词。去除对角线以后,其他数据也有一定差异,在主题1(车载终端)和主题6(移动通讯)之间共现词数最多,达到了16个,从主题相关技术研发视角来看,两个技术主题的确具有很强的技术联系,也有一些技术主题间共现词数在10个以上,这说明他们在技术上也有较强的关联性。在整个图中有51对技术主题之间共现词数量在2个以下,这证明了多数技术主题之间的相似程度较低,也从侧面验证了先前所构建的 LDA 模型中一系列参数设定是合理的,主题识别结果的准确性较高。
将主题词共现数进行归一化处理,所获得的共现词数矩阵,作为HMM模型的初始混淆矩阵及转移矩阵,具体如表2所示,因篇幅所限,表中省略了部分主题间的转移/混淆关系。
导入本文构建的技术主题演化隐马尔可夫模型中,利用 Baum-Welch算法训练HMM模型,获得最优转移矩阵。其中在Baum-Welch算法中,由于智能网联汽车是近些年才受到关注,所以针对模型中的观测序列Ob=(Ob1,Ob2,…,Obt)采用了“训练—测试”的方式。在训练数据中生成了200条数据,每条数据包含100个观测样本,在测试数据中生成30条数据以及相应的100个观测样本,经过50轮迭代后,以完成对所构建的隐马尔可夫模型的最优参数估计。具体如表3所示,由于篇幅有限,表中略去部分主题间的转移关系。
在宏观研发的进程中,转移矩阵体现出技术主题发生转变的可能性,即对应了本文研究中智能网联汽车领域内技术主题之间隐藏的相互转移关系,为了更直观地表现这一对应关系,本文利用上述矩阵数据绘制热度图,如图8所示。
总体上看,最优转移矩阵热度图中深色区域占多数,这表明大部分技术主题都有发生转移的倾向。从单一技术主题的角度来看,主题间研发的转移倾向具有不同的特点。为了进一步获取智能网联汽车领域内技术主题演化关系,提取了转移概率大于8.5%的技术主题,利用Ucinet软件建立一个转移关系网络有向图来表示技术主题的演化路径,具体如图9所示,其中箭头方向代表转移方向,线条粗细代表转移概率。
从图9可以看出,在智能网联汽车领域内技术主题的演化中,主要的技术主题节点有:智能泊车、汽车传动系统、微控制单元等,这些技术主题流入比重很高,是智能网联汽车领域内的核心技术。而且,从图9中可以找出多条技术主题的演化路径,主要的有:“汽车监测诊断技术→智能泊车→车联网→汽车传动系统→危险态势预警→车载智能空调→自动驾驶辅助”“车载智能空调→总线记录仪器→汽车传动系统→微控制单元→车联网→智能决策→安全限位装置”等技术演化方式,这一过程体现出智能网联汽车相关技术研究开发方向上的转变趋势。
其中,技术主题演化中保持自身研发方向能力较强的主题包括:自动驾驶辅助(0.566)、微控制单元(0.205)、高压电池(0.182)、安全限位装置(0.162)等,这些技术主题在演化过程中一直保持着较高的热度,是智能网联汽车相关研发过程中的热门技术节点。此外,技术主题演化过程中转移流失比重最大的主题是“图像处理”,其主要流向总线记录仪、微控制单元、汽车传动系统等方面,这是由于图像处理技术的数字化、集成化的趋势,这一功能的实现需要依赖上述技术的辅助,所以这一特定领域内的演化表现显著。
4 结论与展望
本文将LDA与HMM相结合,基于专利数据对智能网联汽车领域进行分析研究。利用LDA对智能网联汽车进行技术主题识别,将该领域划分为20个技术主题,并在此基础上引入HMM模型,将技术研发与隐马尔可夫过程相结合,从中分析智能网联汽车技术主题演化路径与规律。本文所识别出的技术主题是该领域内重要研发方向,是未来技术创新和产品竞争的重点,所构建的技术主题演化关系网络能够为相关企业及研发机构了解该领域内的技术研发趋势,提供研发决策方向,把握机会形成优势,节约资源,降低研发成本。该模型方法实现了无需专家经验的专利数据高效无监督聚类,能够快速有效地挖掘其中隐含的技术主题信息,获得关键的技术节点及技术演化趋势,为专利计量提供新的途径,也可以应用于其他技术领域。
但本研究也存在一定局限,一是在数据获取方面,仅对本国专利文献这单一维度进行采集,未来可以扩大文献收集范围,加入国内外的期刊论文和外国的专利数据,通过不同来源不同类别数据的采集和分析,完成更加严谨全面的智能网联汽车技术主题相关研究;二是针对隐马尔可夫模型中的混淆关系,即技术主题所对应的相关专利文献类型,可以进一步展开研究,选取适当的方法定量分析其中所对应的关系,比如可以借助PageRank算法确定领域内的关键技术主题。
参考文献参考文献:
[1] 韩志华. 核心专利判别的综合指标体系研究[J]. 中国外资,2010(4): 193-196.
[2] 林岩. 基于专利数据的知识计量研究评述[J]. 科技管理研究,2008(9): 91-93.
[3] 杨恒,王曰芬,张露. 基于核心专利技术主题识别与演化分析的技术预测[J].情报杂志,2022,41(7): 49-56.
[4] 李政,罗晖,李正风,等. 基于突变理论的科技评价方法初探[J]. 科研管理,2017,38(s1): 193-200.
[5] PORTER A L, GARNER J, CARLEY S F, et al. Emergence scoring to identify frontier R&D topics and key players[J]. Technological Forecasting and Social Change, 2019,146:628-643.
[6] LEE C, KWON O, KIM M, et al. Early identification of emerging technologies: a machine learning approach using multiple patent indicators[J]. Technological Forecasting and Social Change, 2018, 127(Feb): 291-303.
[7] 杨大飞,杨武,田雪姣,等.基于专利数据的核心技术识别模型构建及实证研究[J]. 情报杂志,2021,40(2): 47-54.
[8] PENG Z, YANJUN Y, LIXUE S. Recognition and evolution of generic technology in GPS industry and its enlightenment: based on patent analysis[J]. Technology Economics, 2016(12): 60-75,89.
[9] 李瑞茜,陈向东. 基于专利共类的关键技术识别及技术发展模式研究[J]. 情报学报,2018,37(5): 495-502.
[10] 纪亚琨,余翔,张奔,等. 专利网络视角下的潜在颠覆性技术识别——以自动驾驶领域为例[J]. 情报杂志,2022,41(12): 46-50,139.
[11] 张维冲,王芳,赵洪. 多源信息融合用于新兴技术发展趋势识别——以区块链为例[J]. 情报学报,2019,38(11): 1166-1176.
[12] 马永红,孔令凯,林超然,等. 基于专利挖掘的关键共性技术识别研究[J]. 情报学报,2020,39(10): 1093-1103.
[13] 吕鲲,陈箫羽,靖继鹏. 基于组合分词方法和LDA模型的区块链金融产业关键技术识别研究[J]. 图书情报工作,2022,66(19): 110-121.
[14] OH G, KIM H-Y, PARK A. Analysis of technological innovation based on citation information[J]. Quality & Quantity, 2017, 51(3SI): 1065-1091.
[15] YOON B, MAGEE C L. Exploring technology opportunities by visualizing patent information based on generative topographic mapping and link prediction[J]. Technological Forecasting and Social Change, 2018, 132: 105-117.
[16] 杨武,陈培,GAD DAVID. 光刻机产业技术扩散与技术动态演化——对“卡脖子”技术的启示[J]. 中国科技论坛,2022(9): 73-84.
[17] 李欣,谢前前,黄鲁成,等.基于SAO结构语义挖掘的新兴技术演化轨迹研究[J]. 科学学与科学技术管理,2018,39(1): 17-31.
[18] 周源,杜俊飞,刘宇飞,等. 基于引用网络和文本挖掘的技术演化路径识别[J]. 情报杂志,2018,37(10): 76-81.
[19] 李子彪,张莉. 基于LDA模型的钢铁材料专利技术主题演化研究[J]. 科技管理研究,2020,40(24): 175-183.
[20] 储节旺,李佳轩,安怡然. 基于专利分析的颠覆性技术演化与预测研究——以量子信息技术为例[J]. 科技进步与对策,2023,40(22):130-140.
[21] 伊惠芳,吴红,李昌,等.基于主题生命周期与技术熵的石墨烯技术主题演化研究[J]. 情报杂志,2019,38(2): 64-70.
[22] 李乾瑞,郭俊芳,黄颖,等. 基于突变-融合视角的颠覆性技术主题演化研究[J]. 科学学研究,2021,39(12): 2129-2139.
[23] BLEI D M. Probabilistic topic models[J]. Communications of the ACM, 2012, 55(4): 77-84.
[24] SIEVERT C, SHIRLEY K. LDAvis: a method for visualizing and interpreting topics[M]. Baltimore: Association for Computational Linguistics,2014.
[25] 林超然. 基于专利数据挖掘的关键共性技术识别及预测研究——以3D打印为例[D]. 哈尔滨: 哈尔滨工程大学,2020.
责任编辑(责任编辑:吴 汉)