张桐赫,何海燕,孙磊华,张亚东
(北京理工大学管理与经济学院,北京 100081)
在 “技术封锁”与 “技术脱钩”的复杂国际竞争格局下,全球原本紧密合作的产业链和供应链遭到严重冲击,芯片领域作为核心制造业高地之一,日益成为世界各国竞争与攻关的关键领域。在芯片产业链的上中下游包含许多关键核心技术,是技术领先国进行技术设限的最重要领域之一,中国的关键核心技术自主可控有利于维护全球产业链供应链安全稳定,避免技术碎片化,推动全球技术创新版图重塑。在技术竞争视角下分析中国关键核心技术堵点并进行精确识别,对有效防范重大科技风险、打赢关键核心技术攻坚战、保障产业链自主可控具有重要作用,为中国牢牢把握核心技术发展的主动权提供分析框架和数据支撑。
当前技术优势国意图垄断先进科技,维护自身科技霸权,主要以申请专利为手段,运用自身的先发科技优势和自主创新能力持续地扩大其技术优势[1]。专利作为最新技术情报是技术信息最有效的载体之一,包括了九成以上的技术特性,相比其他平台信息更新具有很强的规范性与时间优势[2],被普遍认为是衡量技术合理、适当和可靠的指标[3],对专利的挖掘、对比和研究能够为技术管理决策提供支撑[4],本文以专利表征技术探讨相关问题,研究中美之间的技术竞争格局,进行核心技术产业链定位,最终识别核心技术堵点,对打赢关键核心技术攻坚战有重要指导意义。因此本文构建系统分析框架,结合文本分析和LDA主题建模对中外技术布局与产业链关系进行对照分析,对中国关键核心技术堵点进行深度识别与产业链定位。
专利承载了技术的主要数据,70%的发明首先出现在专利申请上[5],专利数据因其规范性,已经成为分析技术发展态势的重要、可靠的数据来源,关键核心技术识别离不开对专利的甄别与分析。基于专利视角的关键核心技术识别,主要可以分为两个方向。
第一个方向是专利外部特征指标评价法,通过直接引用及同被引、耦合和共类等特征进行核心技术识别。主流的指标评价有3类:①依托专利引用频次、专利族数、专利权数量等直接指标进行核心技术识别[6-7]。②进一步构建专利指标体系综合识别核心技术;杨大飞等[8]构建核心技术 “三力”模型,包括发展力、控制力和创新力指标;郑思佳等[9]从技术性、经济性和法律性3个维度筛选核心专利。罗天宇[10]构建多个专利指标,使用AHP法构建判别体系识别核心技术。③使用社会网络分析法识别核心技术,即通过网络节点特征判断其重要性,将专利代码作为网络节点,构建共现或引文网络识别核心技术。主要有IPC共现分析法[11-12]以及考虑技术交叉影响的改进分析法等[13-15]。
第二个方向是通过自然语言数据分析算法进行文本挖掘,主要基于专利中的文本信息,题名、摘要等识别核心技术主题,随着机器学习算法的不断发展,该方法也逐渐受到越来越多学者的重视。主要通过聚焦专利关键词,如应用SAO 网络结构[16-18]、TF-IDF 算法[9,19]、经验模态分解EMD[20]等方法对海量专利数据进行关键抽取和识别;LDA主题模型作为一种主流的文本主题建模方法应用广泛且关键词识别较为准确,成为核心技术文本识别的主要方法之一,任佳妮等[21]基于论文专利摘要特征提取,采用LDA主题建模和专家咨询法对医疗机器人领域的新兴技术进行识别。一些学者提出方法构建指标进一步判别,周云泽等[22]使用LDA主题模型识别技术主题,构建包含专利信息的主题强度、主题新颖度指标综合判别。席笑文等[23]基于LDA主题模型构建专利权人-专利-技术主题三层概率分布,识别关键核心技术。一些学者也对LDA的优化模型在核心技术识别中的应用进行研究,王秀红等[24]提出BERT-LDA主题模型,增加上下文语义信息结合专利数据对农业机器人领域的关键共性技术进行识别。裘惠麟等[25]使用LDA2vec模型,优化上下文语义向量,结合专利等多元数据识别技术热点。
国际竞争格局下,技术竞争态势分析对于把握技术发展方向、发掘国内外研究热点,确定自身技术研发战略等具有重要作用,当前已有不少研究以专利数据为基础评估技术竞争态势。主要是通过专利总体申请情况、时间分布、IPC分类领域、专利信息共现与专利引证等角度直接进行竞争分析[26-27]。也有通过构建模型,以组合指标维度分析竞争情报,张子岩等[28]结合技术活跃度、技术影响力和市场布局三重指标对储能领域的关键技术国际竞争态势进行分析。杨曦等[29]使用基于专利的ECIRM模型,从专利权人、资本、产业、资源和技术管理维度以石墨烯产业为例进行产业竞争态势分析,魏娟霞等[30]使用IPC (专利分类号)-MC (手工代码)-Term (元组)三元模型,构建高维向量空间,计算相似度,分析技术竞争格局。
在技术竞争中设置国别技术壁垒已成为技术优势国阻碍技术国际流动,限制他国技术发展的最主要手段之一。研究多集中于技术性贸易壁垒 (TBT),即以维护本国经济利益为目的,设置一定的技术门槛以阻止外来商品和投资自由进入[31]。蔡静静等[32]基于演化博弈视角研究技术壁垒对出口企业技术创新决策的影响。张秀妮等[19]结合美国出口管制清单与专利数据研究了技术壁垒环境下航空航天产业核心技术预见问题。
综上,梳理现有研究可以发现,专利视角下针对关键核心技术的识别已有较为成熟的方法和体系,技术竞争态势分析的研究也有较为主流的切入角度,但在国际竞争格局下对两者的联合分析模型研究较少,需要在识别关键核心技术的基础上进行竞争态势分析并加入外部政策影响。技术壁垒的研究多集中于技术性贸易壁垒 (TBT),缺乏对技术管控格局下技术堵点的发现方法。尤其在美国设立严格的出口管制清单下如何精确发现本国核心技术堵点并进行产业链定位挖掘其与政策文本的关联分析尚待深度研究。因此本文建立产业链堵点技术综合识别模型,在美国出口管制清单背景下,基于专利数据库,使用IPC分类号明确技术类别,进行产业链定位,分析技术竞争态势,使用LDA关键词主题建模,充分利用专利文本,进行技术壁垒点识别与核心技术风险预见,最终实现关键核心技术堵点的精确定位,通过深度剖析管制政策与专利卡位的内在联系,分析模型对竞争格局下识别核心技术堵点提供新的研究框架并为寻找技术自主可控路径提供借鉴。
在前期文献研究的基础之上,本文构建核心技术堵点识别模型,结合美国商务部工业安全局设置的出口管制清单,在复杂国际竞争格局下,对核心技术堵点进行识别与产业链定位,建立 “三横三纵”的立体分析框架,横向分为数据层、方法层和结论层3个主要层次,关键核心技术堵点集成识别框架如图1所示。
图1 关键核心技术堵点识别框架
研究3条主要纵向分析路径,以专利数据库为基础,IPC专利分类号类别分析为中轴线,左侧结合美国商务部出口管制清单内容将受控技术分类划归,对照分析专利IPC分类受限技术并进行产业链定位,最终识别受限技术壁垒点。右侧采用LDA主题建模方法挖掘核心技术主题关键词,结合产业链特点对照分析核心专利主题国别竞争态势,预见核心技术风险。受限技术壁垒点与核心技术风险点交集部分技术主题有3个特点:①受出口管制清单严格限制;②该IPC专利类别存在技术短板;③专利在数据库中地位重要。结合产业链特点进行技术定位,集成多元数据开展关联分析,构建综合分析框架识别亟待突破的关键核心技术堵点并深度分析其与出口管制清单的联系。
本研究专利数据来源于德温特专利数据库 (Derwent Innovation Index),在确定研究主题后建立检索式TI搜索相关专利,将搜索聚焦于受限制的技术与终端产品,数据检索使用布尔逻辑关系,对研究领域涉及的专利进行检索,下载完整的专利信息。对文本进行分词去停用词预处理,清洗残缺数据,建立本地专利数据库。
美国商务部工业安全局 (BIS)限制出口清单内容 (Commerce Control List)[33]共10类,并附带受控国别列表信息及检索方法,对研究主题范围内的大类进行文本梳理,分类划归受限制技术,标注及解释文本清洗,保留大类限制目录并进行子目录精确提取,去除残缺文本,人工检查分类目录,统计类别,形成管制清单文本数据库。
对美国出口管制清单文本数据库进行受控技术分类划归,得到技术主题分级目录,对分级目录中的内容进行文本分析,获取研究领域当前主要的技术限制,完善各个技术分类内的目录及主题内容,结合专家意见对受限制的技术主题大类进行产业链定位,建立起技术壁垒点与产业链的关联关系。通过已经建立的专利数据库读取IPC分类号,查询分类号对应的技术主题,对比国内外优势技术IPC方向,进行专利国别竞争态势比较分析,在产业链中定位各个技术主题,对照管制清单数据精确寻找受限技术壁垒点。
LDA主题建模是机器学习算法中一种非监督学习模型,使用狄利克雷函数对 “潜在主题信息”进行提取,通过算法抽取词汇与文档间的关系,可以有效提取大规模文档集和语料库中的隐含主题,目前已成为文本情感分类、关键信息抽取的主流方法之一[25]。
本研究基于构建的本地专利数据库,使用LDA主题建模对核心专利主题进行筛选,DWPI专利数据库摘要包含了大量的专利重要信息,文本数据主要体现在专利标题与摘要中,因此提取Derwent专利数据标题 (TI)结合摘要 (AB)作为数据源。专利文本是一种非结构化数据,为了将非结构化文本数据转化为结构化向量集,建立好语料库后,使用Gibbs采样方法估算出的文档主题分布作为文档向量的权重,通过提取特征词汇,借助关键词向量将每个专利文档转换为结构化向量,构建的关键词向量包含在文本中多次出现体现专利技术特征的关键词及其在文本中出现的频率。
LDA模型可以对训练集与非训练集文档进行主题概率预测,尽管其在文本识别的主要假设为一篇文档是由一组词构成,主要局限性为没有考虑词与词之间先后顺序的关系,是一种无监督模型。本研究聚焦受限技术壁垒点识别与核心技术风险预见最终定位中国关键核心技术堵点,关键词的读取更有利于对照分析适用于解决本研究中专利数据库核心主题的发现。
集成电路产业链可整体划分为芯片设计、分立器件制造和封装测试3个环节,即对应产业链的上、中、下游。当前全球半导体行业处于新一轮景气周期上行阶段,而中国的半导体产业,不仅受到全球性大周期的影响,更有关键核心技术受限和疫情冲击的国产替代需求。工信部2021年数据显示,中国集成电路销售额突破万亿元人民币,2018—2021这3年的增速超全球同期3倍以上,复合增长率为17%[34]。中国虽目前已经成为全球最大的半导体消费国,但芯片自给率低,2020年中国集成电路自给率仅15.9%,国产替代仍有极大市场空间。本研究选取集成电路领域作为研究对象,深度挖掘中国核心技术堵点。
3.1.1 集成电路领域专利数据库
专利数据包含技术的有效数据,使用德温特 (Derwent Innovation Index)数据库在数据检索时,使用检索式TI的布尔逻辑关系,芯片的应用场景极其丰富,因此涉及芯片领域的专利数量众多,本文主要研究在芯片上游设计、中游生产、下游封测的关键核心技术堵点进行识别。
本文采用检索式TS= ( ( ( (chip?or microchip?or integratedcircuit?or Semiconductor or Microelectronics or FINFET or MOSFET)near/5 (Equip* or System* or material?Or Rig?or facilitate?or Inst*))near/5 ( (Design* or Plan* or Program* or Devis* or Formation or Production or Manufactur* or Test or Package*)))not (appli* or apply or utliz*))
检索式同时设置专利时间为2002—2022年,检索时间为2022年2月16日,共检索到35112条专利 (包含专利族)数据。本文研究集成电路产业链相关学科类别专利,选取工程,仪器仪表,化学等13个专业类别进行技术壁垒甄别,集成电路学科类别专利数量统计如图2所示。
图2 集成电路学科类别专利数量
集成电路学科涉及的最主要类别为工程类,德温特专利学科类别存在交叉无法判断主要的专利类别领域,主要涉及的13个专利类别范围广泛,进一步研究挖掘专利信息,使用Python对检索到35112条专利进行国别信息提取,对提取专利的国别信息进行统计。在检索到的数据库中,美国有相关专利9113件 (占比26.99%),中国有相关专利8726件 (占比25.56%),日本9118件 (占比27.02%),韩国5006件 (占比14.18%),欧洲专利组织803件 (占比2.09%)。
日本、美国、中国和韩国是最主要的芯片专利授权大国,考虑到美国技术优势国的地位受到冲击,其在芯片、计算机、通信领域设置了严密的出口管制清单,限制别国使用先进的芯片产品,限制制造设备的出口与国际研究合作,违背了WTO贸易合作规则,破坏了全球紧密合作的产业链和供应链,严重阻碍全球科技进步,打破了人类命运共同体建设。在其严密的出口管制下,中国芯片的设计、制造和应用均受到严重限制。
3.1.2 出口管制清单文本数据库
美国商务部工业安全局 (BIS)发布的《商业管制清单》中针对芯片、电子电路、通信领域进行了严密的管制,限制了技术在国际间的流动和跨国技术合作,其设置的出口管制清单 (Export Administration Regulations,EAR)对主要的十大类技术进行出口管制,其中针对电子设计开发与生产设置了独立的一个大类目进行管制,主要涉及芯片与集成电路领域终端产品和产业链的不同环节。商业管制清单的大类4 (计算机类目)、类目5.1 (通信)与类目5.2 (信息安全)更多涉及到软件系统,并且类目间存在引用关系,CCL避免了不同大类下重复设限相似技术条目,本研究聚焦CCL大类3 (电子设计开发与生产)进行文本数据提取。
出口管制清单 (EAR)对集成电路领域进行了严密的限制。在电子设备设计开发与生产领域共设置5项一级技术分类,涵盖55个二级技术分类和149个三级技术分类,三级技术分类下仍设置3个次级目录对技术类别进行注释和细分领域的界定。本文针对受限制技术对技术分类进行数据清洗整理,去除残缺保留项,去除注释界定等进行类别缩减。技术分类汇总见表1。
表1 出口管制清单技术分类汇总
美国出口管制清单分为5类,涵盖芯片产业链的上中下游,上游终端产品与设计环节对应第1个一级分类与软件一级分类中的设备运行类软件;中游制造环节对应第2个一级分类中制造部分、材料一级分类与软件一级分类中生产设备软件;下游封测对应第2个一级分类中的测试设备;软件部分主要为设计软件和制造开发软件;材料部分管制清单侧重于制备材料的限制。技术类目同样作为一级分类,在限制上述分类的一般性技术出口的同时对军用电子设备技术与其他前沿技术模块提前进行封锁。在芯片领域专利数据库中出口管制清单进行产业链上中下游的定位后发现不仅是产业链相关技术,几乎是全产业链的封锁与限制,叠加超前技术卡位布局。基于集成电路领域的专利的数量变化与主题对比分析,中国在专利数量上与美国接近,增长趋势高于美国,但在产业链主要环节技术不足,需要结合专利分类进行产业链定位。
集成电路领域主要涉及的专利IPC四位一级分类号有H01L、G01R、G05B、G06F、G01R等,需对更细分的二级IPC七位专利号进行对比,世界各个专利技术大国在集成电路领域研究方向不尽相同,使用整体专利数据库进行主要专利IPC统计无法有效考虑各专利大国优势专利,在二级分类号下数量排序前20项IPC号占整体数量均超过75%,代表了各国的主要专利研究方向,故本文选取九国两组织主要细分领域专利IPC分类号授权量前20作为主要专利分类,进行去重处理,共计27个主要专利分类号。本研究聚焦中美芯片专利将九国两组织其他国家相同二级专利分类号专利数量进行汇总,统一计算其占比。在本地德温特专利数据库中按不同二级专利分类下中美占比绘制散点图。进行技术特征提取,结合芯片产业链特点与专家意见将27项IPC二级专利分类号定位至产业链不同环节,综合进行国别态势分析,对技术风险进行预见。专利IPC分类产业链定位占比如图3所示。
图3 专利IPC分类产业链定位占比
根据专利IPC分类进行芯片专利产业链定位分析,集成电路产业链整体可以分为上游设计、中游制造、下游封测3个主要流程,最终形成终端产品。中国在数字计算设备、数据库结构设计中存在明显的短板,是主要的技术弱项之一。在分立器件模块与美国相比同样存在一定技术差距。中游制造模块是中国最重要的技术短板,主要涉及的11个IPC二级分类号专利全球占比均未超过10%,其中G03B-027 (光学印片设备)是中国存在的严重技术空缺,相比美国接近全球一半的专利数量,中国仅有0.32%的专利占比,实现自主可控光学印片设备还有较大差距。芯片产业链因其独特性需要多个环节匹配,某个环节技术有缺陷时就可能存在整体产业依赖进口,终端产品受制于人的问题。对照分析出口管制清单中均可找到多个三级技术分类限制这11项IPC技术主题。在制造设备、材料与辅料部分限制的尤为明显,不仅将基片制造器件进行限制,基片异质外延抗蚀材料如碳化硅 (SiC)、氧化镓 (Ga2O3)、高电阻率材料晶锭和多晶陶瓷衬底等也面临管制封锁,在专利卡位的同时不断封锁基材的出口, “被卡”国家甚至无材料开展相关领域技术攻关。
本部分使用自然语言处理算法进行关键词分析,使用LDA主题模型对专利数据库的题目和摘要进行分析,对核心专利主题进行筛选,对照分析国内外优势技术及核心技术主题国别竞争态势在产业链中的位置。使用Python进行LDA主题建模,版本3.7.1首先对德温特 (DII)专利数据库的文本文档进行提取题目 (TI)和摘要 (AB),对残缺的数据进行清洗和预处理,构建非结构化文本集共35112个同族专利,调用Nltk库Stopwords数据包对文档进行去停用词处理。
首先对主要参数主题数K进行设定,针对数据库中的文档进行主题数估计,本文专利数目较多,借助指标进行主题数确定。目前研究中,学者主要利用困惑度 (Perplexity)的变化进行估计,其指标随着主题数量的增加而递减。主题一致性是另一种主要的最优主题数目选择的模型,也是衡量主题质量最有效的方法之一。针对最优主题数的确定一般需要对数据集中包含的主题数目有一定的先验估计[35]。根据构建专利数据库IPC分类特点、专利类别数量及同族专利情况,本研究估计所下载的专利数据集中的主题数目为100个以内,结合主题关键词易读性与专家意见,进行迭代实验以确定最优主题数,K为5~105,步进为5,每个主题数运行1000次迭代,得到每个K对应的困惑度值和主题一致性,如图4所示。
图4 主题数 (K)对应困惑度-主题一致性曲线
在LDA主题模型下,当主题数取30时困惑度开始趋于稳定,达到最小值-8.96,结合主题一致性进行检验,主题一致性在主题数大于15后趋于稳定,随着主题数数目的增加,主题一致性并未有显著提升。最终选取芯片领域前30项关键技术主题,进行LDA建模,将每一个主题Topic视为一个专利热点,对集成电路领域中每个主题Topic下特征词及其概率进行统计,通过主题词识别结果及主题下专利题目,明确各主题对应的关键技术。主题Topic 1中权重前10项的主题词包括:组件、存储器、可编程、主控、芯片、接触、阵列,结合该主题下的专利名称,确定该技术主题为芯片存储器主控阵列技术。同理读取出LDA主题识别topic1-30技术主题,并进行产业链定位,结果如图5所示。
图5 LDA主题特征词概率及其读取结果
结合LDA主题建模挖掘专利数据库技术主题关键词,对核心技术进行识别,共记30项核心技术主题,300个关键词及其主题概率。其中,涉及集成电路设计的有4项,涉及制造材料的有8项,涉及制造设备的有8项。自然语言算法处理结果与IPC分类号专利方向有部分重合,但关键词读取结果更侧重于制造材料与设备,占核心技术主题的有16项,占比超一半,其中 “draw;印制”关键词在不同的主题下多次被识别,是贯穿制造类别主题的最重要关键词之一。对比分析IPC分类专利国别竞争态势,中国主要的核心技术风险点在数字电路逻辑芯片、存储器、数据库访问端口、底层基材、微型环氧树脂复合材料、管体表面结构材料 (苯酚、锡)、金属表面氧化成薄膜材料、电化学材料 (氟化物,烃类,聚乙烯)、微型晶元印制设备及制造、刻蚀设备与晶体熔炉、晶片表面密封印制设备、离子注入设备、电化学气体 (化学气象沉积)共13项LDA主题建模核心技术。
本文构建了集成多元数据的综合分析框架,建立专利数据库分析中外技术竞争态势,结合美国商务部出口管制清单对我国的受限技术壁垒点进行识别,对专利IPC分类号进行产业链定位,使用LDA主题建模筛选核心技术主题,结合产业链特点挖掘亟待解决的核心技术堵点,通过深度解析出口管制清单5个一级技术类目的布局得出以下结论与建议。
美国相关管制清单文件中包含的技术产品范围很大,技术性参数限制面宽,在部分细分产业链领域中国已经掌握相关技术,并不存在 “卡脖子”的技术堵点,而在特定应用数字计算设备;信息检索、数据库结构、文件系统结构;印制电元件、电设备结构零部件、基片材料应用;PN结电容器或电阻器、半导体本体或其电极的零部件;光学印片设备;通过气态化合物分解化学镀覆 (化学气相沉积);物质或材料引入放电作用结构的电子管;图纹面,印刷表面的照相制版 (光刻工艺);在一个共用衬底内或上形成多个半导体或其他固态组件;用于制造印刷电路的设备或方法 (穿孔,光刻,沉积等)共10项专利领域中国存在缺口,为主要受限技术点,其中4项受限点集中在产业链制造设备中,3项受限点集中在制造材料中。管制清单将材料部分独立为一个一级分类,意图使得技术受限国家无芯可用、无料生产。中国面对缺少基材的问题,应在芯片材料研发中充分发挥引进吸收再创新的路径,将当前主流芯片基材碳化硅 (SiC)、PN结电容器、多晶陶瓷等制备工艺充分吸收,在既有专利方向拓展应用的同时引领性的布局新材料。
LDA建模中最主要的专利短板为光学印片设备,其重要性贯穿整个中游制造过程。在材料制备、主要制造工艺流程中均有体现,是芯片制造过程中最重要的技术之一,也是面临的关键核心技术堵点,打赢关键核心技术攻坚战的首要关卡。其次,中国在数字计算与数据库技术中存在专利短板,该技术也是LDA建模的核心技术主题,是中国集成电路设计环节中亟待解决的技术堵点,中国在传感器、光电器件、封装测试材料与设备技术方向通过经验积累与技术攻关已经在专利数量上取得了一定突破并掌握了一定的核心技术。但通过LDA主题关键词识别,此类技术方向在整体芯片产业链中并不占据核心地位,其专利作用相对独立,持续地扩大研发与增进专利优势并不能解决所面临的关键核心技术堵点,需精确定位堵点,以点带面打通全产业链,实现芯片自主可控。中国面对光刻工艺与设备的严密封锁,尖端EUV光刻、离子注入、蚀刻设备、化学气相沉积CVD设备无法获取的现状,应充分结合上游分立器件、光电器件等独立模块的成功路径,通过原创性攻关能力的积累,逐渐缩小技术代差。
技术类目同样作为一级分类,在限制上述分类的一般性技术出口的同时对军用电子设备技术部分限制进行全方位的用途限制,不仅意图使受限国无法生产特种设备,并且安装、使用、维护、维修均需高度依赖领先国垄断技术。在补充的其他技术模块,属于前沿技术领域卡位布局政策,部分领域如 “量子阱” “超晶阁器件” “超导材料”等技术仍处在开发阶段,提前进行了出口管制卡位布局,意图垄断此类技术。中国面对超前技术布局,结合前沿技术特点,应充分发挥举国体制优势,全面推动颠覆式创新的出现,提前布局前沿技术领域,形成专利后主动占位,稳步构建在芯片颠覆式技术中的优势,引领技术革命的出现,实现未来核心技术的突破式发展。
本研究整合多元数据进行处理与分析工作,结合专利、管制政策和产业链特点构建可移植的集成分析框架,但仍存在一些可以改进的部分,未来可针对以下方向进一步研究。第一,IPC分类技术主题与产业的定位关系可以进一步细化,将产业链特点进行更深入的挖掘细分,再进一步对更精确的IPC分类号进行定位与国别态势分析。第二,LDA主题建模的结果可以通过调参不断优化结果输出,多次迭代人工剔除过于笼统的主题词并过滤无关的关键词,优化概率分布,根据主题数判别指标,输出更多的最优主题数,进行更精确的核心技术主题识别与分析。第三,本研究集中于分析框架构建、数据库建立、产业链定位与算法分析,聚焦出口管制清单文本第三类电子设计开发和生产进行实证研究,未来可以进一步针对美国出口管制清单中核材料设施和设备、材料化学品微生物和毒素、导航和航空电子设备等剩余9个其他不同类目领域技术使用本文集成方法进行堵点识别与分析并提出针对性的建议。此外,研究不局限于美国商务部BIS的管制清单,结合自然语言处理算法可以为不同关键核心产业结合政策文本对照分析提供整体分析框架,为打赢关键核心技术攻坚战提供数据分析框架与决策支持。