基于创新链与时序二维视角的产业科技创新需求挖掘

2021-07-15 17:14周磊方芳
现代情报 2021年7期

周磊 方芳

摘 要:[目的/意義]理解创新需求的内容导向及其演化模式是规划产业创新供给的基础和前提。[方法/过程]基于创新链与时序二维视角,融合文本挖掘技术,构建产业科技创新需求挖掘框架。[结果/结论]以国防科技工业产业为例进行实证研究,发现其创新需求集中为4类:电磁学与元器件系统、软科学、智能装备系统、新材料。电磁学与元器件系统需求属于研究主导的同步创新模式,软科学需求属于研究主导的反馈创新模式,智能装备系统、新材料需求均为应用主导的同步创新模式。最后提出国防科技工业产业创新供给的对应策略。

关键词:产业科技创新;需求挖掘;创新链;时序关系;隐含狄利克雷分布;国防科技工业

DOI:10.3969/j.issn.1008-0821.2021.07.010

〔中图分类号〕G250.25 〔文献标识码〕A 〔文章编号〕1008-0821(2021)07-0103-07

Mining Industry S&T Innovation Demands Under the Two-dimensional

Perspective of Innovation Chain and Time Sequence

Zhou Lei1 Fang Fang2

(1.Accounting College,Wuhan Textile University,Wuhan 430200,China;

2.School of Information Management,Wuhan University,Wuhan 430079,China)

Abstract:[Purpose/Significance]It is the basis and prerequisite for planning industrial innovation supply by understanding innovation demands deeply from its content orientation and evolution mode.[Method/Process]Under the two-dimensional perspective of innovation chain and time sequence,this study constructs a framework of mining industrial S&T innovation demands by text mining.[Result/Conclusion]An empirical study on national defense S&T industry was conducted and several conclusions were drawn from the study.Firstly,innovation demands in national defense S&T industry were classified into 4 types mainly:electromagnetics and component systems,soft science,intelligent equipment systems,new materials.Demands in electromagnetics and component systems belonged to research-dominant and synchronous innovation model.Demands in soft science belonged to research-dominant and feedback model.Demands both in intelligent equipment systems,new materials belonged to application-dominant and synchronous innovation model.Finally,innovation supply strategies were suggested for national defense S&T industry.

Key words:industry S&T innovation;demand mining;innovation chain;time sequence;Latent Dirichlet Allocation(LDA);national defense S&T industry

党的“十九大”报告提出加快建设创新型国家,“要引领原创成果重大突破”“突出颠覆性技术创新”。“十三五”规划中进一步要求,“塑造更多发挥先发优势的引领型发展”。然而,理论界和实务界有关产业创新源路径的争论仍未达成一致。熊彼特晚年最终认可了“大企业的创新优势”,即上游研发决定创新供给。布什在《科学——没有止境的前沿》中提出的线性创新模式基本遵循熊彼特假设,这一思想不仅长期占据美国科技界主流,还深刻影响着同时期多国的科技政策制定[1]。企業研发决策或科学家发现能够完全决定产业创新吗?答案似乎并不总是肯定的。技术创新动力的理论研究提出了与技术推动论相悖的市场拉动论、技术与市场互动论及三元论、四元论、五元论。企业界的实践似乎更能提出挑战。克里斯坦森发现实践中的颠覆性创新来自满足低端市场和边缘市场需求的快速成长技术;出于既得利益保护思想而轻视甚至妄图掩盖新兴需求的市场巨头们最终陷入了“创新者的窘境”[2]。事实上,在尚未形成寡头或垄断的竞争性市场,理解需求是企业创新的起点,也是速度经济模式发挥作用的基础。因而,深刻洞察产业创新需求主题及演化特征不仅有利于丰富产业竞争情报理论方法,还能对产业创新管理实践产生有意义的指导。

1 相关文献综述

1.1 技术创新链相关理论

创新链是科学知识、技术知识经过技术创新转移转化实现商业化、产业化的过程[3],通常包括新思想产生、基础研究、技术研发、产品试制、大规模生产、市场营销等多个环节[4]。技术创新链是以身处创新链各环节的企业和研发机构为主体,通过技术对接和整合满足市场需求的过程[5],该过程的数理模型可以简化为技术链、产业链、供需传递函数的有机结合[6]。根据创新链发展的核心动力来源,经典研究提出了技术推动论、市场拉动论、技术与市场的耦合互动论、一体化模式、系统集成与网络模式等理论[7]。20世纪中期,供方市场处于主导,技术推动理论应运而生,该理论将技术创新定义为由基础研究流向设计工程、制造、市场营销、销售的顺序链,该理论进一步增强了“科技为创新之基”的论断。随着产品供给日趋平衡,企业在创新过程中必须认真考虑市场需求,从而形成了由市场需求指向开发、制造和销售的市场拉动模式。然而,后续研究发现技术与市场的耦合互动模式才能缔造成功的创新,创新链条上的各个环节存在双向互动[8];这一结论正好契合了新熊彼特学派提出的技术推动、市场拉动均为创新来源的观点[9],进一步证明了技术创新动力的二元论。一体化并行模式脱胎于20世纪80年代的日本领先企业,以职能的并行性和职能间的集成性实现了钱德勒提出的“速度经济”[10]。伴随着信息技术和互联网的快速发展,20世纪80年代末期出现了系统集成与网络模式,以创新网络、虚拟联盟、开放式创新模式大力拓展创新的边界。

1.2 需求分析与文本挖掘

消费者和企业产品研发部门是创新需求的两大主要来源,前者决定着市场应用需求,后者决定着科技研发需求[11]。项目管理研究在新产品开发阶段,主要利用QFD、KANO、联合分析等方法,并配合粗糙集、聚类分析等数据挖掘技术确定市场需求及其优先级、分析用户满意度与产品质量的关系、解决设计端与用户端的需求失衡问题[12-16]。然而,上述方法主要依靠问卷调查、实地调研、专家咨询等方式收集市场需求,信息来源单一、成本较高。目前,网络信息已成为需求分析的重要数据源。为了获取雇主对不同专业人才的技能需求,情报学领域建立专业技能词典,为需求分析的自动化提供便利[17-18]。在此基础上,对网络招聘信息进行文本挖掘,明确电子商务各类岗位[19]及大数据岗位的技能需求[20];建立专业、岗位、知识点的3层映射关系,深层挖掘雇主对计算机专业人才的技能需求[21]。国外新近研究引入主题模型(Topic Model)技术,总结出大数据岗位的工作类型、技能要求及其与商务智能岗位的内在关联性[22];以Twitter用户评论作为市场需求库,判断技术主题面临的外部需求环境变化[23]。

综合来看,技术创新理论的系统发展、文本挖掘技术与就业需求分析主题的交叉研究为深入剖析行业科技创新行为提供了多元化的理论基础和方法支撑。然而,当前研究亦存在较为明显的不足之处。一是如何将情报学领域的就业需求挖掘技术和方法移植到产业创新需求研究中?二是如何从产业链视角进一步区分产业创新需求的导向并基于时间维度对其结构性演化特征进行挖掘?

2 产业科技创新需求挖掘框架

本文利用LDA模型,基于创新链、时序二维视角构建产业创新需求挖掘框架。首先,利用文本挖掘技术对互联网中的特定产业需求信息进行主题建模,确定需求分类;再根据创新链位置判断创新需求的导向特征;最后,根据创新链和时序的重叠关系描述创新需求的演化特征并提炼创新需求模式。分析流程如图1所示。

2.1 基于LDA的产业科技创新需求分析流程

2003年,Blei D等提出潜在语义分析(Latent Semantic Analysis,LDA)主题模型,建立了连接文档、主题、词汇的多层次贝叶斯概率模型,实现高维度文档向低维度语义空间的完全随机映射[24]。目前,该模型已成为应用最为广泛的主流语义分析工具之一,被用于挖掘科学文献主题[25]、推荐科研合作者[26]、识别跨界创新[27]、发现技术融合领域[28]。本节利用LDA模型对产业需求分析进行挖掘,具体包括3个步骤:首先,针对选定行业,分别采集产业创新链上不同环节的科技创新需求;其次,人工标注需求文本,建立分词词典、更新停用词;再次,对需求语料库进行分词和LDA建模;最后,对LDA建模的主题进行聚类,确定产业科技创新需求大类。

2.2 基于创新链的产业科技创新需求导向分析

创新链各环节的发展动力显著不同,上游需求对应理论研究问题,中下游需求对应转化和应用问题。本节将借鉴斯托克斯的四象限模型[29],建立产业科技创新需求导向模型,具体包括3个步骤:首先,针对每一个需求大类i,界定一个特征函数Di=(Ci,Ti),其中Ci和Ti分别表示该需求所处的创新链环节、需求产生的时间。其次,根据Ci分布情况,判断产业创新需求的研究导向程度和应用导向程度。最后,根据各类需求的导向特征,建立产业科技创新需求的四象限模型。

2.3 基于创新链与时序的产业科技创新需求模式分析

时间被视为技术创新的不可替代的战略性要素,技术创新过程被视为随时间逐步展开的多个非连续决策及其行动的过程,时间、技术、市场的协同性共同影响组织创新效率[30]。本节将基于创新链与时序的二维视角提炼产业科技创新需求模式,具体包括3个步骤。首先,根据Ci和Ti的取值,绘制各需求大类在创新链上的演化热度图。其次,根据热度图,提炼各需求大类对应的科技创新需求基本模式或基本模式组合。本文将创新需求基本模式界定为3类:一是契合技术推动论的顺序模式,即创新链上、下游环节需求的发生遵循严格的时间顺序;二是契合二元互动论的同步模式,即创新链多环节需求同时发生;三是契合应用拉动论的反馈模式,即创新链下游需求超前于上游需求产生。

3 实证研究

国防科技工业涵盖核、航天、航空、兵器、船舶、电子等多个行业,是保障国家安全和国防建设的战略性产业。国防科技工业需求集中,军方是国防科技工业的集中采购方,对装备可靠性和先进性的重视远甚于市场竞争和成本效益[31]。本文以全军武器装备采购需求信息的权威发布平台——全军武器装备采购信息网为数据源。采集该网站“采购需求”栏目下的科研、预研指南、预研3个子模块,采集时间为2019年5月20日,3个模块的需求条目分别为1 147条、170条、2 047条。

3.1 国防科技工业产业科技创新需求主题

对采集的需求条目进行清洗,删除内容缺失及重复条目后,分别对科研、预研指南、预研3个子模块进行文本采集、清洗、建立词典和LDA主题建模。轮廓系数(Silhouette)指标显示,3个模块的最佳聚类数分别为8、5、9。根据主题关联性,对LDA建模结果进一步归类,从而将国防科技工业产业创新需求归纳为4个大类:电磁学与元器件系统、软科学、智能装备系统、新材料。各环节创新需求主题及合并后的需求大类信息如表1所示。

由表1可知,科研环节的创新需求囊括上述4类主题,其中电磁学与元器件系统需求821条,包括各类芯片和集成电路、信号收发和转换器、传感器等;软科学需求85条,包括国防知识产权制度建设研究、国防知识产权服务优化、重点技术领域的专利分析等;智能装备系统需求172条,包括高温火场、地质勘探、无人作战等极端环境的仿真建模技术,以及语音圖像深度学习、深海及天空环境目标识别与导航、超融合计算平台等智能系统等;新材料需求54条,包括太阳能电池、柔性薄膜电池、锂电池等新能源,以及特殊性能的陶瓷外壳和晶体材料。

预研指南板块于2019年上线,创新需求主要包括3类主题,其中电磁学与元器件系统需求33条,主要为电磁散射机理和电磁传播特征研究、天线阵列优化;智能装备系统需求81条,主要为多尺度物理仿真建模,如数字孪生技术、仿生技术,以及武器装备智能化,如水下目标自动检测、雷达抗干扰、无人系统群体智能等;新材料需求56条,主要为火工品和推进剂的换能机理和精细结构、新能源电池、高性能复合材料。

预研环节的创新需求也囊括以上4大类,其中电磁学与元器件系统需求607条,如高性能电子元器件、电磁辐射、散射、传播机理、信网络协议等;软科学需求40条,既包括情报学前沿共性技术研究,如多源异构数据集成与挖掘、大数据仿真建模等,也包括专题情报研究,如高性能计算前沿技术、舰载直升机和航空动力装备前沿创新技术等;智能装备系统需求885条,主要分为两类,一是面向航空航天领域的航天器抗干扰、卫星在轨探测、雷达前视成像与虚拟目标生成;二是水下声场环境模拟、海洋目标辨识、船线型优化等;新材料需求480条,包括石墨烯、碳纤维、陶瓷复合材料、高性能涂层、纳米尺度材料、增材制造和修复等。

3.2 国防科技工业产业科技创新需求导向

科研环节主要面向理论研究,位于创新链上游。预研指南是针对预研工作的前期调研,位于创新链中上游。预研也位于创新链中游,是市场应用的起始点。国防科技工业产业的预研制度旨在武器装备具体型号开发前,解决和落实各项关键性技术问题。以科研环节的需求数量表示产业创新主题的研究导向程度,以预研指南和预研环节的需求数量表示产业创新主题的应用导向程度,以3个环节的需求总量表示产业创新主题的总潜力,绘制图2。

司托克斯在《基础科学与技术创新:巴斯德象限》中提出四象限模型:玻尔象限瞄准知识发现、爱迪生象限追求实际应用、巴斯德象限兼顾二者;皮特森象限是无特殊目的的技能训练和经验整理[29]。由图2可知,国防科技工业产业4类创新需求均兼具研究导向和应用导向。其中,电磁学与元器件系统、软科学两大类需求以研究导向为主,属于准波尔象限;智能装备系统、新材料两大类需求以应用导向为主,属于准爱迪生象限。具体来看,电磁学与元器件系统领域,研究导向需求823条,应用导向需求614条,理论研究占主导地位。软科学领域研究导向需求85条,应用导向需求40条,理论研究占主导地位。智能装备系统领域研究导向需求171条,应用导向需求1 076条,应用性占绝对主导地位。新材料领域研究导向需求54条,应用导向需求536条,应用性占绝对主导地位。

3.3 国防科技工业产业科技创新需求模式

接下来,从时序、创新链两个维度统计各创新需求大类的数量,绘制热度图,如图3所示。子图中每一个方格中的数值表示特定需求类别在对应年度和创新导向的数量,随着数值的增大,方格的颜色遵照黄、绿、蓝顺序逐步加深。

由图3(a)可知,电磁学与元器件系统需求始于2014年的科研环节和预研环节。科研环节需求在2016年达到顶峰,预研环节需求在2017年达到顶峰;除2017年、2018年,科研环节需求长期高于预研环节。因而,该领域创新需求属于研究导向的同步模式。由图3(b)可知,软科学需求始于2014年的预研环节,领先科研环节需求一年。科研环节需求逐步增长,预研环节需求在2016年和2017年达到高峰;总体来看,科研需求始终高于预研环节。因而,该领域创新需求属于研究主导的反馈模式。由图3(c)可知,智能装备系统需求始于2014年的科研环节和预研环节。科研环节需求先减后增,预研环节需求在2016—2018年达到高峰;总体来看,预研需求始终明显领先于科研需求。因而,该领域创新需求属于应用主导的同步化模式。由图3(d)可知,新材料需求始于2014年的科研环节和预研环节。科研环节需求在2016年达到顶峰,预研环节需求在2017年、2018年达到高峰;总体来看,预研需求始终明显领先于科研需求。因而,该领域创新需求亦属于应用主导的同步模式。

4 结束语

理解创新需求是规划产业创新供给的基础和前提。本文基于创新链和时序二维视角,构建了产业创新需求挖掘模型。利用这一分析框架,对国防科技工业产业进行实证研究。发现该产业的需求集中为电磁学与元器件系统、软科学、智能装备系统、新材料4类;电磁学与元器件系统领域创新需求属于研究主导的同步模式,软科学领域创新需求属于研究主导的反馈创新模式,智能装备系统、新材料两个领域的创新需求均属于预研主导的同步创新模式。综合来看,本文的贡献主要体现为两点:一是引入情报学研究使用的LDA模型,提出产业创新需求挖掘方法;二是基于创新链、时序二维视角,提出产业创新需求内容导向及演化特征分析模型。

同时,本研究的实证分析结果亦对国防科技工业产业创新供给具有一定的参考意义。针对电磁学与元器件领域創新需求,建议采取科技推动与并行一体化组合的创新供给策略。即以科研院所为创新主体,企业为补充;以科研理论突破为核心,实现科技推动创新和应用拉动创新的均衡供给。针对软科学领域创新需求,建议采取科技推动和应用拉动创新组合的创新供给策略。即以科研院校、共性技术研发机构为创新主体;早期以应用优化为突破点,继而带动科研创新能力提升,逐步夯实理论创新在推动产业创新发展的核心位置。针对智能装备系统、新材料两个领域的创新需求,建议采取市场拉动与并行一体化组合的创新供给策略。即以企业为创新主体,以创业孵化型研发机构为补充;以应用性优化为核心,实现科技推动创新和应用拉动创新的均衡供给。此外,产业创新供给策略的实施离不开创新资金来源、考核制度等配套措施的支持。电磁学与元器件系统、软科学主题的理论研究伴随知识溢出效应。因而,应将政府研究经费作为产业创新资金来源主体。对产业创新成果进行评价时,应以论文、专利、研究报告为重点,以工业产品为补充。智能装备系统、新材料领域的应用研究具有较高的经济价值,产业创新资金来源应以企业内部经费和市场合同为主。对产业创新成果进行评价时,应以工业产品为主体,可同时考察经营性收入、孵化企业数量和质量等。

参考文献

[1]V.布什,等.科学——没有止境的前沿[M].范岱年,解道华,等译.北京:商务印书馆,2004.

[2]克莱顿·克里斯坦森.创新者的窘境[M].胡建桥,译.北京:中信出版社,2010.

[3]许海云,王超,董坤,等.基于创新链中知识溢出效应的产学研R&D合作对象识别方法研究[J].情报学报,2017,36(7):682-694.

[4]Sen N.Innovation Chain and CSIR[J].Current Science,2003,85(5):570-574.

[5]彭双,顾新,吴绍波.技术创新链的结构、形成与运行[J].科技进步与对策,2012,29(9):4-7.

[6]林淼,苏竣,张雅娴,等.技术链、产业链和技术创新链:理论分析与政策含义[J].科学学研究,2001,19(4):28-31.

[7]卢显文,郑刚.企业技术创新过程模式的发展演进及启示[J].大连理工大学学报:社会科学版,2004,25(3):37-41.

[8]Rothwell R.Towards the Fifth-generation Innovation Process[J].International Marketing Review,1994,11(1):7-31.

[9]王晓蓉,贾根良.“新熊彼特”技术变迁理论评述[J].南开经济评论,2001,17(1):49-53,58.

[10]彭双,顾新,吴绍波.技术创新链的结构、形成与运行[J].科技进步与对策,2012,29(9):4-7.

[11]孔造杰,李斌.基于三维坐标及余弦相似度的创新需求集成与筛选方法[J].运筹与管理,2018,27(11):87-94.

[12]Ju Y,Sohn S Y.Patent-based QFD Framework Development for Identification of Emerging Technologies and Related Business Models:A Case of Robot Technology in Korea[J].Technological Forecasting & Social Change,2015,94(5):44-64.

[13]Mehdizadeh E.Ranking of Customer Requirements Using the Fuzzy Centroid-based Method[J].International Journal of Quality & Reliability Management,2010,27(2):201-216.

[14]孔造杰,赵啸天,李斌,等.基于KANO-效用理论的产品创新需求筛选方法[J].制造业自动化,2019,41(2):19-23.

[15]Lee C,Kwon O,Kim M,et al.Early Identification of Emerging Technologies:A Machine Learning Approach Using Multiple Patent Indicators[J].Technological Forecasting & Social Change,2018,127(2):291-303.

[16]Subbaiah K V,Prasad K G D,Rao K N.Customer-driven Product Planning Using Conjoint Analysis and QFD-ANP Methodology[J].International Journal of Productivity & Quality Management,2011,7(3):374-394.

[17]Lee S M,Lee C K.IT Managers Requisite Skills[J].Communication ACM,2006,49(4):111-114.

[18]Hartog D N D,Caley A,Dewe P.Recruiting an Analysis of Leadership Advertisement[J].Human Resource Management Journal,2007,17(1):58-75.

[19]詹川.基于文本挖掘的专业人才技能需求分析——以电子商务专业为例[J].图书馆论坛,2017,37(5):117-123.

[20]刘睿伦,叶文豪,高瑞卿,等.基于大数据岗位需求的文本聚类研究[J].数据分析与知识发现,2017,1(12):32-40.

[21]夏立新,楚林,王忠义,等.基于网络文本挖掘的就业知识需求关系构建[J].图书情报知识,2016,33(1):94-100.

[22]Debortoli S,Müller O,Brocke J.Comparing Business Intelligence and Big Data Skills[J].Business & Information Systems Engineering,2014,6(5):289-300.

[23]Li X,Xie Q,Jiang J,et al.Identifying and Monitoring the Development Trends of Emerging Technologies Using Patent Analysis and Twitter Data Mining:The Case of Perovskite Solar Cell Technology[J].Technological Forecasting & Social Change,2019,146(9):687-705.

[24]Blei D,Ng A,Jordan M.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,4(3):993-1022.

[25]關鹏,王曰芬.基于LDA主题模型和生命周期理论的科学文献主题挖掘[J].情报学报,2015,34(3):286-299.

[26]刘萍,郑凯伦,邹德安.基于LDA模型的科研合作推荐研究[J].情报理论与实践,2015,38(9):79-85.

[27]Whalen R.Boundary Spanning Innovation and the Patent System:Interdisciplinary Challenges for a Specialized Examination System[J].Research Policy,2018,47(7):1334-1343.

[28]Song B,Suh Y.Identifying Convergence Fields and Technologies for Industrial Safety:LDA-based Network Analysis[J].Technological Forecasting & Social Change,2019,138(1):115-126.

[29]D.E.司托克斯.基础科学与技术创新:巴斯德象限[M].周春彦,谷春立,译.北京:科学出版社,1999.

[30]吴永忠,关士续.技术创新系统建构观:背景及其涵义[J].自然辩证法通讯,2002,24(5):32-39,95.

[31]高展军,常明辉,段琳.陕西省军民融合创新网络研究——基于社会资本的观点[J].科技进步与对策,2013,30(1):107-112.

(责任编辑:孙国雷)