演绎逻辑与归纳逻辑视角下的颠覆性技术识别方法研究述评

2022-10-18 06:05冷伏海
情报学报 2022年9期
关键词:逻辑专利特征

周 波 ,冷伏海

(1. 中国科学院大学,北京 100190;2. 中国科学院科技战略咨询研究院,北京 100190)

1 引 言

颠覆性技术深刻影响国家的政治、经济、军事和产业安全,也深刻影响着企业的竞争能力和生存能力。颠覆性技术识别能够为国家和企业提供预警,为国家和企业技术研发提供方向、指南和决策依据,为国家和企业获得技术竞争优势提供关键情报支撑。在技术竞争日趋激烈、技术发展日益复杂的趋势下,颠覆性技术识别对国家和企业至关重要。世界上主要国家均展开了颠覆性技术预测,美国成立未来颠覆性技术预测委员会,加拿大成立安全和颠覆性技术研究中心,英国成立地平线扫描计划团队,日本则实施颠覆性技术创新计划;美国的TECHCAST和X2 项目十几年来在持续预测颠覆性技术。

自1995 年克里斯滕森提出颠覆性技术概念以来,颠覆性技术相关的研究发展速度迅猛,取得了一些成果,但是因为颠覆性技术涉及因素多,具有复杂、模糊、认知难度大等特点,加上其发展时间尚短,所以对颠覆性技术的本质、特征认识尚不够清晰,并且颠覆性技术概念的描述偏于抽象,不够具体[1]。目前学术界对颠覆性技术概念存在多种不同的观点,并无统一权威的定义。

颠覆性技术概念自提出以来,颠覆性技术识别就开始受到学术界重视。21 世纪初,Linton 等[2]最先对颠覆性技术的识别展开研究,此后国外对颠覆性技术识别的方法和理论展开大量研究。通过对国内外颠覆性技术识别方法的研究,发现颠覆性技术识别方法存在基于演绎逻辑的方法和基于归纳逻辑的方法,两种逻辑视角下的识别方法在研究前提、研究数据、研究结论严谨性、研究流程上存在较大的差别,且分别存在不同的优点和缺点。为进一步推动颠覆性技术识别方法的研究,须对两种逻辑及其对应的方法展开系统研究。因此,本文首先对演绎和归纳逻辑定义进行分析,然后梳理出两种逻辑下的识别方法及其代表性研究,比较了两种方法的优缺点,最后展望未来,分析如何通过综合两种逻辑为提出更好的识别方法提供更科学的指导。

2 两种逻辑:演绎和归纳

自古希腊亚里士多德以来,逻辑推理方法就已经有了归纳与演绎的区分[3]。根据前提与结论的性质及其关系可将逻辑推理方法分为归纳和演绎两种[4]。归纳逻辑是指通过系统研究和分析某类中的个别事物,比较这些个别事物的共同点,从而总结该类事物所具有的普遍规律;演绎逻辑是指应用普遍的规律分析某类中的个别事物,并通过个别事物检验这一共同规律;归纳与演绎的哲学基础,具有辩证统一关系,归纳与演绎的前提和结论相互倒换,是呈相互倒置的思维方式,归纳与演绎是相互区别、有机联系、互为条件和相互转化的[5]。

2.1 演绎逻辑

亚里士多德对归纳逻辑和演绎逻辑都开展过研究,但他更加重视演绎逻辑的研究,在此之后的很长时间中,演绎逻辑一直占据主导地位[5]。演绎逻辑是在某些前提成立的条件下推测必然会出现的特定结论[4]。演绎逻辑由前提、逻辑规则和结论三部分构成:前提通常是已知判断(如几何学中的公理或假设),是演绎的客观基础;逻辑规则是演绎应坚持的原则和运用的公式;结论是演绎所得出的结果。其中,著名的亚里士多德三段论推理就是典型的演绎逻辑[5-6]。

演绎逻辑建立在假设基础之上,但演绎逻辑最大的不足就是假设,其前提和逻辑规则是人们提出的假设,若演绎逻辑的前提被否定了,则其推导出的结论必将被否定[5]。例如,爱因斯坦相对论就是建立在光速不变的假设之上而推导出的结论,若该假设被否定,则相对论也会随之被否定。此外,由于其结论是建立在假设基础之上的,故由该结论推导出的结果必须能通过实际的检验,例如,由相对论推导出的引力波存在的结论,需要经过实验进行检验,才能证明该理论的正确。

2.2 归纳逻辑

归纳逻辑是随着近代实验科学的兴起而逐渐受到重视的,17 世纪英国的培根曾系统研究过归纳逻辑,牛顿对归纳逻辑作了进一步发展,后随着量子力学的创立,科学家们否定了因果律而采取概率论的态度,并创立了概率归纳逻辑[5]。归纳逻辑是通过某类中的多个个别事物总结出该类中所有事物共有的规律,是从个别到一般、从个体到整体、从特殊到普遍规律的过程。

理论上,归纳逻辑是建立在事实基础之上的,但现实中只能建立在部分事实基础之上,所以归纳逻辑得出的结论具有或然性,其以归纳方法获得的普遍规律,总是不完全的,因为归纳总是基于部分样本而非全量样本,故存在不完全归纳的缺点,得出的结论可能会存在反例[5]。例如,牛顿基于实验和经验总结出的牛顿定律,在低速、弱引力场的条件下是正确的,而在接近光速的条件下被相对论所证伪。

2.3 颠覆性技术识别的研究趋势

在Web of Science 数据库中以(TI= identif* or TI=discovery or TI= Recogn* or TI= monitor* or TI=fore-cast* or TI=detect* or TI=predict*) AND (TI=disrupti*technolog* or TI=disrupt* innovation*)为检索式进行检索,经过人工判读后共收集40 篇英文的国外颠覆性技术识别文献。从图1 可以看出,这些文献在1995 年颠覆性技术概念提出后就开展了研究,在2010 年发表论文数量达到顶峰;从被引频次分析,除2019 年、2020 年、2021 年可能存在数据入库时间滞后的问题,2001 年到2019 年颠覆性技术文献的被引频次呈指数增长,可以发现颠覆性技术识别问题受到越来越多的关注。

在中国知网中,以(TI=颠覆性技术OR TI=颠覆性创新)AND (TI=识别OR TI=预测OR TI=发现OR TI=评价 OR TI=预见OR TI=监测 OR TI=感知)为检索式,共检索到文献36 篇。从图2 可以看出,这些文献从2015 年才开始进行颠覆性技术识别相关的研究,中文文献的颠覆性技术识别研究起步较晚,但得到了快速发展;从图2 的中文颠覆性技术识别文献的被引频次上看,被引数量也在快速增加。

对Web of Science、中国知网、万方数据中的颠覆性技术识别相关文献进行阅读和分析,并从数据源、识别时间阶段和识别方法三个维度进行标注,如表1 所示,可以发现在2016 年之前,基于弱信号或早期的颠覆性技术识别、基于机器学习方法和人工智能方法的颠覆性技术识别和基于大数据研究方法的颠覆性技术识别的研究数量为零,2016 年后此类研究逐渐增多,这凸显了颠覆性技术识别研究具有以下三个新特点。

表1 代表三种趋势的文献数量 篇

特点一:基于弱信号或早期的颠覆性技术识别将会是研究重点。随着当前对强信号的研究逐渐饱和,研究价值更大的弱信号或早期技术识别将会是未来的新兴研究领域。技术研究经历由少到多的过程,早期信号弱,后期信号强,基于弱信号或早期的技术识别将比传统的基于强信号的技术识别更早地捕捉到颠覆性技术或新兴技术等,具有更大的研究价值和难度。代表性研究有苏敬勤等[7]、Joanny等[8]、石慧等[9]、黄鲁成等[10]、范明姐[11]。

特点二:基于机器学习方法和人工智能方法的颠覆性技术识别将会是研究重点。机器学习或人工智能方法首先需要样本数据进行训练,然后使用测试集进行测试,识别结果可直接计算准确率,并且能够重复实验,不同的方法效果之间能够相互比较,相比于以往的基于归纳逻辑的识别方法有着显著优势,对于提高技术识别的研究质量有着重要意义。代表性研究有Chen 等[12]、张佳维[13]。

特点三:基于大数据或多源数据研究方法的颠覆性技术识别将会是未来研究的重点。技术识别领域的大数据包括专利数据、论文数据、网络数据、行业数据等,相比于基于单一的专利数据,分析的维度更多,研究结果更加可信,能够弥补单一数据可能造成的重要信息的遗漏;集成的研究方法能够弥补单一方法带来的缺陷,各种研究方法相互补充,研究的结果也更加准确。代表性研究有Kim等[14]、赵格[15]等。

并且,随着颠覆性技术识别的感应速度要求越来越快和基于强信号的研究逐渐趋于饱和,对弱信号的研究将会受到更多的关注。一方面,基于大数据的研究将会汇聚多源数据,对弱信号进行增强;另一方面,基于弱信号的研究将会面临大量的噪声数据,依靠主观判断很难识别,将会依赖基于机器学习和大数据的研究。因此,基于弱信号或早期的研究、基于大数据的研究、基于机器学习方法和人工智能方法的研究将会融合发展。

3 演绎逻辑下的颠覆性技术识别

3.1 演绎逻辑下的颠覆性技术识别方法

基于演绎逻辑的颠覆技术识别研究的过程是先基于颠覆性技术理论中的定义,假设某些特征或方法符合颠覆性技术定义,然后选择具体领域进行实验,最后由专家或者基于文献对识别结果进行验证,以证明假设的特征或方法的正确性,具体包括基于复杂网络的方法、突发词检测、共词分析、基于技术形态的方法等。例如,Sun 等[16]从哈佛商学院克里斯滕森1995 年提出的颠覆性技术定义出发,寻找符合颠覆性技术定义的数据特征,以识别颠覆性技术。对国内外颠覆性技术识别文献中的识别方法进行统计,发现约有87.7%的研究方法是基于演绎逻辑的,其大致可分为11 类,如表2 所示。

表2 基于演绎逻辑的颠覆性技术识别方法

(1)基于TRIZ 理论的识别方法。TRIZ 理论为技术创新提供了系统理论和方法工具,其理论体系主要包括技术创新的思维方法、问题分析方法、技术系统进化法则、技术矛盾解决原理等方面,根据技术系统进化法则,预测技术发展趋势。Sun 等[16-17]从克里斯滕森的定义出发,基于TRIZ 理论将产品演化的理想的最终结果分解为各个子技术,运用TRIZ 原理分析各子系统的技术演化路径,得到过度创新的技术和相对滞后的技术,通过降低功能过剩的子系统技术和增加相对滞后的技术功能,于TRIZ 进化路径预测改进后的技术以及潜在的颠覆性技术,并以视频游戏技术为例展开分析。许泽浩等[18]以TRIZ 理论为基础,通过分析技术与市场需求的冲突识别潜在的颠覆性技术。

(2)基于复杂网络的识别方法。基于复杂网络的识别方法是指利用科技文献中的共被引关系、引用耦合关系、直接引用关系、IPC(international patent clsassification) 分类号共现关系等构建复杂网络,然后使用聚类分析、离群点分析、K核分析、节点网络特征分析等方法,进行颠覆性技术识别。Dotsika 等[19]基于关键词共现网络,分析关键词在网络中的接近度和远离度来判断其颠覆性潜力,研究结论认为可使用同时具有较高接近度和低远离度组合特征识别具有颠覆性技术潜力的关键词;Jia 等[20]以科学论文的关键技术共现网络、词频变化网络和突发词确定新兴的研究前沿,然后计算潜在新兴研究前沿的专利影响因子,选择专利影响因子高的技术作为颠覆性技术。

(3)基于定性指标的识别方法。基于定性指标的识别方法是从颠覆性技术的理论内涵出发,从定性的角度分析某些技术是否符合颠覆性技术的特征,该方法高度依赖研究人员对颠覆性技术的内涵的理解。Vojak 等[21]提出基于标准、架构、集成、连接、替换五个维度的颠覆性技术的分析方法,并选用三个行业案例进行分析;Keller 等[22]将微软和谷歌的办公应用程序作为案例,在技术能力、市场价格、消费者需求等方面进行对比,以识别谷歌办公应用程序是否具有颠覆性;张立国等[23]基于技术属性、技术应用、应用效果、技术成熟度、进入时间、产生颠覆性效果的时间等维度建立颠覆性技术动态识别框架。

(4)基于定量指标的识别方法。基于定量指标的识别方法依据颠覆性技术的主要特征,使用各种数据指标来表示特征,以达到技术识别的目的。定量指标又可分为客观定量指标和主观定量指标。客观定量指标的数据来源于现有的事实型数据,如专利、论文等;主观指标的研究数据来源于调查和评分。Joanny 等[8]提出基于关键词的最近三年的占比、专利占比、会议论文占比、期刊分布广度等指标来衡量技术主题的活跃度、商业化程度和热度,以此进行颠覆性技术的早期识别。Guo 等[24]提出了一个指标体系,包含三个一级指标和十个二级指标,即技术特征(整合程度、领导地位、成熟度、扩散度和简化程度)、市场动态(利基市场、价值网络和成本)和外部环境(政策和宏观经济),选择微信、功能手机、虚拟现实和增强现实技术为案例进行研究,对专家小组进行了调查以对指标进行打分,从而对颠覆性创新进行评价。汪锦霞[25]认为,不同技术阶段拐点处的专利可能是颠覆性创新,并利用专利动态引用率表征技术的颠覆性强度,研究结论表明专利前三年引用率能够实现颠覆性技术识别;侯广辉等[26]基于市场、技术、外部环境三个维度建立技术性能突破性、技术前沿性、在位技术市场成熟度、政策制度环境、产学研环境等十个指标,并使用蝴蝶突变级数模型、燕尾突变级数模型识别颠覆性技术。

(5)基于文本分析的识别方法。基于文本分析的识别方法主要基于自然语言处理的方法,提取科技文本中的关键词、主题词、语义结构等以识别符合某些特征的技术,主要包括共词分析、主题模型、SAO (subject-action-object) 结构分析、突发词检测、技术形态分析等方法。Kim 等[14]从技术预见的网站下载可穿戴计算领域相关的技术预测文本,使用文本分析方法,构造文本-关键词矩阵,采用自组织特征映射(self-organizing feature mapping,SOFM)进行聚类,获得技术主题,基于关键词频率和文档频率来确定关键词强度,并依据不同章节内的关键词之间的关系,计算关键词的相似度,基于关键词强度图识别颠覆性技术。马铭等[27]将技术的SAO 语义网络聚类,先利用突变理论模型识别易突变社区,再对易突变社区内主题词进行突发性和词频异常监测,将可能发生突变的技术识别为潜在颠覆性技术。白光祖等[28]的研究思路与马铭等[27]类似,都是基于SAO 主题突变进行颠覆性技术识别;不同的是,白光祖等[28]基于专利SAO 主题突变识别内部潜在的颠覆性技术主题,基于论文知识交叉识别外部的潜在颠覆性技术。石慧等[9]基于论文共词网络确定技术主题,依据主题词突变确定潜在颠覆性技术方向,逐一对各个时区内的技术方向关键词进行人工比对,确定技术突破类型,利用专利手工代码的突变判断技术创新性,结合技术所属类型个数和主题词突破类型个数识别颠覆性技术。刘忠宝等[29]基于专利和论文数据,使用LDA-LSTM(latent Dirichlet allocation - long short-term memory)文本分类算法抽取技术主题,构建技术主题共现网络,对主题词突变进行检测,综合分析聚类中心词和突变词识别潜在的颠覆性技术,并通过无人机技术领域进行了验证。

(6)基于技术扩散模型的识别方法。基于技术扩散模型的识别方法是通过与已有或类比已有的扩散模型进行颠覆性技术识别。Linton 等[2]采用Bass技术扩散模型方法预测微机电系统的颠覆性技术,针对技术在多个市场领域的扩散,提出考虑多个市场的技术扩散模型,以获得准确率更高的颠覆性技术预测。Cheng 等[30]借鉴 SIRS (susceptible, infectious, recovered, susceptible)流行病模型建立颠覆性技术扩散模型,以在不同技术领域中的扩散率和专利引用扩散识别潜在的颠覆性技术,并使用连续时间马尔科夫链进行仿真实验,确定技术可能重大爆发的领域。Nilchiani 等[31]通过对市场销量扩散建模,使用了捕食者-猎物模型来展示颠覆性技术与主导技术的行为,以确定颠覆性技术爆发的临界点,并进行了实证。于光辉等[32]依据标准化专利引文相似度确定潜在颠覆性技术,然后依据Bass 模型对新产品或技术的扩散和销售进行预测以识别颠覆性技术。

(7)基于多维数据的识别方法。基于多维数据的识别方法是同时使用两种或两种以上的数据进行颠覆性技术识别。赵格[15]使用文本分类和聚类方法抽取文献、专利和网络新闻的技术主题,综合分析专利三年引用率、专利平均独立权利要求以及文献增长率这三个特征确定潜在的颠覆性技术。

(8)基于专家智慧的方法。基于专家智慧的方法主要依赖专家的知识、经验和观点进行颠覆性技术识别,主要包括德尔菲法、情景分析法、头脑风暴法、问卷调查法、专家打分法等。Hüsig 等[33]根据克里斯滕森提出的颠覆性技术理论设计调查问卷,对沃达丰集团的专家进行访谈,并通过市场报告获取了部分数据,对无线局域网技术颠覆性潜力进行了预测。Sommarberg 等[34]提出利用专家群体的智慧建立视觉模拟量表来预测行业中的潜在颠覆性技术,并以机械制造行业数字化技术为例展开研究。Krotov[35]提出了改进的头脑风暴方法,用于分析颠覆性技术相关的各种未来可能性,与传统方法相比,该方法的步骤是迭代的,结构较少,能够获得技术可能产生的威胁和机会相关的想法。罗素平等[36]对专利进行聚类,然后根据离群专利主分类号划分技术组合,并从知识关联性、技术潜力和市场潜力三个维度综合评估,最后运用孔多塞投票法识别颠覆性技术。李存斌等[37]结合突变理论构建颠覆性创新技术评价指标体系,通过对电力领域进行实证研究,验证了该模型的正确性。傅耀威等[38]从引领技术和产业模式创新、经济和社会效益、商业模式和交叉领域应用、信息化社会交互、国内有无实现可能五个方面来构建信息领域的颠覆性技术评价指标体系,结合熵值法和层次分析法确定指标权重,并选择29 项技术进行实证研究。

(9)基于市场需求的方法。基于市场需求的方法是从市场需求出发,分析研究市场需求,以市场需求为导向识别颠覆性技术。Zhu 等[39]使用质量功能展开分析方法,通过情景分析法获取客户需求,运用层次分析法分析客户需求的重要性,将顾客需求转化为产品的设计、功能、工艺和生产要求,以分析潜在的颠覆性技术创新。

(10)技术形态的识别方法。技术形态分析的核心思想是将研究主题分解成功能和技术手段,研究所有能够产生特定功效的组合,以识别颠覆性技术。黄鲁成等[40]从专利文本信息抽取技术属性,运用物种入侵算法计算出技术方案的最优属性,通过集对分析方法比较新技术出现前后属性集的差异程度来衡量技术的颠覆性。黄鲁成等[10]进行技术S 曲线生命周期分析,采用创新性和独创性指标衡量技术颠覆性,运用SAO 分析方法识别技术新功能未来的潜在影响,并以工业机器人领域的专利数据进行验证。

(11)综合方法。综合方法是指采用两种或两种以上的方法进行组合识别,常见的组合方法有定性和定量相结合、主观和客观相结合等。Weissenberger-Eibl 等[41]从公司的视角出发,综合采用文献计量、情景分析和专家研讨的方法识别颠覆性技术。Raley 等[42]介绍了澳大利亚、加拿大、新西兰、英国和美国联合实施的颠覆性技术识别计划——EDTAG (Emerging and Disruptive Technologies Action Group),其中主要采用的方法有地平线扫描、技术观察、情景分析、专家研讨等。Momeni 等[43]构建专利引用网络,抽取出主路径之后,采用K核分析将主路径上的技术划分为子技术,利用主题模型识别出每个子技术中隐藏的主题作为潜在的颠覆性技术,最后选择光伏产业中的技术进行验证。美国国家研究委员会(National Research Council,NRC)下属的未来颠覆性技术预测委员会在2009 年提出采用广泛的数据源、多种预测方法、多种处理工具、多样的预测团队以识别颠覆性技术[44]。中国工程院分别于2017 年和2019 年启动两期工程科技颠覆性技术研究项目,综合运用文献调研和专家访谈等方法识别颠覆性技术[45]。

3.2 演绎逻辑下的颠覆性技术识别方法述评

(1)颠覆性技术的定义不统一,为基于演绎逻辑的颠覆性技术识别方法研究带来一定的困难。演绎逻辑的起点是一般普遍的原则,在基于演绎逻辑的颠覆性技术识别方法中,这个一般普遍的原则就是颠覆性技术定义所界定的颠覆性技术的特征和范畴,也就是说,颠覆性技术的定义明确清晰是基于演绎逻辑识别方法的整个基石,是演绎逻辑进行严谨推理的必要条件。然而,由于目前学术界对颠覆性技术定义还存在不同的探讨,实际工作中,有的学者是从克里斯滕森的定义所界定的五个特征出发展开研究,有的学者是从克里斯滕森定义所界定的部分特征出发展开研究,有部分学者从其他的定义出发展开研究,也有部分学者从自己对颠覆性技术的理解出发展开研究;演绎逻辑的起点各不相同,导致研究结论的适用范围各不相同,为研究结果的检验带来较大的困难。

(2)以数据驱动的定量研究成为基于演绎逻辑的方法研究重点。定性分析方法如德尔菲法、问卷调查法等虽然在实践中广泛应用,但少有方法上的创新;定量分析方法从颠覆性技术定义出发,不断提出采用新的量化指标和模型,涌现出较多的新思路、新观点,为颠覆性技术识别方法创新提供了新视角,也为颠覆性技术识别方法创新提供了最大的来源,如Linton 等[2]提出采用Bass 模型、Cheng等[30]提 出采 用 SIRS 流行 病模 型、 Nilchiani 等[31]提 出采用捕食者-猎物模型进行颠覆性技术识别的方法,这些新型识别方法均是基于演绎逻辑得出的新的定量方法。

(3)研究方法重复实验及进一步的验证相关研究较少。虽然当前基于演绎逻辑的颠覆性技术识别方法中有很多创新,提出了新的指标和模型,除三年专利引用率这个指标被部分学者重复验证并进一步研究外,其他的指标和模型是通过专家观点和文献进行评价验证,并未进行重复实验和进一步的研究证实,因此,这些方法结论的科学性和严谨性有待进一步证明。

4 归纳逻辑下的颠覆性技术识别

4.1 归纳逻辑下的颠覆性技术识别方法

基于归纳逻辑的颠覆性技术识别研究过程是先找到具体的颠覆性技术,对颠覆性技术的特征展开逐一分析,总结归纳颠覆性的特征指标,并对识别出的指标进行测试,其方法包括案例研究、机器学习等。具体的例子是哈佛商学院克里斯滕森教授通过对多个颠覆性技术的发展过程进行分析,在1995 年提出的颠覆性技术的定义,其总结了颠覆性技术的五大特征,可以基于这五大特征进行颠覆性技术识别。

对国内外颠覆性技术识别的文献中的识别方法进行统计,发现其中基于归纳逻辑的研究较少,基于归纳逻辑的研究方法占比约为12.3%,其研究方法可分为3 类,如表3 所示。

表3 基于归纳逻辑的颠覆性技术识别方法

(1)基于回归模型的识别方法。基于回归模型的识别方法是先收集多个颠覆性技术案例和多个假设特征,然后建立回归方法,对各个特征进行严格的统计检验,以验证颠覆性技术的特征。Sood 等[46]以新技术进入市场的类型、新技术采用者类型、公司大小、技术价格为自变量,以技术性能变化比例和技术进入顺序为控制变量,以颠覆性风险为因变量,采用风险回归模型,基于7 个市场的36 种技术的数据对7 个关于颠覆性技术的假设进行检验;对于颠覆性技术识别具有重要意义,但其数据收集难度较大。Diab 等[47]以颠覆性技术市场占有率为因变量,以竞争优势、商业模式、市场(成本、影响力、广告)、客户评价为自变量,构建颠覆性技术预测的回归模型,以预测颠覆性技术。Müller 等[48]基于Sood 等[46]的风险模型,验证了关于氧化还原液电池对锂离子电池具有潜在颠覆性的7 个假设,以预测电池领域的颠覆性技术。

(2)基于案例分析的识别方法。基于案例分析的识别方法是先收集颠覆性技术案例数据,然后对案例数据的各个特征进行人工比对分析,以归纳总结颠覆性技术特征。苏敬勤等[7]基于技术轨道理论和专利数据,比较了智能手机技术和传统手机技术在专利数量、专利引用量和专利引用率等特征上的差别,归纳并提出专利影响因子可识别早期的颠覆性技术。苏鹏等[49]收集颠覆性技术潜在的16 个特征(包括来源于其他领域交叉、基于不同技术轨道、操作简单、性能可靠、使用方便、价格便宜、具有新功能、优势可以长期保持、早期主流性能处于劣势、早期立足于低端市场、在位企业对早期颠覆性技术更加敏感、新兴市场未受到主流企业重视、在位技术性能供过于求、主流性能会持续提升、社会影响力大、不确定性强),并基于液晶技术、数码相机和即时通信3 个案例归纳出颠覆性技术的异轨性、覆盖性、创造性、替代性、抵抗性5个特性。

(3)基于机器学习的识别方法。基于机器学习的识别是依据先验知识对颠覆性技术相关数据进行标注,构建训练集和测试集,并使用训练集对机器学习算法模型进行训练,使用测试集对训练好的模型进行测试。Chen 等[12]使用了来自Gartner Hype Cycle、Google Trends、Google Book Ngram Viewer、Scopus 科学论文和美国专利的数据,构建训练集和测试集,使用机器学习的方法识别颠覆性技术。张佳维[13]基于技术特征和市场特征建立了颠覆性技术识别框架,并基于基因编辑技术和基因打靶专利数据使用决策树模型进行了训练和测试,选择多肽技术领域进行了验证。范明姐[11]从知识、技术、经济和环境四个特性出发,使用SAO 语义分析、相似性计算、聚类分析和机器学习方法(情感分析和主题模型等)从专利、政策和社交媒体数据中发现早期的潜在的颠覆性技术。

4.2 归纳逻辑下的颠覆性技术识别方法述评

(1)基于归纳逻辑方法主要分为人工归纳和算法归纳两种。人工归纳是依靠人工对技术领域展开分析,对各个特征展开对比分析,发现颠覆性技术特征;机器学习方法和回归分析方法依靠算法识别颠覆性技术的关键特征。随着科研大数据的发展,能够获得的颠覆性技术特征会越来越多,人工难以逐一比对,未来基于机器学习和回归分析的归纳逻辑方法会得到更多的研究。

(2) 展开归纳的案例数据较少并且标注不准确。当前基于归纳逻辑的研究中使用数据量较少,例如,苏敬勤等[7]使用传统手机和智能手机为案例进行归纳;苏鹏等[49]使用液晶技术、数码相机和即时通信3 个案例进行归纳;张佳维[13]使用基因编辑技术和基因打靶两个技术进行归纳;Chen 等[12]以Gartner 的技术预测数据作为标注数据展开归纳,但Gartner 数据本质上是咨询公司预测的数据,数据标注准确性有待确认。仅Sood 等[46]采用36 个案例进行归纳,结论可靠度较高。由于归纳逻辑存在不完全归纳的问题,因此,采用的案例较少或数据标注不准确会导致研究结论可信度存在问题。

(3) 纳入归纳研究的特征较少。例如,Sood等[46]的研究中仅有5 个特征,Diab 等[47]的研究中有6 个特征,苏敬勤等[7]的研究仅有3 个特征,张佳维[13]对专利的12 个特征展开研究,Chen 等[12]对Gartner 曲线的7 个特征和谷歌趋势等4 个特征进行归纳。范明姐[11]对专利的20 个特征进行归纳分析,尽管纳入研究的特征有所增加,但总体上仍然偏少。

5 归纳逻辑与演绎逻辑下的颠覆性技术识别方法比较

总体上来看,基于演绎逻辑的方法存在研究结果缺乏客观衡量标准且很难重复的问题;基于归纳逻辑的方法中,案例研究的归纳方法存在案例数量少、缺乏普适性验证的问题,机器学习的方法存在缺少准确标注的样本数据的问题。基于归纳逻辑和基于演绎逻辑的方法各有利弊(表4),具体来说,基于归纳逻辑和基于演绎逻辑的方法存在以下四个方面的不同。

表4 基于演绎逻辑的方法与基于归纳逻辑的方法的优缺点比较

一是研究前提不同。基于演绎逻辑的方法是以颠覆性技术的定义为前提的,假设某些特征符合颠覆性技术定义,以理论推导展开研究;基于归纳逻辑的方法是以有标注的颠覆性技术数据为研究前提,其不依赖于颠覆性技术定义,适用于缺乏权威统一的颠覆性技术定义的情况。

二是研究数据不同。从研究使用的数据来看,基于演绎逻辑和基于归纳逻辑的方法使用的数据源基本相同,都是专利、论文、问卷调查等数据;而基于演绎逻辑的方法使用的数据通常是无标注的,基于归纳逻辑的方法使用的数据是有标注的;并且基于演绎逻辑的方法大多使用一个数据集进行验证,而基于归纳逻辑的方法需要使用多个数据集进行归纳。

三是研究结论严谨性不同。基于归纳逻辑的方法的研究结论比基于演绎逻辑的方法的研究结论严谨,第一,是由于颠覆性技术定义不统一,导致在基于演绎逻辑的研究中采用的定义各不相同;第二,是由于基于演绎逻辑的研究结论通常依赖作者寻找专家或文献进行验证,存在较多的主观因素,而基于归纳逻辑的方法虽存在因收集的案例数据有限导致不完全归纳的问题,但其研究结果有量化的指标进行评价,研究结论相对客观严谨;第三,是由于基于演绎逻辑的方法在假设建立过程中存在主观因素,其大多选择一个数据集进行验证,且在选择数据集时大多可能预判出其识别的结果,因此,可能更倾向于选择符合其假设的数据;而基于归纳逻辑的方法选择多个领域的正反样本数据进行对比分析,并且随着领域数量的增加,研究结论的可靠性也随之增加。

四是研究流程不同。基于演绎逻辑的方法从定义出发,假设某个数据特征符合定义,然后收集一个或多个数据集进行验证,其核心是提出符合颠覆性技术定义的假设并进行验证;而基于归纳逻辑的方法是先收集多个案例,然后构建特征集合,对比分析特征的有效性,相对来说,数据收集难度更大。

6 总结与展望

本文对国内外颠覆性技术识别的方法展开了系统研究,从归纳逻辑和演绎逻辑的视角将颠覆性技术识别方法分为两类,并对这两种视角下的颠覆性技术识别方法进行系统的总结,剖析了归纳逻辑方法和演绎逻辑方法的优缺点。尽管从理论上讲,归纳逻辑和演绎逻辑是辩证统一的,然而,当前颠覆性技术的识别方法中,是以演绎逻辑的方法为主,归纳逻辑的方法较少,许多基于演绎逻辑的方法的识别结果未经过归纳方法进行证实,这种不平衡的研究现状给颠覆性技术识别理论、方法和实践的突破带来了一定的障碍。总体来看,颠覆性技术识别研究存在以下三个方面难点和不足。

一是演绎逻辑的研究结果的评价以人工解读为主。基于演绎逻辑的研究方法思路是基于具体技术的概念,假设某些数据特征符合技术的概念内涵,然后选择具体领域进行验证,研究结果评价主要依赖专家调查和作者自行验证,并且大多是定性评价,会带来主观评价的问题,研究的可重复性差。基于演绎逻辑方法得出的结论很多尚未通过基于归纳逻辑的方法的进一步验证,方法的泛化能力还亟待研究。

二是颠覆性技术的定义多样、抽象、模糊。由于当前不同的机构、学者对颠覆性技术定义理解各不相同,识别方法的适用范围和识别结果评价也各不相同。当前的各种颠覆性技术概念复杂、模糊,认知难度大,描述偏于抽象等,采用现有的颠覆性技术定义指导的颠覆性技术识别的效果不理想[1];特别是对于基于演绎逻辑的方法来说,颠覆性技术的定义是演绎逻辑方法的大前提,对颠覆性技术不同的理解,将会构建不同的假设,识别的结果无法进行相互比较和评价。

三是颠覆性技术识别领域缺乏统一公开的标注数据集。在人工智能和机器学习等领域有大量的统一公开标注的数据集,研究者只需专注于方法研究,且不同方法识别结果能够相互比较;而颠覆性技术识别领域却缺乏统一公开的标注数据集,研究者需自行收集数据,浪费大量时间。同时,由于数据无标注,基于演绎逻辑的研究结果无法客观量化评价,需要人工介入解读,为基于演绎逻辑的方法研究带来较大障碍;并且由于研究者收集的数据规模较小,纳入归纳逻辑的样本量较小,导致基于归纳逻辑方法的研究结果的可信度较低。

因此,在未来的研究中应加强以下三个方面的研究。

一是加强基于归纳逻辑的颠覆性技术识别方法研究。对当前基于演绎逻辑方法的研究结论亟须采用归纳的方法对当前演绎方法得出的结论进行验证,并且随着大数据和人工智能的发展,使用机器学习方法从海量数据中归纳学习颠覆性技术特征将是未来颠覆性技术方法研究的重点。

二是构建统一权威的颠覆性技术定义。在未来的研究中,要对颠覆性技术定义开展进一步的深入研究,构建统一权威的颠覆性技术定义,为基于演绎逻辑方法的研究提供理论指导。

三是建立公开的、准确标注的颠覆性技术数据集。建立公开的、准确标注的颠覆性技术数据集将会促使基于演绎逻辑的研究方法由人工评价向定量客观评价转变,也会促进基于归纳逻辑的研究方法的发展,将会促进颠覆性技术识别方法的进步。

猜你喜欢
逻辑专利特征
刑事印证证明准确达成的逻辑反思
离散型随机变量的分布列与数字特征
逻辑
创新的逻辑
抓特征解方程组
不忠诚的四个特征
女人买买买的神逻辑
抓特征 猜成语
2007年上半年专利授权状况统计