赵程程 丁佳豪 杨 萌
(上海工程技术大学管理学院 上海 201206)
人工智能(Artificial Intelligence,简称AI)是新一轮科技革命和产业变革的核心引擎。2017年,中国制定了《新一代人工智能发展规划》,确立了“三步走”目标。其中,企业是实现“2030年人工智能理论、技术与应用总体达到世界领先水平,占据国际人工智能科技制高点”这一目标的关键创新主体。然而,随着创新活动越来越复杂,创新活动由原来的“单打独斗”向“多元主体深度协同”转变[1]。跟踪人工智能技术创新,仅关注某个或某类创新主体是无法揭示多元主体之间的深度协同关系。因此,创新主体之间的研发合作被视为提高科研效率的重要手段。其中,创新联合体作为更深层次、更高效率的产学研深度融合组织,是研发合作的一种重要的表现形式[2]。识别人工智能技术创新联合体,分析其结构特征,对各地组建新一批高质量的人工智能技术创新联合体提供参考。
目前有关创新联合体的理论研究主要围绕创新绩效、协同创新、知识转移等主题。随着研究内涵不断深入,创新联合体的协同创新模式、联盟稳定性是持续关注热点前沿[3]。然而,既有研究采用的方法大多是预先确定了创新联盟联合体的主体构成,未能对其领军企业和主体构成进行定量的识别与分析。同时,有关人工智能创新合作的研究大多从科研团队的视角,基于人工智能学科领域合著论文数据进行建模,识别核心研发人员与领军团队[4-6]。较少学者从创新组织研发合作的视角,识别人工智能领域强而有力的研发合作联盟。
基于此,本研究基于对创新联合体的内涵解读,设计一套创新联合体定量识别体系,并将其运用到人工智能领域;聚焦人工智能技术创新联合体的主体识别与结构特征,为跟踪全球人工智能技术创新合作提供新的视角。具体包括两个主要问题:一是如何基于大规模专利数据识别出人工智能技术创新联合体?要回答这个问题,不仅需要解决机构数据的规模化清洗问题,而且需要通过试验确定合适的人工智能技术创新联合体的主体构成;二是如何剖析人工智能技术创新联合体结构特征?本研究从网络结构和研发能力两个维度,将人工智能技术创新联合体进行类别划分;基于AI技术架构,通过解读AI技术创新联合体中各个创新主体的专利内容,分析AI技术创新联合体中不同技术类型企业构成特征。
创新联合体是由龙头企业牵头,高校院所支撑,政府产业政策引导,以及大中小企业广泛参与的联合体[2]。后续学者通过与产学研合作、研发联盟、研究联合体的比较,对创新联合体基本内涵进行了初步探讨。
产学研合作作为重要的创新组织方式,常被应用于科技成果孵化转化,衍生出“双螺旋”[7]、“三螺旋”[8]、“四螺旋”[9]等形态。尽管产学研合作能够极大增加创新单元的知识储备和技术实力,但该模式本质上是官、学、研共同主导的技术牵引型研发模式,与企业为主导、基于用户需求的市场导向型技术创新相背[10]。区别于产学研合作,创新联合体更加强调龙头企业作为核心主体的创新决策力和牵引力,多元主体协同推动关键领域的技术突破[11]。
企业研发联盟是创新合作最早最直接的模式,有助于知识分享,降低成本,获得更大的市场份额[12]。但一般的研发联盟较为松散,对联盟企业约束力有限,通常锁定短期竞争项目,忽略对长期基础性研发目标的追求,项目的结束意味着研发联盟关系的解除[13]。区别于研发联盟,创新联合体是龙头企业联合科研院所、高校和中小企业,形成长期的、紧密的新型组织[14]。
研究联合体是成员企业以共同注资方式,通过契约的形式分享研发成果,局限于大型企业间合作[15]。区别于研究联合体,创新联合体着眼于龙头企业与其他创新主体(科研院所、高校和中小企业)形成稳定的合作关系,而非仅限定于企业之间的研发合作。
通过上述对比研究,本研究认为创新联合体是以龙头企业或头部企业为核心主体,与科研院所、高校和中小企业形成稳定的研发合作关系,实现关键领域技术突破的新型组织模式。
基于对创新联合体内涵的解读,创新联合体的识别流程包括:龙头企业的识别;与龙头企业形成稳定研发合作关系的创新主体的识别。
a.龙头企业的识别:创新联合体中龙头企业与其他创新主体研发合作频繁,具有较高的网络中心性。同时,创新联合体中龙头企业引领其他创新主体以实现关键技术突破为目的,因此龙头企业具有较强的创新能力。
知识图谱工具中“Spotlight”算法可以凸显中介中心性高的节点及其关联效果,常用于识别知识图谱中关键路径上的重要节点[16]。本文首先借助“Spotlight”算法,识别技术创新关键路径上的创新主体(企业、高校和科研机构),并从中拣选出专利数(Count值)大于均值的企业,形成企业集Ki。其次,为了不遗漏专利较高的创新主体,因此从全样本创新主体中拣选专利数较高的企业,形成企业集Hi。最后,将上述企业集Ki、Hi进行集团化合并,形成“龙头企业”。
b.与龙头企业形成稳定研发合作关系的创新主体的识别:知识图谱工具中“Pennant Diagram”算法可以查看与某个节点相关联的主体信息,形成合作关系二维图,显示出与此节点的强关联主体、较强关联主体、弱关联主体[17]。本次研究通过“Pennant Diagram”算法,对上述“龙头企业”的历年强关联和次强关联主体进行扫读,析出出现频次较高(出现两次及以上)的创新主体。上述龙头企业及其创新主体共同构成了创新联合体。
创新联合体的结构特征分析包括创新联合体类别划分和技术结构分析。
b.创新联合体的技术结构分析:通过解读创新联合体中各个创新主体的专利内容,根据技术研发侧重领域的不同,将其划分为掌握专业性技术的专精型企业或掌握通用性技术的泛领域型企业[18]。以AI技术创新联合体为例,具体流程如下:首先,依据人工智能技术架构,通过多轮专家访谈,解读AI技术创新联合体各个创新主体的每条专利内容,标识出各个创新主体在基础层、技术层、应用层的专利数。然后,根据各个层级专利数占比,对AI技术创新联合体中各个创新主体进行类型划分。若某一层级专利数占比≥50%,则认定为某一领域的专精型企业;若各个层级专利数占比较为均衡,则认定为泛领域型企业。基于此,可以分析出AI技术创新联合体由不同技术类型企业组合的特征。
本次研究使用的专利来源于德温特创新专利引文索引数据库(Derwent Innovations Index,DII)。该数据库收录了自1963年以来全球40多个专利机构的大量专利文献,并且是全球科技情报和情报机构的权威数据来源。
检索策略是根据中国专利保护协会发布的《人工智能技术专利深度分析报告》[19]中列举的人工智能的主要技术关键词以及张振刚等人(2018)[20]的检索方法,从而重新构造检索式为TS=(“artificial intelligen*” or “AI” or “Depth learning” or “Basic algorithm ”or “Natural language processing” or “Smart search” or “Speech Recognition” or “Computer vision” or “Gesture control” or “Smart recommendation” or “smart robot” or “Video recognition” or “Voice translation” or “Automatic drive” or “Image Recognition” or “Machine learning”),在德温特创新专利引文索引数据库进行主题检索,时间2017-2022,检索出108263条记录。检索日期2022年4月15日。
本次研究聚焦专利权人,同一个创新机构会有多种专利权人的表述形式。因此,在进行专利数据挖掘与分析之前需要对专利权数据进行清洗、合并、消歧。在已有研究与实践基础上,制定专利权人清洗流程与规则如下。
采用迭代式积累方法设计清洗规则并进行消歧[21]。具体为:第一,机构名称前后顺序不同,实际上是同一家机构,譬如“Donghua Univ”和“Univ Donghua”是同一家机构;第二,同一机构或集团下属的不同实验室或机构,合并到同一个机构或集团。例如以百度为例,根据“BIDU-C”识别出“BAIDU ONLINE NETWORK TECHNOLOGY BEIJING”、“BAIDU ON-LINE NETWORK TECHNOLOGY CO LTD”、“BAIDU USA LLC”均隶属于百度,将其统一标识。第三,同一机构既有缩写名,也有全名,则将所有类型的缩略名统一为该机构的全程。例如“Beijing Univ Aeronaut & Astronaut”和“Beihang Univ”统一称为“Beihang Univ”。
根据上述清洗流程和规则下,在CiteSpace 5.8 R3环境下进行数据清洗,形成“citespace.alias”文件。
由于CiteSpace 5.8.R3无法进行Drewent专利数据转换,所以笔者依次以2017-2022年AI相关专利为数据源,借助CiteSpace 5.5将专利数据转换为可识别的WoS数据格式,在CiteSpace 5.8.R3上进行统计分析和可视化处理。节点类型选择“Institution”,主题词来源选择“title(标题)”“abstract(摘要)”“author keywords(作者关键词)”和“keywords(关键词)”,设置g-index的k=25,选择关键路径pathfinder,得到2017-2022年历年AI技术创新网络图谱。
3.1.1龙头企业识别
表1 AI龙头企业列表
在地区分布上,美国AI龙头企业22家,中国20家,日本11家,德国3家,韩国3家,爱尔兰、荷兰、瑞典各1家。专利数量上,美国数量领先,中国紧追其后,日本与德国、韩国等位列第二梯队。
3.1.2研发合作关系分析
同样,借助Citespace中的“Pennant Diagram算法”,依次绘制出62名龙头企业2017—2022年历年的研发合作关系二维图,识别出历年强关联和较强关联主体[17]。以腾讯集团为例,2017年强关联和较强关联主体有京东方、大立光电股份有限公司、南京邮电大学、重庆大学、东南大学、上海斐讯数据、阿里巴巴、杭州电子科技大学、贝宝、北京工业大学、思爱普、联想、谷歌;2018年强关联和较强关联主体有哈尔滨拓博科技有限公司、合肥工业大学、北京交通大学、京东;2019年强关联和较强关联主体有中山大学、清华大学、电子科技大学、华为、昆明理工大学、同济大学、航天信息股份有限公司、平安科技、中南大学、平安科技、福州大学、成都启英泰伦;2020年强关联和较强关联主体有中国科学院地理科学与资源研究所、北京金山、中兴、泰康保险集团、西安交通大学、阿里巴巴、华为、百度;2021年强关联和较强关联主体有武汉大学、平安科技、中国工商银行、南京信息工程大学 。2022年数据有限无法形成显著的研发合作关系二维图。
通过对上述62家龙头企业的2017—2021历年研发合作关系分析,从中拣选出现频次较高(出现两次及以上)的创新主体,构成13组创新联合体。其中,中国8组,美国3组,韩国2组(见表2)。
表2 各地区AI龙头企业与AI技术创新联合体数量比较
3.2.1类别划分
图1 AI技术创新联合体“中心性-专利数”划分
3.2.2技术结构分析
根据中国信通院发布《人工智能发展白皮书—技术架构篇(2018年)》中对AI技术架构的解读,AI技术可分为基础层、技术层、应用层[22]。其中,基础层是人工智能的核心,即计算能力和持续的数据流;技术层的核心主要在于特征提取、模式与算法选择;应用层是某一算法、模型、技术在特定场景的应用。
依据前述关于AI技术创新联合体的技术结构流程,基于此,课题组通过多轮专家访谈,解读AI技术创新联合体各个创新主体的专利数据内容,标识出每个创新主体在基础层、技术层、应用层的专利数。其中,Ai、Bi、Ci分别表示第i个创新主体在基础层、技术层、应用层的专利数。根据各个层级专利数占比,对创新主体划分为专精型或泛领域型。若某一层级专利数占比≥50%,则认定为某一领域的专精型企业;若各个层级专利数占比较为均衡,则认定为泛领域型企业。“高中心性—高专利数”、“高中心性—低专利数”、“低中心性—高专利数”、“低中心性—低专利数”四类AI技术创新联合体的技术结构如表3~表6所示。
表3 “高中心性—高专利数” AI技术创新联合体技术结构分析
表4 “高中心性—低专利数”AI技术创新联合体技术结构分析
表5 “低中心性—高专利数”AI技术创新联合体技术结构分析
表6 “低中心性—低专利数”AI技术创新联合体技术结构分析
本研究基于对创新联合体的内涵解读,设计一套创新联合体定量识别体系,将其运用到人工智能领域,识别出13组AI技术创新联合体,并对其结构特征进行分析,总结出以下三点特征。
a.中、韩AI技术创新联合体多为本土企业之间协同创新,中美国企业研发合作从蜜月期渐入冰封期。中、韩两国AI技术创新联合体多为本土创新主体之间的创新合作,缺乏跨区域的联合创新。中国龙头企业偏好与本土ICT巨头、专精型企业联合创新。中国AI创新联合体多为“PBATH”(平安科技、百度、阿里巴巴、腾讯、华为)之间强强联手,聚焦AI各个层面技术领域的纵横布局。其中,腾讯表现最为活跃,是平安科技、百度、华为、阿里巴巴的“硬核伙伴”。同时,“PBATH”企业携手专精型企业,开拓AI应用端场景。例如,京东凭借数据资源和场景优势,携手金山软件,着力于提升京东云算力。中国南方电网积极与微软、安恒信息等信息企业,信息创新研究院等科研院所,展开新型电力系统方面的技术合作,打造全球首个电力人工智能计算平台,推动AI赋能数字电网化转型。
相比中国,韩国AI技术创新联合体的构成较为单一,多为LG与三星之间技术合作。在自然语言处理领域,韩国的三星,电信研究院和LG专利申请量位居世界前列;在智能语音领域,韩国的三星和LG的专利申请量也处于领先地位。
在美国政府对华企业正式采取技术封锁之前,AMD、高通、NVIDIA和IBM在内的美国大型科技公司偏好与中国企业开展各类科研活动,包括设立研发实验室和研发项目等。2020年起美国对华科技封锁不断升级恶化,重创了中美企业长久以来采用的研发合作关系。在对美国AI龙头企业的研发合作关系分析发现,2020年起中美企业间的研发合作从蜜月期进入冰封期。
b.中、韩AI技术创新联合体多为ICT巨头之间的强强联合,美国AI巨头偏好与初创型企业联合研发。中国AI技术创新联合体大多为ICT巨头“PBATH”(平安科技、百度、阿里巴巴、腾讯、华为)之间的强强联手。韩国AI技术创新联合体多为三星电子、LG、韩国电信公司、韩国电子通信研究院的互联互助。美国AI巨头选择研发合作伙伴从倚重高年限企业,逐渐青睐具有创新潜力的初创企业。以谷歌为例,尽管专利合作规模不断扩张,但谷歌的研发合作企业数量减少,合作频率提升;在研发合作伙伴上,谷歌逐步选择具有全球品牌价值的黄金企业以获取先进资源与知识,瞄准初创企业的创新优势,结合其创新力展开研发合作[23]。
c.国际AI研发合作频次降低,各国形成研发合作的“小圈子”。国际AI研发合作频次降低,呈现出逆全球化的特征。在对2017-2022年AI龙头企业的研发合作关系的计量发现,自2019年起Facebook、苹果、通用、亚马逊、微软、DELL、Adobe、Salesforce等美国企业与中国创新主体研发合作频次逐年降低。特别是,掌握基础层技术的IBM、Intel、NVIDIA与中国企业的研发关系不再显著。
韩国本土创新主体之间形成了AI研发合作的“小圈子”。三星电子、LG、韩国国防科学研究所、韩国电子通讯研究院、韩国科学技术院之间构建强有力的研发合作联盟。相比与美国等西方国家的AI合作,韩国三星电子、LG偏好与中国的华为科技展开智能芯片领域的研发合作。但是,需要引起注意的是,2022年韩国判读全球半导体供应链重构动向,相比中国大陆巨大的市场吸引,为了获得美国、日本的技术和设备,韩国政府将会加入以美主导的AI联盟[24]。中韩AI 技术研发合作关系或将面临新的考验。
本研究在创新联合体识别与结构特征分析方面进行了有意义的探索,尚存在一定的不足。一方面,基于知识图谱的Spotlight算法和Pennant Diagram算法对AI技术领域内的龙头企业和强(次强)关联主体的识别具有较好的效果,但并不能识别所有的AI技术创新联合体,如一些规模较小且缺少技术领域头部企业的创新联合体;另一方面,在研究数据上,还需要进一步扩大研究样本,融合多源数据,以验证研究结果的普适性。