刘 媛,杨 涛,胡 峰,王俊峰,陆丽娜,黄 斌
(1.江苏省科学技术情报研究所,江苏南京 210042;2.河海大学商学院,江苏南京 211100;3.河海大学项目管理信息化研究所,江苏南京 211100)
未来产业是会带来重大产业变革的产业。江苏省委省政府提出要针对江苏产业发展的技术短板和创新需求,加强技术研判,分析产业前景,促进应用基础研究、前沿高技术研究与产业关键技术攻关紧密衔接,在目前没有优势但可能有良好前景的领域,要进行前瞻布局。因此,对未来产业及前沿热点技术的研究有利于江苏抢占产业发展先机,科学合理配置科技资源,准确把握产业发展方向。本研究从国家发展战略、国家科技项目布局的视角出发,遴选发达国家科技发展战略、顶尖咨询机构权威报告、我国重点科技项目布局方向,运用共词分析方法进行共词网络分析,根据高频词遴选未来产业领域,从未来产业中进一步遴选适合江苏发展的产业,并以人工智能产业为例,利用文献计量学和知识图谱方法进行热点主题研究,由此判断江苏未来产业前沿热点技术方向。2017 年11 月14 日,南京市政府发布会上称南京将构建“4+4+1”的未来产业体系,“未来产业”在学术界并没有明确的定义,江苏省委常委、南京市委书记张敬华认为,未来产业是能够具有重大产业前景的颠覆性技术以及新产品、新业态,如人工智能、未来网络、增材制造以及前沿新材料、生命健康等交叉应用领域[1]。
发达国家以及如麦肯锡、高德纳等国际顶尖机构已经对未来产业、前沿热点技术做了大量研究,本研究从发达国家以及国内外顶尖咨询机构发布的权威报告、我国重点计划项目的角度遴选引领江苏发展的未来产业领域,主要包含发达国家的科技计划、未来产业前沿技术的判断和重点计划项目的布局,根据这个原则选取了近5 年来15 份权威报告作为未来产业领域遴选的依据,如表1 所示。
表1 未来产业筛选的主要来源报告
采用文本梳理法,对15 份报告中提到的未来产业领域进行频次统计并进行归一化处理,使数据颗粒度大小统一到一个层级,如将“先进机器人”“社交机器人”“机器人技术”等统称为“先进机器人”,将“万物互联技术”“物联网”等统称为“物联网”,通过聚类分析绘制如图1 所示的发达国家提出的未来产业网络图,可以看出排名前15 位的未来产业领域为网络安全、新能源、先进机器人、人工智能、增强现实、自动驾驶汽车、大数据分析、3D 打印、先进制造、先进材料、物联网、量子计算、核能、高性能计算机、电池等产业;如图2 所示,从顶尖咨询机构遴选出的未来产业领域为先进机器人、人工智能、云服务、生物技术识别、自动驾驶汽车、区块链、核能、网络安全、储能技术、增强现实等领域。通过对比发现,从国家战略维度看,发达国家更加关注新能源、大数据分析、3D 打印、先进制造、先进材料、物联网、量子计算、高性能计算机、电池等未来产业领域,偏重于能源、制造和信息领域,而顶尖咨询机构着眼于生物识别技术、云服务、区块链等未来产业。根据未来产业出现的频次进行统计,网络安全、先进机器人、人工智能、增强现实、自动驾驶汽车、核能等6 个领域为发达国家和顶尖咨询机构共同关注的交叉领域。
图1 发达国家提出的未来产业网络
图2 顶尖咨询机构提出的未来产业网络
以2018—2019 年我国国家重点研发计划项目、科技创新2030 重大项目为样本,遴选未来产业的重点领域[17-18],我国未来产业领域为智能机器人、智能制造、清洁能源、新材料、农业创新、智能交通、智能电网、医疗与健康、深海工程、航空航天、量子通信等领域(如图3 所示)。国内外对比看,制造、信息、能源、材料领域成为国内外共同关注的热点领域,我国更加聚焦智能制造、新材料、农业创新、智能电网、医疗与健康、深海工程、航空航天、量子通信等未来产业。
图3 我国国家层面提出的未来产业网络
综合国内外对未来产业的研究,通过对相同领域的去重、名称相近领域的合并,如与国外名称相近的先进机器人等只保留更加符合我国通用名称的智能机器人,共遴选出网络安全、智能制造、人工智能、增强现实、自动驾驶汽车、大数据分析、3D打印、物联网、量子计算、核能、高性能计算机、电池、云服务、区块链、储能、智能机器人、清洁能源、新材料、农业创新、智能电网、医疗与健康、深海工程、航空航天、量子通信24 个产业作为引领江苏发展的未来产业备选领域。
1.3.1 江苏未来产业遴选指标建立
基于上述引领江苏发展的未来产业备选清单,从江苏发展基础的维度建立未来产业的遴选指标,并通过江苏省工信厅等相关厅局专家、部分领域技术专家对各项指标进行打分,遴选引领江苏发展的未来产业领域。从产业发展的支撑要素维度来建立遴选指标,包括政策支持、创新资源、顶尖人才、企业布局、技术储备5 个方面(如表2 所示)。
表2 江苏未来产业遴选指标
根据专家打分的结果,剔除分值在5 分以下的产业领域,按照分值从高到低排序,遴选出适合江苏发展的未来产业为新材料、物联网、人工智能、高性能计算机、网络安全、智能机器人、电池、智能制造、医疗与健康、云服务、清洁能源、智能电网、区块链、3D 打印、增强现实、储能。根据遴选出的未来产业结果,以人工智能产业为例,进一步研究人工智能的前沿热点技术,为江苏未来进行技术方向的布局提供参考。
1.3.2 江苏人工智能产业现状分析
江苏一直高度重视人工智能产业的培育和发展,已突破了一批关键技术,布局了一批创新平台,集聚了一批人才团队,具有良好的产业发展基础。
一是具有良好的技术基础。根据省自然科学基金资助项目库,2012—2017 年共资助新一代人工智能相关项目454 个,技术储备主要在传感器、机器视觉、机器人方面,江苏在机器学习、计算视觉、机器人、专家系统等方面有一定优势。同时,江苏围绕脑科学、神经科学、多模式识别、智能机器人等前瞻领域,已组织实施前瞻性产业技术攻关项目115 项、重大科技成果转化项目32 项[19]。
二是具有相当实力的创新平台。江苏科教资源丰富,拥有南京大学、东南大学、南京理工大学、中国电子科技集团公司第十四研究所和第二十八研究所(以下分别简称“中电14 所”“中电28 所”)等单位,在人工智能领域拥有较强的研发实力,建有计算机软件新技术、国家超算中心、网络群体智能、工业机器人、智能运输系统工程、高维信息智能感知与系统、智能车辆控制、物联网等10 多个国家和省级重点实验室及研究中心,拥有较强的创新实力。其中,南京大学的计算机软件新技术国家重点实验室在新一代人工智能大数据智能分析、高级机器学习算法等方面的研究具有较强实力;无锡国家超算中心的“神威·太湖之光”超级计算机曾获世界超级计算大奖——“戈登·贝尔”奖,连续4 次获得全球超级计算机500 强冠军。
三是拥有一定的产业优势。江苏在人工智能产业的基础层、技术和应用层的全产业链上形成了较为完善的布局,具有一定的产业基础。据省经济和信息化委员会数据,截至2017 年年底,全省有人工智能核心企业360 多家,有10 多家企业处于行业领先地位[20]。苏南地区聚集了90%的人工智能企业,主要分布在苏州工业园区、南京江北新区和南京经济技术开发区等园区,主要在智能传感器、大数据、云计算、智能机器人、机器识别等五大领域进行研发。南京、苏州、无锡等地已聚集了旷视科技、地平线机器人、思必驰、云问科技、妙手机器人、亿嘉和、科沃斯、钱景康复等一批细分领域较为知名的人工智能企业。
四是拥有优秀的人才团队。江苏在人工智能领域拥有以院士、国家杰出青年科学基金获得者、国家优秀青年以及长江学者等高层次专家组成的团队。在技术人才方面,南京大学的吕建教授和地平线机器人创始人余凯入选国家人工智能战略咨询委员会,相关人才主要集中在南京大学、东南大学、南京理工大学、中电14 所等科研机构,以及地平线机器人、旷视科技、思必驰等创新型企业中。在产业人才方面,根据腾讯研究院[21]报告,江苏的人工智能人才占全国人工智能人才的3.3%,位列第五,次于北京44.7%、上海14.8%、广东14.6%和浙江10.9%。
以“artificial intelligence”为关键词在Web of Science(以下简称“WOS”)的核心数据库进行主题检索,时间设置为2010—2019 年,在对不相关性文献作剔除操作后,确定11 846 份样本文献,其中英文样本文献共计引用23 635 篇参考文献,作为研究国际人工智能领域进展的样本数据。
国内样本文献来源为中国知网(CNKI)中SCI、EI 来源期刊和CSSCI 期刊,采用“人工智能”关键词的主题检索,时间跨度为2010—2019 年,剔除不相关文献之后确定4 996 份中文样本文献[22]。
从国内外发文量对比来看,从2010 年开始,人工智能领域发文量呈现逐年增长的趋势,英文文献的发文量明显高于中文文献的发文量,但整体增长趋势相同。如图4 所示,发文量在2010—2016 年度呈缓慢增长的趋势,英文文献发文量的年平均增长率为10.9%,中文文献发文量的年平均增长率为2.2%;在2016—2019 年期间呈现快速增长趋势,中、英文文献发文量的年平均增长率分别为44.7%、74.2%。由此可见,在2016 年之前,英文文献的平均增速是中文文献的5 倍,但2016 年之后,中英文文献都呈现爆发式增长趋势,中文文献的增长速度远超英文文献。
图4 国际、国内人工智能领域年发文量对比
根据来自WOS 数据库的样本发文量可以看出,美国发文量1 570 篇位居全球第一,占总发文量的13.25%;中国发文量1 536 篇,排名第二,占总发文量的12.97%。说明美国和中国是近10 年来人工智能领域研究最为活跃的国家。如图5 所示。
图5 国际人工智能领域研究国家分布
2.2.1 基于文献共被引图谱的人工智能热点技术分析通过对样本中英文文献作者的共被引图谱分析,可以看出人工智能产业的热点技术。当两篇文献同时被第三篇文献引用时,这两篇文献之间就存在共被引关系,文献被引频次可以较客观地反映该文献被学术界或知识域所认可的程度,及其在网络中的地位[22]。一个领域内持续高被引的文献被认为是这个领域的经典文献,因此从高被引文献可以看出人工智能领域的研究基础状况。
(1)从国际人工智能领域文献共被引图谱看人工智能的热点。在CiteSpace V 软件中设定网络节点为CitedReference,生成国际人工智能领域文献的共被引图谱(如图6 所示)。结合频次和中心度两个维度,对中心度位于0.04 以上的文献进行了梳理,人工智能的热点主要为改进的群体人工智能算法、迁移学习算法、优化智能行为算法等。如,Rashedi等[23]提出了一种基于群体的自然启发元启发式优化算法,并验证了该算法的计算效能提升;Pan 等[24]提出的一种基于标签比例信息的迁移学习算法,实现了对深度学习算法的优化;Karaboga 等[25]进行了Artificial Bee Colony(ABC)算法的研究,将该算法与遗传算法、粒子群优化算法、微分进化算法等进行比较分析,确定ABC 算法是一种能优化智能行为的算法,可以高效解决工程问题,另外还通过仿真数据进行测试,证明ABC 算法在多变量数据聚类方面的优越性;Schmidhuber[26]总结了深度监督学习、非监督学习、强化学习和进化计算的特点。
图6 国际人工智能领域文献共被引图谱
(2)从国内人工智能领域核心文献看人工智能热点。由于CNKI 导出的数据没有办法作共被引分析,所以根据被引频次遴选出国内排名前五的核心文献,可以看出国内人工智能的热点主要集聚在神经网络、深度学习、卷积神经网络以及人工智能在智慧驾驶、智慧旅游方面的应用等几个方面。其中(见表3),被引频次排名第一的为余凯等[27]的研究,他们提出深度学习是机器学习领域最近这10 年来最成功的研究方向,并指出深度学习面临的重大方向为理论问题、建模问题和工程问题;周飞燕等[28]对卷积神经网络的卷积层、池化层、全连接层的结构做了探讨,并研究了改进的卷积神经网络,提出卷积神经网络与递归神经网络的集成是一个途径;张凌云等[29]提出了CAA 三层次的智慧旅游构架体系,以及基于物联网、移动通信、云计算和人工智能技术在智慧旅游中的应用;焦李成等[30]研究了当前神经网络存在的问题,并提出认知神经网络、主动神经网络、感知-理解-决策神经网络、复杂神经网络实现、深度神经网络、大数据深度学习6 个未来发展方向;苏松志等[31]将人工智能技术用于自动驾驶领域,指出以往研究中行人检测技术的不足,并提出未来行人检测技术将聚焦在多视角和遮挡问题、特殊场景下的行人检测问题、设计自适应的检测器3 个方面。
表3 人工智能领域排名前五的高被引中文文献情况
2.2.2 基于关键词聚类图谱的人工智能热点技术分析
通过对关键词的聚类研究,可以根据关键词共现图谱中出现的圆圈大小来分析其在人工智能产业中出现的频次,如果圆圈越大,代表出现的频次越高,即为高频关键词;而从中心度可以看出该关键词与其他关键词联系的密切程度。
(1)国际人工智能领域研究热点分析。国际人工智能领域样本文献关键词共现图谱如图7 所示,前10 位的研究热点包括神经网络、模型、系统、人工神经网络、预测、遗传算法、机器学习、设计、优化、分类、性能、支撑向量机、仿真、回归分析等方面;进一步通过关键词利用LLR 算法进行聚类,该网络被划分成11 个聚类,系统又自动梳理出四大聚类,如图8 所示,分别是机器人、物联网、特征提取、强化学习。由此,可以挖掘国际上2010至2018 年间人工智能领域的研究发展脉络。其中,2010—2015 年的热点关键词为系统、模型、算法,贝叶斯网络、决策树以及人工神经网络是热点算法,并关注多智能体系系统,同时也重视图像识别和图像加工等人工智能技术;2016—2018 年的热点关键词为物联网和大数据,智慧城市、工业、建筑物联网成为物联网的三大主导项目[32],在5G 技术的发展之下,物联网向万物智能转型,核心技术逐渐成熟,同时催生并促进了大数据产业的飞速发展。根据互联网数据中心(IDC)的数据,预计到2030 年,全球大数据储量将达到2 500 ZB;美国有6 个联邦部门开展大数据研究,大数据已上升至美国的国家重点战略;欧盟则从资金、政策层面支持大数据相关的研究[33]。
图7 国际人工智能领域文献关键词共现图谱
图8 国际人工智能领域文献聚类图谱
(2)国内人工智能领域研究热点分析。根据国内人工智能领域样本文献关键词共现图谱(见图9),可以看出位于前10 位的研究热点呈现以下几个特点:一是关于人工智能的算法研究,如深度学习、机器视觉、计算机视觉、语义网络、神经网络、图像处理、路径规划等;二是与其他领域交叉融合,如机器人、智能机器人、大数据、图书馆等;三是与教育领域的融合应用,如媒体融合、智慧教育、智能教育、图书馆等。对关键词利用LLR 算法聚类成18 个集群,系统再次聚类7 个集群,如图10 所示,可以发现国内研究热点分为模糊控制、遗传算法、自然语言处理、深度学习、模式分类、教育信息化2.0、社会治理。由此,可以发现我国在2010至2018 年间人工智能领域的研究和发展脉络。其中,在2010—2012 年,计算机视觉、路径规划、轨迹跟踪、智能机器人成为研究热点。计算机视觉通过模拟人类的视觉系统对图像进行处理和理解;路径规划被大量应用于机器人、无人机等产业领域以及全球定位系统(GPS)导航、道路规划等生活领域,甚至可应用于决策管理领域和通信技术领域;我国从20 世纪70 年代开始开展机器人研发工作,国家制定相关政策大力支持,如2016 年出台《机器人产业发展规划(2016—2020 年)》[34],2013 年我国形成全球工业机器人第一大规模市场,同时手术机器人、空间机器人等服务机器人和特种机器人也投入应用。2013—2015 年的研究热点为大数据和物联网。2013年大数据成为我国的新闻热点,2014 年形成概念体系,发展热点呈现了从技术、应用、向治理变迁。2016—2018 年的研究热点更加关注智慧教育、智慧社会以及区块链。2018 年,我国智慧教育市场规模高达5 320亿元,教育部明确提出教育信息化升级[35],实现教育多元化、智能化,“三通两平台”的应用标志我国开始教育信息2.0 升级,预计到2025 年我 国智能教育经费投入达4 800 亿元;我国在IBM 公司提出的“智慧城市”概念基础上加以创新,提出智慧社会,党的十九大报告提出“智慧城市”和“数字中国”的概念,完成智慧社会建设以进行有效的社会治理,国内各地区都发布了相关文件加快智慧社会建设;2019 年我国区块链市场规模已经达到了12 亿元,企业数量多达1 006 家,区块链的应用领域不断拓展,在金融领域的应用最为广泛[36]。
图9 国内人工智能领域文献关键词共现图谱
图10 国内人工智能领域文献聚类图谱
根据2019 年国际人工智能领域样本文献的关键词出现频次和中心度,统计出5 个前沿关键词(见表4),出现频次和中心度最高的两个关键词都是在医疗领域,可见人工智能在医疗领域的应用将成为产业发展的前沿。其中,cancer(癌症)是2019 年出现频次最多的关键词,临床专家可以从临床症状的细节到各种生化数据以及成像设备的输出掌握大量信息,人工智能方法特别是计算机辅助诊断和人工神经网络能简化日常诊断过程并避免人工误诊[37]。中心度最高的关键词是imagine classification(影像学分级),在放射科领域应用人工智能技术,通过对图像的定位分类和切割功能,实现疾病筛查和三维成像[38]。
表4 2019 年国际人工智能领域研究前沿关键词
根据国内人工智能领域样本文献的热点关键词进行统计,并按照时间排序,2019 年10 个研究前沿关键词如表5 所示。其中出现频次最多的是社会治理和人才培养。全球性智能革命影响我国治理现代化的进程,需要抓住人工智能带来的第四次科技革命,加快建设和治理智能社会[39]。近年来我国加快推进人工智能学科和专业建设,教育部提出在2020 年完成优化科技和学科创新体系布局[40],截至2019 年1 月,成立人工智能研究所或学院的高校有59 所,此外龙头企业也重视与高校合作成立人工智能重点实验室。中心最高的关键词是5G。5G 是第七次信息革命的基础[41],带来了行业智能化转型和社会信息需求的激增,与人工智能融合应用于智慧医疗、智慧物流、物联网等多种典型应用场景,推进云化转型,转变社会生产方式。
表5 2019 年国内人工智能领域研究前沿关键词
通过对未来产业和国内外人工智能领域前沿热点技术的研究,得出以下结论:
(1)对发达国家和顶尖机构关于未来产业的高频词研究,提供了研究未来产业的一种理论框架,借助这种理论框架可以较为准确地判断一个区域未来产业的发展方向;通过知识图谱的研究可以进一步聚焦未来产业的重点技术发展方向,了解国内外最新的技术前沿、热点,对区域结合自身基础发展未来产业指明了路径,也可为区域布局重大载体、进行科技项目的布局提供指引。
(2)人工智能领域是引领江苏发展的未来产业的重点领域之一。人工智能是世界各国重点布局的产业,也是江苏高度重视和发展的产业,江苏已经在科技项目、重大平台、骨干企业、研发人才方面作了重要布局,有基础去推动人工智能产业进一步向高端化迈进。
(3)美国和中国是人工智能领域中研究活跃度最高的两个国家。国际人工智能领域发文量一直超过国内,尤其在2016 年之前增速远超国内,但在2016—2019 年间国内人工智能领域发文量实现快速增长,发文量跟随美国排名第二。这除了与人工智能产业本身与其他产业的交叉融合有关,也是因为我国在国家层面实施了“互联网+人工智能”行动计划、人工智能专项规划、科技创新重大专项等一系列顶层设计,充分显示了人工智能产业作为未来产业的热点领域对其他产业的支撑引领作用。
(4)国际人工智能领域的热点技术为机器人、物联网、特征提取和强化学习,逐步向系统、模型和算法的研究过渡,重视人工智能领域与物联网和大数据技术的融合发展,未来的前沿技术向医疗领域尤其是精准医疗方向发展。国内也同样重视人工智能算法领域的研究,热点技术为模糊控制、遗传算法、自然语言处理、深度学习、模式分类等,并且重视与教育领域的融合应用,如媒体融合、智慧教育、智能教育、图书馆等,未来的前沿技术向社会治理、5G、人才培养等方向发展。
(5)江苏人工智能产业应注重“强长项、补短板”。江苏七成企业集聚在人工智能的应用层面,结合国内外的技术发展趋势和江苏的优势基础,未来应拓展人工智能的应用领域,加强在医疗领域、教育领域等需求量大的领域的布局;而对于人工智能算法、基础研究等短板领域,江苏应充分发挥南京大学等高校院所及南京图灵人工智能研究院的重要作用,加强对模糊控制、遗传算法、自然语言处理、深度学习等算法的研究。