赵 建,吕凤先
1.中国科学院 文献情报中心,北京 100190
2.中国科学院大学 经济与管理学院 信息资源管理系,北京 100190
量子计算是利用诸如叠加和纠缠等量子现象进行数据编码、存储与运算的一种颠覆性技术,能够实现经典计算技术无法实现的巨大信息携带量和超强并行计算处理能力[1]。作为一项颠覆性技术,因其在数据存储和并行计算方面的优越性能和巨大潜力,量子计算已经引起世界各国的广泛关注。美国、英国、欧盟、日本等国家相继出台一系列政策文件,加大对量子科技的扶持力度。我国政府也高度重视量子科技的发展,习近平总书记指出“要充分认识推动量子科技发展的重要性和紧迫性,加强量子科技发展战略谋划和系统布局,把握大趋势,下好先手棋”。
现有研究主要聚焦于世界主要发达国家在量子计算领域制定的战略规划、项目布局以及技术发展路线,鲜有研究以一定时间跨度内的文献作为研究样本,结合定量和定性分析方法探索量子计算领域的研究热点与发展趋势。鉴于此,本研究结合文献计量和内容分析法,借助文本挖掘软件和可视化分析工具,对近15年来量子计算领域的文献进行分析和总结,全面剖析该领域的研究现状、研究热点和发展趋势,以期为我国在该领域的战略规划和后续发展提供借鉴和参考。
本文的数据来源是Web of Science 核心合集数据库,检索式如下:TS=((quantum NEAR/2 comput*)OR(quantum NEAR/2 algorithm*)OR(quantum NEAR/2 simulat*)OR(quantum NEAR/2 error*)OR(“quantum Circuit”OR“Quantum cellular automata”OR“Quantum Turing machine”OR“Quantum register”)OR(“Quantum search”OR“Quantum maps”OR“quantum chaos”OR“Quantum games”OR“Quantum random walks”OR“Quantum template matching”)),文献类型限定为“Article”,检索年限为2007—2021 年,引文索引选择SCⅠ-Expanded,共检索得到32 273 篇期刊论文,剔除相关度较低的文献后得到文献32 011 篇,检索时间为2022年11月15日。
本文结合文献计量和内容分析法,利用文本挖掘工具Derwent data analyzer(DDA)与可视化分析软件CiteSpace、Gephi和VOSviewer,以量子计算领域的相关文献为研究对象,从发文趋势、主要国家/地区、研究机构、核心作者以及核心文献等方面揭示量子计算领域的研究现状和发展趋势,绘制文献共被引网络、关键词共现网络、关键词聚类网络以及突现词图谱,追踪该领域的研究热点和最新前沿,以期为我国量子计算领域政策的制定和相关产业的发展提供参考和借鉴。
年度发文量的变化情况反映了一个领域经历的发展阶段及未来的发展趋势。2007—2021 年量子计算领域共发表相关文献32 011篇,发文量的年度变化趋势如图1所示。量子计算领域发文量总体上呈现增长趋势,大致可以划分为三个阶段:第一阶段是2007—2010年,共发表文献5 629篇,占文献总量的17.58%,其中2008—2009年增幅较大。第二阶段是2011—2017年,共发表文献13 049篇,占文献总量的40.76%。第三阶段是2018—2021年,该阶段发文量增速加快,共发表文献13 333篇,占文献总量的41.65%,年均增长量为445篇。根据各国对量子计算领域的高度重视,可以预测未来几年发文量仍会持续增长。
图1 量子计算领域年度发文量变化趋势图Fig.1 Trend chart of annual publication volume in field of quantum computing
分析发文国家/地区可以了解主要国家在该领域的科研实力水平和发展现状。本文利用文本挖掘软件DDA 对量子计算领域相关文献进行统计分析,得到主要发文国家/地区的发文量及其被引频次,如表1所示。
表1 量子计算领域发文量排名前10位的国家Table 1 Top 10 countries in field of quantum computing
由表1可知,在发文量方面,美国位居第一,其次是中国、德国、英国和日本。经统计,发文量排名前10 位的国家共发表文献25 967篇,占文献总量的81.12%,说明这10个国家在该领域具有雄厚的科研实力。截止到2022年11月15日,在篇均被引频次方面,美国仍然位居第一,其篇均被引频次为43.59。其次是德国、法国、加拿大,篇均被引频次均在40 以上。我国虽然发文量排名第二位,但论文的篇均被引频次偏低,这说明我国的论文影响力有待提高。
本文利用Gephi 软件对发文量排名前20 位的国家间的合作关系进行了可视化呈现,如图2所示。图中的每个圆圈代表一个国家,圆圈的大小代表国家发文量的多少;圆圈间的连线代表两个国家有合作关系,连线的粗细表示合作次数的多少。整个合作网络密度较高,说明各国间的合作关系较为密切。美国处于整个网络的核心位置,中介中心性最高,与我国合作频次最高,合作发文1 012篇。其次,美国与德国、英国、加拿大、法国也有较为紧密的合作。除美国外,我国与德国、英国、日本也有合作,但合作的次数相对较少。
图2 量子计算领域主要国家合作网络图Fig.2 Cooperation network diagram of major countries of quantum computing
通过对一个领域的主要研究机构进行分析可以帮助读者了解该领域机构的科研实力水平,识别重要的研究团队。本文利用DDA软件对量子计算领域的主要研究机构进行统计、去重、合并等操作后,得到发文量排名前10 位的研究机构,如图3 所示。其中,加州大学系统包含洛杉矶分校等10个校区。由图3可知,该领域的主要研究机构以高校为主,加州大学系统发文量位居首位,其次分别是中国科学院、美国能源部、马克斯·普朗克科学促进会。排名前10 位的研究机构中有4 所来自美国,有2 所来自中国,德国、俄罗斯、加拿大和新加坡各有1所。经统计,发文量排名前10位的研究机构共发表文献6 605篇,占文献总量的20.63%。
图3 量子计算领域发文量排名前10位的研究机构Fig.3 Top 10 research institutions in field of quantum computing
为了探究主要研究机构间的合作关系,本文利用Gephi 软件绘制发文量排名前20 位的研究机构间的合作网络图,如图4所示。加州大学系统与美国能源部的合作次数最多,合作发文159篇。其次是中国科学院和中国科技大学,合作发文120 篇。同时,中国科学院与清华大学、北京大学也有较为紧密的合作关系。美国的哈佛大学和麻省理工学院也形成了较为稳定的合作关系,合作发文87篇。通过分析后发现,量子计算领域研究机构间的合作关系受地理位置的影响较大,同一国家内研究机构间合作强度普遍高于不同国家间的研究机构。我国研究机构的合作关系也主要集中在国内机构之间,与国外机构的合作频次相对较少。
图4 量子计算领域主要研究机构合作网络图Fig.4 Cooperation network diagram of major research institutions in field of quantum computing
分析一个领域的研究人员有助于了解该领域的核心作者及合作团体,便于寻找同领域的合作作者。本文利用DDA 软件对文献数据集中的作者进行合并、消歧等操作,得到了量子计算领域发文量排名前10 位的学者,如图5所示。其中,有两位学者曾荣获墨子量子奖,分别是来自中国科学技术大学的潘建伟教授和来自奥地利因斯布鲁克大学的Peter Zoller教授。
图5 量子计算领域发文量排名前10位的学者Fig.5 Top 10 scholars in field of quantum computing
经统计,发文量排名前10位的学者共发表文献862篇,占文献总数的2.69%,人均发文量86 篇左右。发文量最多的学者是来自中国科学技术大学的郭光灿教授,研究领域主要分布在量子光学、量子密码、量子通信和量子计算等方面。发文量排名前10 位的学者中有4 位来自中国,分别是郭光灿(中国科学技术大学)、潘建伟(中国科学技术大学)、龙桂鲁(清华大学)和吕劲(北京大学)。这说明我国在该领域已经涌现出了一批“领军人物”。
当两位作者的文献同时被第三篇文献引用就称两位作者存在共被引关系,共被引频次越高,说明他们的学术关系越密切[2]。通过作者共被引分析可以发现领域的高影响力学者。表2 列出了共被引频次排名前10 位的学者信息。图6 所示是量子计算领域作者共被引分析图谱。澳大利亚学者Nielsen,Michael A的共被引频次最高,研究贡献包括控制纠缠量子态操纵的优化定理,被Science评为1998 年年度十大突破之一。其次是ⅠBM院士和美国国家科学院院士Bennett,Charles H,曾荣获2019 年度量子墨子奖,是可逆计算、量子密码、量子信息等方向重要的先驱者和奠基者。排在第三位的是美国应用数学家Shor,Peter W,曾荣获2018 年度墨子量子奖,提出了Short算法。
表2 量子计算领域作者共被引频次排名前10位学者Table 2 Top 10 scholars of quantum computing in terms of co-citation frequency
图6 量子计算领域作者共被引分析图谱Fig.6 Co-citation analysis diagram of authors in field of quantum computing
1973 年,美国情报学家Small 和苏联情报学家Ⅰrina Marshakova首次提出了文献“共被引”的概念,作为测度文献间关系程度的一种方法[3]。如果两篇(或多篇)文献同时被一篇或多篇文献所引用,那么这两篇(或多篇)文献就构成了共被引的关系。基于文献共被引频次的高低可以识别研究领域中产生过重大影响的文献,可以用来衡量文献的重要程度,识别领域的核心文献和知识基础。本文利用VOSviewer 软件对量子计算领域的文献进行共被引分析,得到了文献共被引分析图谱,如图7所示。根据图7 整理了共被引次数排名前10 位的文献信息,如表3所示。
表3 量子计算领域共被引频次排名前10位的文献Table 3 Top 10 literatures of quantum computing in terms of co-citation frequency
图7 量子计算领域文献共被引分析图谱Fig.7 Co-citation analysis diagram of literatures in field of quantum computing
由图7和表3可知,Nielse等[4]于2000年出版的专著Quantum Computation and Quantum Information的共被引频次最高,该书详细介绍了量子计算和量子信息领域的重要思想、基本知识和最新成果,属于量子计算领域的经典著作。其次,Feynman[5]在1982 年发表的文献“Simulating Physics with Computers”的共被引频次位居第二,该篇文献首次提出了量子模拟的概念,将其用来规避用经典计算机模拟量子物理的困难,提出了量子计算的早期概念构想。排名第三的是Kitaev[6]在2003年发表的“Fault-Tolerant Quantum Computation by Anyons”,该篇文献介绍了拓扑量子计算模型,用于解决量子计算中退相干和量子纠错问题。排名第四位的是Raussendorf 等[7]在2001 年 发 表 的“A One-Way Quantum Computer”,该篇文献提出了一种新的量子计算模型——单向量子计算,该方法完全由对特定纠缠态(簇态)的单向量子位测量组成。排名第五位的是Shor[8]在1997 年 发 表 的“Polynomial- Time Algorithms for Prime Factorization and discrete Logarithms on a Quantum Computer”,该篇文献提出了一种突破性的整数因子算法,该算法证明了量子计算机在计算大数的质因子分解时的速度是经典计算机的指数倍。排名第六位和第七位的分别是Grover[9-10],发表的“A Fast Quantum Mechanical Algorithm for Database Search”“Quantum Mechanics Helps in Searching for a Needle in a Haystack”,这两篇文献介绍了量子数据库搜索算法—Grover算法。
关键词作为文献研究内容的高度浓缩和概括,在一定程度上可以反映出某一领域内的研究方向和趋势,高频关键词可以看作该领域的研究热点[11]。因此,分析关键词共现网络中的高频关键词及关键词间的共现关系可以了解所要研究领域内的研究热点。本文利用DDA软件对量子计算领域的关键词进行清洗、去重、单复数合并、全称与简称的合并、同义词和近义词的合并等操作,得到该领域排名前30 的高频关键词,如表4 所示。同时,本文利用VOSviewer软件绘制了关键词共现网络图,如图8 所示。图中节点大小代表关键词词频的多少;节点之间的连线表示两个关键词具有共现关系,连线的粗细代表共现次数的多少。由表4 和图8 可知,除去自我指向性关键词量子计算(quantum computing)外,量子计算领域的高频关键词包括:量子纠缠(quantum entanglement)、量子算法(quantum algorithms)、量子模拟(quantum simulation)、量子纠错(quantum error correction)、量子信息(quantum information)、量子混沌(quantum chaos)、量子线路(quantum circuit)和量子动力学(quantum dynamics)等。基于高频关键词和共现网络图,结合文献内容研读,本文将量子计算研究热点归纳为以下四个方面:量子算法、量子计算机的物理实现、量子计算模型以及量子计算的应用。
表4 量子计算领域排名前30的高频关键词Table 4 Top 30 high-frequency keywords in field of quantum computing
3.1.1 量子算法
量子算法研究已有40 多年的历史,大致经历了四个发展阶段:(1)萌芽阶段(1985—1993 年)。为了证明量子计算相比经典计算的优势,部分学者提出了一些数学问题并设计量子算法来解决这些数学问题,代表性算法包括Deutsch算法、Deutsch-Jozsa算法[12-13]。(2)兴起阶段(1994—2008 年)。学者们利用量子算法来解决实际问题,代表性算法是Shor算法和Grover算法。1994年,提出了著名的Shor 算法,用于求解大数的质因子分解[14],该算法可以攻破RSA 公开密钥体系,在量子计算领域具有里程碑意义。1996年,提出了一种用于搜索非结构化数据库的量子算法——Grover算法[9]。该算法实现了对经典搜索算法的二次加速,是量子计算的经典算法之一。(3)繁荣发展阶段(2009—2013 年)。2009 年,麻省理工学院的三位学者Harrow、Hassidim 和Lloyd 联合开发了Harrow-Hassidim-Lloyd(HHL)算法,用于求解线性方程[15]。HHL 算法的提出促进了量子计算与人工智能领域的交叉融合,为后续量子机器学习算法的繁荣发展奠定了基础。(4)深入探索阶段(2013 年至今)。该阶段出现了很多混合量子-经典算法,代表性算法是变分量子特征值求解算法(VQE)和量子近似优化算法(QAOA)[16-17]。
3.1.2 量子计算机的物理实现
国内外学者对量子计算机的物理实现平台进行了积极探索,目前国际主流的物理技术体系可以分为固态器件路线和光学路线两大类。其中,固态器件路线包括超导量子电路、半导体量子点等;光学路线主要包括离子阱和光量子。近年来,超导量子电路、离子阱以及光量子三条路线备受关注。
超导量子电路是国际上目前发展最快、最具潜力的固态量子计算物理实现方案,其优势是量子门速度快、电路设计的可控性强;缺点是相干时间较短、需要极度低温的物理环境。国内外企业和研究机构对超导量子计算方案进行了深入探索,取得了一系列成果,包括“猎鹰”超导量子计算机、“蜂鸟”超导量子计算机、“悬铃木”、“祖冲之号”等[18-20]。离子阱体系由奥地利的两位物理学家Cirac和Zoller[21]于1995年率先提出,其优势是退相干时间较长、量子比特质量高、量子比特制备和读出效率高、计算精度高;缺点是可扩展性差、体积较大。光量子计算使用光子的偏振或自由度来编码量子比特,通过对光量子的测量实现量子计算。我国在光量子计算机方面取得了一些研究成果,例如量子计算原型机“九章”[22]。
3.1.3 量子计算模型
常见的量子计算模型主要包括量子线路模型、单向量子计算、绝热量子计算以及拓扑量子计算四种。量子线路模型是由Deutsch 首次提出,主要包括量子态的初始化、通用的逻辑门操作以及测量三部分[23]。单向量子计算最早是由Raussendorf 和Briegel[7]于2001 年提出的一种新的方案,其核心思想是在超大规模的量子纠缠态(簇态)的基础上对量子比特进行测量。绝热量子计算最早是由Farhi 等[24]提出的,是一种基于量子绝热定理实现量子计算的方法。Aharonov 等[25]证明了绝热量子计算模型与量子线路模型在计算能力上是等价的。拓扑量子计算最早是由Kitaev[6]于1997 年提出的,其核心思想是利用量子体系的拓扑结构对量子比特进行制备,对环境噪音等具有较强的鲁棒性,被认为是未来最有希望实现量子计算的方法之一。
3.1.4 量子计算的应用
量子计算有望能够在人工智能、密码分析、金融、化学模拟、生物医药、材料研发等领域发挥重要的作用。在人工智能领域,量子计算与机器学习交叉融合,产生了量子机器学习这一研究方向,用于解决传统机器学习算法在大数据上计算效率低下的问题。常见的量子机器学习算法包括:量子隐马尔可夫模型、量子卷积神经网络以及量子生成对抗网络等[26-28]。在密码分析领域,国内外学者对量子密码进行了积极探索,尝试使用基于量子物理学的量子密码代替基于数学的传统经典密码[29]。在金融领域,量子计算凭借其强大的并行计算能力,在资产定价、投资组合、欺诈检测和风险评估等方面具有较好的发展前景[30-32]。在化学领域,量子计算具有广阔的应用前景,主要应用方向包括药物研发、新材料研发以及化学分子结构模拟等[33]。
突现词是指在一定时间段内出现频次骤然增加的关键词,在一定程度上可以作为研究前沿的表征指标。本文使用CiteSpace软件得到了量子计算领域突现强度排名前10位的突现词,如图9所示。突现时间较早的关键词包括quantum computation(量子计算)、quantum theory(量子理论)、quantum entanglement(量子纠缠)等。其中,量子纠缠的突现强度最大。早期突现词主要集中在量子计算的理论研究方面。近几年突现的关键词包括superconducting circuit(超导电路)、quantum machine learning(量子机器学习)、quantum cryptography(量子密码学)等,主要集中在量子计算机的物理实现、量子计算的应用场景等方面。通过突现词分析,量子计算领域的研究前沿主要聚焦在量子计算模型研究以及量子计算在人工智能、密码分析等领域的应用。
图9 量子计算领域突现强度排名前10位的突现词Fig.9 Top 10 emergent words in field of quantum computing
本文结合文献计量和内容分析的方法,借助文本挖掘软件DDA和可视化分析工具对Web of Science核心合集数据库中收录的量子计算领域相关文献进行定量和定性分析,得出以下结论:
(1)在发文趋势方面,量子计算领域的发文量总体保持逐年递增的趋势,并且近两年发文量增速加快。可以预测,未来几年内该领域的发文量仍会呈现井喷式增长。
(2)在主要国家/地区方面,美国在该领域目前处于领先地位,具有雄厚的科研实力和影响力,并且与其他国家合作紧密。我国的发文量虽然排名第二位,但论文的篇均被引频次较低,今后需要注重提升论文的质量和影响力,并且加强与其他国家的合作。
(3)在研究机构方面,我国有两所机构发文量排名前10 位,分别是中国科学院和中国科学技术大学。不同机构间的合作关系受地理位置的影响较大,合作对象主要集中在同一国家内。
(4)在核心作者方面,中国科学技术大学的郭光灿教授的发文量位居首位,我国在量子计算领域形成了一批“领军人物”。同时,本文利用作者共被引分析得到该领域的10位核心作者。
(5)在核心文献方面,本文利用文献共被引分析得到了该领域的10 篇核心文献,这些核心文献是量子计算领域的经典文献,属于突破性研究成果,为该领域的发展奠定了基础。
(6)在研究热点和发展趋势方面,目前量子计算领域的研究热点主要集中在量子算法、量子计算机的物理实现、量子计算模型以及量子计算的应用等方面。
根据对量子计算领域国际研究现状和发展趋势的定量和定性分析,本文对我国量子计算领域的未来发展提出以下建议:
(1)加强顶层设计,制定量子计算领域的国家专项战略规划,加大对关键核心技术的研发支持。我国下一步应该从国家层面制定相应的专项战略规划,加强顶层设计,统筹推进量子计算的基础研究和产业化布局。
(2)完善产学研协同创新机制,积极促进跨领域、跨部门的创新协作。鼓励企业参与到量子计算机软件和硬件的研发。完善政府、高等院校、科研院所、企业之间的合作模式,共同推进量子计算领域关键核心技术的攻关。
(3)加快量子计算学科体系建设,注重专业人才培养,积极促进国际交流合作。高等院校根据量子计算技术所需要的基础研究调整优化相关学科体系,加强基础研究布局。积极引进国外优秀人才,同时鼓励国内相关学者积极参与该领域重要的国际会议,加强国际交流合作。