龚惠群,郑婷玉
(南京信息工程大学管理工程学院,江苏南京 210044)
ChatGPT(Chat Generative Pre-trained Transformer)是美国人工智能研究实验室OpenAI 新推出的一种人工智能技术驱动的自然语言处理工具。从诞生之日起,ChatGPT 就引起了轰动和世人关注,Sardana等[1]将其评价为颠覆性创新。首先,它在许多自然语言处理任务中表现出色,例如王丽等[2]认为在优化提问的背景下,ChatGPT 生成的回复更具组织性、解释性和针对性;汪民安[3]指出ChatGPT 具有能够无限放大文本的能力等。其次,它能够像一个真实的对话伙伴一样与用户进行交互,因此在各种应用场景中有很高的实用价值,例如在法律领域,王禄生[4]强调ChatGPT 能表现出更加优秀的法言法语的理解,以及法律意图的识别和逻辑推理等能力;在教育领域,姜华等[5]提出ChatGPT 在助力教师、赋能学生、重塑教育环境等方面潜力巨大。再次,ChatGPT 涉及到技术和领域众多,宋士杰等[6]和Trachet[7]提出ChatGPT 借助于自然语言理解与推理、深度学习、语言模型、神经网络等技术,已经对很多产业产生了重要影响。例如,刘明等[8]、戴岭等[9]认为ChatGPT 能在学、教、管、评等诸多教学场景发挥巨大作用,包括加强阅读理解能力、赋能高阶思维培养、提升写作与数学解题水平等;万广华等[10]指出ChatGPT 能以低廉的价格提供极其丰富的产品和服务,大幅提高生产效率。同时,ChatGPT 还会带来新的研究方向和思路,激发更多人投入到语言模型的探索中,并研究将其应用到更多产业领域中,例如王茜等[11]指出ChatGPT 可以为生物医药领域提供更高效、精确的可编程、可破译的信息处理,支持生物医药知识的发现与调用等;李扬等[12]认为ChatGPT 将会带来媒体全生产链条中传播主体、用户、渠道、内容及反馈等方面的变革。鉴于ChatGPT 目前已经在各类现实应用中彰显出强大的价值效用,将成为经济与社会领域的关系重构(人机共生)、结构重组(虚实交互)等功能性变革的重要驱动[13],并由于其具有巨大的应用价值和发展潜力,使其已成为学术研究的焦点[14]。因此,本文通过分析ChatGPT 相关领域的技术发展脉络,以期更全面地了解这一流行新技术和产品,有助于发现这些技术在不同领域的应用场景,能对国内大模型技术及相关产业领域的发展有所启示。
现有文献大多从某领域具体应用或综述角度对ChatGPT 的发展趋势进行研究,例如刘学博等[15]、张熙等[16]、张伟男等[17]研究以ChatGPT 为代表探索生成式大模型、生成式人工智能、通用人工智能等技术的研究现状和发展趋势,主要以技术归纳为主;周洪宇等[18]、刘玮等[19]、沈立力等[20]、Ray[21]主要探索了ChatGPT 技术在高等教育、政务服务、图书馆、农业等众多应用领域的发展图景。目前尚缺乏对ChatGPT从统计学角度的技术发展趋势研究。研究产业领域技术发展趋势的常见工具主要有文献计量方法和专利分析法[22],其中从文献计量分析资料可发现,发表文献的机构一般都是高校科研机构[23],企业对ChatGPT 相关领域的研究主要是体现在专利方面,而非论文[24],因此文献计量研究更多反映出的是高校教育机构对ChatGPT 相关领域的研究情况,对企业、公司等机构的研究情况分析较少,使得研究结论会存在一定的局限性。因此,为更为系统和全面地对ChatGPT 相关领域进行发展趋势分析,本文运用专利分析法从专利角度对此领域的专利数据进行分析,研究结果对于今后更好地利用ChatGPT 相关技术具有重要意义。此外,分析专利的研究热点,也将为今后ChatGPT 相关领域的发展提供现实价值,明确我国ChatGPT 相关领域的开发水平及国际地位,清晰看出我国企业在这个领域的研发方向、技术水平、发展趋势等技术情报,为企业、政府的决策提供有力支持。
本文将通过对ChatGPT 相关领域的专利数量趋势、专利申请人、合作申请分析、专利地域分布、IPC 分类号、专利地图、专利引证、创新词云、热点演进等角度对ChatGPT 相关领域和产业的发展前景及趋势进行综合分析,进而对我国ChatGPT 相关领域和产业的技术布局、技术和应用发展方向、存在的问题等方面提出建议,推动ChatGPT 与各产业的深度融合。
本文将ChatGPT 技术演进纳入检索策略,与之相关的领域主要包括自然语言处理、人机对话、大模型、预训练语言模型等[25],因此本研究的检索关键词采用“自然语言理解”“自然语言生成”“大型语言模型”“人机对话”“预训练”等,以及英文机器翻译结果“Natural-language understanding”“Natural language generation”“Large language model”“Man machine dialogue”“Pre training”“language model”为检索词。以智慧芽专利数据库为来源数据库,在标题/摘要中检索,检索近10 年的相关专利(2014 年—2023 年),技术主题为计算机科学,然后选取与ChatGPT 相近的12种IPC 分类号。最后,利用检索式“TAC:(自然语言理解 OR 自然语言生成 OR 大型语言模型 OR 人机对话 OR 预训练 OR Natural-language understanding OR Natural language generation OR Large language model OR Man machine dialogue OR Pre training OR language model)”对全球ChatGPT 相关领域技术进行专利检索,通过去重处理后,共检索到93 284 条数据。
图1 为2014 年—2023 年中国与全球ChatGPT相关领域专利申请量与增长率。从图1 中可看出,中国与全球的申请量增长趋势基本相同,整体增长率高于全球。从专利申请趋势上可分为2014 年至2017 年、2017 年 至2020 年 和2020 年 至2023 年3个阶段,其中在2014 年至2017 年期间,中国与全球的专利申请增长率趋势皆增长较快,但中国的专利绝对数总量偏低,全球平均年申请量约为中国的5.14 倍。
图1 2014—2023 年全球与中国ChatGPT 相关领域专利申请量与增长率
其次,从2017 年至2020 年,中国类似于全球趋势,专利申请总量开始呈现急剧增加,尤其是2018 年还出现“井喷”现象(其中,全球申请增长率保持在20%以上的高增长,中国申请增长率也处于99.7%的历史最高位)。原因可能源于在这个时期ChatGPT 在2017 年首次被提出,并在2018 年得到广泛应用和推广。最后,从2020 年至2023 年,ChatGPT相关领域专利申请增长率呈快速下降趋势,2022年全球增长率为-50.2%,中国增长率为-39.4%。由于2023 年的数据截止于2023 年6 月,因此未加入比较。分析原因,一方面可能是由于专利申请周期较长,一般来说,实用新型和外观设计专利从申请到专利授权需要18 个月,而发明专利需要3 年,因此最近3 年的专利数量会呈现下降趋势。另一方面,2020 年后由于疫情和经济发展原因,全球专利数量都有所下降。
2.2.1 全球前10 位专利申请人占比
本文通过对2014—2023 年全球ChatGPT 相关领域专利申请人进行统计分析,图2 为全球前10位专利申请人占比。
图2 全球ChatGPT 相关领域前10 位专利申请人占比
从图2 可见排名第1 位的是美国国际商业机器公司(即IBM),其在前10 名专利申请人的专利申请数量中占比28%。此外,从图2 中可见全球排名前10 机构中有6 家企业皆为美国企业,分别为:国际商业机器公司(排名第1)、谷歌有限责任公司(排名第2)、微软技术许可有限责任公司(排名第3)、亚马逊科技公司(排名第6)、苹果公司(排名第7)、甲骨文国际公司(排名第10),皆为享誉全球的著名大型科技公司。这说明ChatGPT 相关领域一直以来都受到这些大型科技公司的青睐,美国的大型科技企业在ChatGPT 相关领域的专利申请方面处于领先地位。除此之外,这也反映了美国在人工智能研究和创新方面的领先地位。
从图2 中也可发现,排名第5、第9 的企业皆为中国企业,分别为北京百度网讯科技有限公司(排名第5)和腾讯科技有限公司(排名第9)。这说明我国也在加大对人工智能研究和创新的投入,以形成全球科技竞争的多极格局。这两家企业在全球专利数量排名中居于领先地位,也反映了中国人工智能产业的迅猛发展。其中,北京百度网讯科技有限公司是ChatGPT 相关领域全球专利数量排名中目前中国最高的企业,是国内自然语言处理领域专利申请量最多的企业,也是国内人工智能专利申请量和授权数量领先的企业,涉及的领域包括搜索引擎、自然语言处理、图像识别、语音识别等。
2.2.2 中国前10 位专利申请人占比
进行2014—2023 年中国ChatGPT 相关领域申请人的统计分析,图3 为中国前10 位专利申请人占比。
图3 中国ChatGPT 相关领域前10 位专利申请人占比
从图3 中可发现,中国排名前10 的机构除排名第10 位的浙江大学,其余皆为企业。其中排名第1的北京百度网讯科技有限公司和排名第4 的百度在线网络技术(北京)有限公司都是百度公司的子公司或关联公司,其在业务上有所区别。百度公司在前10 名专利申请人的专利申请数量中占比35%,遥遥领先排名第2 的腾讯科技有限公司。此外,排名第2 的腾讯公司也在不断加强在ChatGPT 相关领域的研发和布局,以提高人工智能技术的水平和应用能力。此外,浙江大学在中国ChatGPT 相关领域的专利排名中位列第10,是唯一一个非企业的高校机构。这说明浙江大学在ChatGPT 相关领域的研究和开发具有相当的实力和水平。同时,这也表明了企业和学术界皆对ChatGPT 有重视和关注。
2.3.1 全球专利地域分析
图4 为全球前10 位专利地域排名。从图4 可见,截止到2023 年,美国是ChatGPT 相关领域专利数量最多的国家,大约是位居第2 的中国专利数量的1.9倍,而两者的专利数量都遥遥领先于排名第3 的日本。
图4 全球ChatGPT 相关领域专利数量的地域分布前10 位
这一现象可以从多个角度解释。首先,美国在人工智能和自然语言处理等领域的研发和创新一直处于全球领先地位,拥有众多世界级的大型科技公司和研究机构,如IBM、谷歌、微软、苹果等,这为技术研发和专利申请提供了坚实的基础。其次,美国的创新生态系统鼓励了大规模的研发投资,以及在人工智能领域拥有广泛的人才储备。最后,美国在科技产业的发展和商业化方面也具有明显的优势。
从图4 还可见,中国的专利数量位居全球第二,中国的ChatGPT 研发实力也已经相当强大。中国在人工智能和自然语言处理等领域的研发和创新近年来发展迅速,拥有众多的研究机构和科技公司,如百度、腾讯、阿里巴巴等。这反映出了政府支持、市场需求增长、企业研发投入、教育培养等多方面的进步。但是,综合图2 和图4 也可以发现我国机构在ChatGPT 相关领域研发存在的问题,就是虽然我国专利总数已经位居全球第2,但是机构申请ChatGPT 相关领域的专利数量排名前10 的机构占比绝大多数仍是美国机构,6 家美国企业占比为75%,而排名前10 中我国的企业仅有2 家,总占比仅为11%,差距仍较大。
2.3.2 中国专利地域分析
国内ChatGPT 相关领域专利的地域排名前10 位见图5 可。由此图可以发现不同地区技术创新活跃程度和能力的差异以及持有专利技术的企业机构主要分布在哪些地区。
从图5 可见专利申请数量排名前3 的是北京市、广东省、江苏省,可知北京市在人工智能和自然语言处理领域的创新和研发能力相对较强。
需要强调的是,企业的发展为当地ChatGPT 相关领域的发展提供了重要的支持。例如,深圳的腾讯公司、上海的图灵机器人、上海的出门问问、江苏智慧云图信息科技有限公司、南京紫金山实验室、南京鲸准数据科技有限公司、杭州云栖数智科技有限公司、浙江省计算技术研究院、杭州旷视科技有限公司等,它们为广州、江苏、浙江、上海等地区在ChatGPT 相领域的专利数量增长提供了重要的支持。总的来说,从图5 可以发现目前我国大致可以分为3 个梯队,北京市和广东省位于第一梯队,江苏省、浙江省、上海市位于第二梯队,山东、四川、陕西、湖北和安徽省等位于第三梯队。
过滤选择法律状态为“授权、实质审查、公开”,合作申请分析图由数据库自动生成,如图6 所示。
图6 全球ChatGPT 相关领域合作申请专利的群体分析
由图6 可见全球在ChatGPT 相关领域存在有主要的4 个合作机构群体,分别是以IBM 公司为核心的合作网络、以谷歌公司为核心的合作网络、以腾讯公司为核心的合作网络、以三星集团为核心的合作网络。其中,美国的IBM 公司与外部企业纽昂斯通讯公司有合作,也有与伊利诺伊大学、麻省理工学院、利默里克大学、密歇根大学等的合作,基本在1~2 个之间。美国的谷歌公司没有与高校机构的合作,有少量与企业的合作,如卢克数据科学公司、Trimble(天宝)公司。中国的腾讯公司的合作对象主要是大学、研究所,合作专利数量基本在1~4个之间。韩国的三星集团除了和自己的子公司合作以外,还有少量与科学院、高校的合作,合作专利数量基本在2~3 个之间。但是,从图6 还可见我国专利数量最多的百度公司在ChatGPT 相关领域没有和其他机构合作的现象,其原因可能有以下几个方面:(1)技术保密;(2)竞争压力;(3)独立研发更能体现公司战略需求;(4)合作难度大等。这种机构独立研发的现象,在亚马逊、微软、元平台公司中也存在,它们的领域专利都较多,但是也都没有存在与外界的合作研发。综上所述,从图6可看出不同机构在合作研发方面采取着不同的策略,具有不同的文化和合作意识。
本文采用智慧芽专利数据库自带的专利地图生成工具,对智慧教育领域人工智能专利进行分析得到全球有效发明专利技术的专利地图如图7 所示。其中,亮白色表示专利文献最密集的部分,即涉及该技术主题的专利申请量最多,是研发中的热点技术;而黑色则表示专利文献相对较少或密集程度较低的区域。此外,专利地图中的距离远近可以显示不同主题间的相关程度。
图7 全球ChatGPT 相关领域的专利地图
从图7 可知,可将全球ChatGPT 相关领域专利的重点领域分为12 个,这些领域基本涵盖了领域的所有重点内容,技术体系较为完善。“眼睛、虚拟现实、增强现实、触觉、头戴式”等7 个领域专利申请数量较多,专利分布多而密,是技术比较成熟的研究热点,技术资源较丰富,其设计技术范围也较广,反映ChatGPT 相关领域行业专利实际应用与转化的方向。此外,“区块链、容器、内容管理系统、扩展性、同步”“摄像机、眼睛、增强现实、图像捕获设备、头戴式”这2 个领域也占有一定的比例。最后,还有少部分有效专利分布于“语音交互、语音数据、智能机器人、语义识别、语音信息”等3个领域也是ChatGPT相关领域专利布局的一个方向,目前专利技术的研究比较少,可能是技术盲点或者未来的潜在机会领域,属于待开拓的区域。
除此之外,本研究还分别利用智慧芽系统生成中国和美国在ChatGPT 相关领域的专利地图,这是全球在ChatGPT相关领域专利最为突出的两个国家,分析结果分别如图8、图9 所示。从图8 和图9 的中国和美国专利地图可以看出,两个国家在不同的ChatGPT 相关领域专利方面都有各自领先的领域。
图8 中国ChatGPT 相关领域技术的专利地图
图9 美国ChatGPT 相关领域技术的专利地图
从图8 可见,中国与全球在ChatGPT 相关领域的专利技术上相似,技术体系较为丰富,主要涵盖了人脸识别、医学、语义文本分析和交通等多方面领域应用,硬件方面的专利技术偏少。在“语音交互、语音数据、语音控制、唤醒词、智能机器人”等5个领域的专利排名也在世界前列,技术成熟,这5个领域都是我国ChatGPT 相关领域专利实际应用的方向与转化的现状。此外,还有一些偏文本应用的专利领域,如“文本分类、中文分词、双语、短文本、图像描述”等,同时这些领域相对来说专利较少,可能是技术盲点或者未来的潜在机会领域。
从图9 的美国专利地图可以看出,而美国与全球在ChatGPT 相关领域的专利技术上更为相似,技术体系较为完善,基本涵盖了领域的硬件开发和软件应用等多方面。在“虚拟对象、头戴式、眼睛跟踪、穿戴设备、手势控制”等4 个领域分布的专利最多,专利布局具有优势,技术资源丰富。除此之外,在“强化学习、卷积、迭代、梯度、神经元”等4 个领域的专利排名也在世界前列,技术成熟,这8 个领域都是美国ChatGPT 相关领域专利实际应用的方向与转化的现状。此外,还有较多的专利领域,如“摄像机、头戴式、穿戴设备、视频内容、成像”等领域相对来说专利较少,可能是技术盲点或者未来的潜在机会领域。
对比分析图7、图8 和图9 之后可以发现,我国在ChatGPT 相关领域的研究相对偏软件应用,专利技术主要集中于人脸识别、交通、网页内容查询和分析等方面,但是在智能设备、ChatGPT 领域理论深度学习等方面相比于国际、美国的专利布局和研发实力还有很大的欠缺。我国在ChatGPT 相关领域专利分布上更偏重于应用范围,但是在研究深度上可以看出不够深入,这也反映出中国ChatGPT 相关领域专利技术的劣势。而美国在ChatGPT 相关领域一直积极投资和研发,尤其在硬件和理论方面有相当的专利数量和质量。他们注重于底层理论和技术的创新,并努力推动ChatGPT 相关技术与人工智能设备的结合。
通过对全球专利的引证情况进行排名和分析,可以识别出哪些专利技术具有重要影响力,已被广泛借鉴,以及了解该技术领域的核心创新技术。
2.6.1 全球高被引专利技术排名
过滤选择法律状态为“授权、实质审查、公开”,可以发现全球ChatGPT 相关领域排名前十的高被引专利皆为美国专利,可见虽然中国在ChatGPT 相关领域的专利数量已经位居全球第2 位,但是其专利的质量和创新性还有待提高。全球高被引专利排名第1 的是南坦智财控股有限责任公司的专利“Healthcare transaction validation via blockchain proofof-work,systems and methods”,这个专利主要涉及医疗保健交易验证系统和方法,被引用量是810 次,说明这项技术在该领域具有重要的影响力和价值。这可能源于其在医疗保健行业中解决了一些重要的问题,如交易的安全性、隐私保护、数据管理等方面的挑战。
此外,还可发现全球高被引专利中前10 位中有5 个都与装置、设备有关,如排名第2 位的专利“Methods and apparatus to change a feature set on data collection devices”、排名第4 位的专利“System and method for generating and updating location check digits”、排名第5 位的专利“Extramissive spatial imaging digital eye glass apparatuses,methods and systems for virtual or augmediated vision,manipulation,creation,or interaction with objects,materials,or other entities”、排名第6 位的专利“Device arbitration for listening devices”、排名第9 位的专利“Hand held bar code readers or mobile computers with cloud”。涉及到多种设备和装置,如数据收集设备、位置生成检查数据的装置、增强现实的感测和显示设备、收听唤醒短语和语音命令的电子设备、数据解码系统等等。可见目前国际上在ChatGPT 相关领域的研究对智能设备和装置的关注度很高。这可能反映了在这一领域中,设备的创新和技术集成对于推动人机交互和ChatGPT 应用的发展至关重要。此外,不同的设备集成可以适用于不同的行业和应用场景,一些专利可能专注于特定领域,如医疗、教育、娱乐等,以实现更专业化的效果。
2.6.2 全球高被引专利IPC 技术分布
接下来对全球ChatGPT 相关领域高被引专利的前10 名专利进行IPC 分类分析,具体见图10 所示。其 中G06F、G06Q、G06K、G06N、A61B、G06T、G07C、G10L、H04L 均为IPC 技术分类号。
图10 ChatGPT 相关领域全球高被引专利前10 位的IPC 分类
由图10 可见,其中G06F(电数字数据处理)出现在7 个专利中,占35%,G06Q(专门适用于行政、商业、金融、管理或监督目的的信息和通信技术)出现在4 个专利中,占20%,说明这些领域受关注度高,而且受关注领域也非常集中。这些专利主要涉及到自动分析、语义分析、语法分析、信息检索、聚类、分类、自然语言、查询、查询公式、数据库结构等方面。此外,全球高被引专利技术排名前10的专利中有7 个专利皆涉及到G06F,这在一定程度上可说明G06F 和G06Q 这2 个主题为全球ChatGPT相关领域专利技术研发的主要趋势和核心,也是领域的研究热点,在ChatGPT 相关领域专利技术也大多以引用这些专利技术为基础来进行研究和发展。
2.6.3 中国高被引专利技术排名
过滤选择法律状态为“授权、实质审查、公开”,可发现中国高被引专利中排名第1 的是百度在线网络技术(北京)有限公司的专利“基于人工智能的人机交互方法和系统”,被引用量是437,说明该专利的技术和创新具有重要性,这表明人机交互在人工智能领域中具有重要地位,同时也表明百度公司在ChatGPT 相关领域具有重要影响力。根据该专利的高被引次数,可以推测其他企业可能比较关注以下方面:(1)人工智能技术;(2)人机交互;(3)语音识别与合成技术;(4)情感分析与情感识别;(5)自然语言处理与对话生成;(6)多模态交互:人机交互不仅仅局限于文字和语音,还可以涵盖图像、视频和其他形式的交互。因此,企业可能会探索多模态交互技术,以提供更多样化、丰富的交互方式。
此外,还可发现中国高被引专利中前10 位全部都是提出了某种方法,涉及到系统的有4 个,涉及到装置和设备的有1 个。中国在ChatGPT 相关领域的高被引专利前10 名中10 个专利全都是与某种方法有关,而前10 名中只有一个涉及到设备装置,这可能反映了在中国目前方法和算法的创新在推动ChatGPT 技术的发展和应用方面占据主导地位。一般在初期阶段,研究人员和企业可能更关注在核心技术方面进行创新,以实现更智能、更自然的对话交流。因此,中国的高被引专利主要涉及到方法和算法的创新。在推动方法和算法的发展之后,可能会逐渐涉及到如何将ChatGPT 技术与具体设备相结合,以实现更全面、更智能化的人机交互体验,这可能是一个后续的发展方向。
2.6.4 中国高被引专利IPC 技术分布
接下来对中国ChatGPT 相关领域高被引专利的前10 名专利进行IPC 分类分析,可以指导中国的高被引专利的技术主题主要集中在哪些领域,具体见图11 所示。
图11 ChatGPT 相关领域中国高被引专利前10 位的IPC 分类分布
由图11 可见,中国高被引专利前10 名的IPC分类主要涉及到的IPC 技术仅4 种,非常集中。这些专利主要涉及到图像处理、计算机科学和人工智能领域。这意味着在这些领域里中国在高被引专利方面表现得相当出色,有着丰富的人才和技术资源,同时也反映出中国在这些技术领域取得了显著的研究成果和创新。此外,另一方面也反映出中国在这个领域的研究范围相对较窄。其中G06K 作为主分类号,出现在6 个专利中,占40%,G06F 作为主分类号出现在4 个专利中,占27%,说明这些领域受关注度高,而且受关注领域也非常集中。这些专利主要涉及到车型识别方法、端到端的车辆检测和识别的框架、汽车驾驶场景目标检测方法、人脸检索方法、人脸识别方法、装置、系统及设备等方面,主要集中在汽车自动驾驶、人脸识别等领域,可以说是中国ChatGPT 相关领域专利技术发展的基础,也可看出中国ChatGPT 相关的重点研究领域。
通过应用领域分析可以知道这个领域的技术开发方向,从而帮助指导目标市场的确定。对全球ChatGPT相关领域专利检索数据进行应用领域分析,如图12 所示。
图12 全球ChatGPT 相关专利的应用领域分布
从图12 中可发现,全球ChatGPT 相关研究的应用领域分布最多的是特殊数据处理应用领域,共有37 841 件专利,占比为17%,以及字符和模式识别领域,共有36 864 件专利,占比也接近17%。可见这两个领域是全球ChatGPT 相关研究的重点关注领域。此外,生物学模型、数字数据信息检索这两个领域的专利占比也较高,皆为13%。除此之外,图像分析、图像增强、机器学习、自然语言数据处理、数据处理的输入/输出过程、基于知识的模式的计算机系统等也都是研究常见的应用领域。从图12 中的数据可以发现,全球ChatGPT 相关研究的专利应用领域分布最多的是特殊数据处理应用领域和字符和模式识别领域,而不是自然语言数据处理领域。
图13 对全球引用前10 的专利应用领域分布进行分析,以发现最受专业研究人员关注的应用领域。
图13 全球ChatGPT 相关研究引用前10 位专利的应用领域分布
从图13 中可见特殊数据处理应用、数字数据信息检索、商业这3 个领域是全球ChatGPT 相关研究引用前10 的重点关注领域。与图12 相比,数字数据信息检索的受关注程度在研究人员中较高,而且研发人员更为关注如何将这些专利进行商用,获得实际效益。
由图13 的数据和结论,可以说明ChatGPT 在以下方面有着重要的应用前景:(1)特殊数据处理应用:如语音识别、自然语言理解、图像识别等。这种跨领域的特性使得ChatGPT 在特殊数据处理方面的应用越来越受到关注。(2)数字数据信息检索:用于实现智能问答系统和信息检索系统,能够根据用户的问题或需求,快速准确地提供相关信息。这种能力在数字数据信息检索领域具有重要的应用价值。(3)商业:应用于商业领域的多种场景,例如客户服务中心、智能客服、广告投放等。其能够通过自然语言交互和个性化推荐等技术,提高客户服务水平和营销效果。这3 个领域都是当前人工智能研究和应用的最受关注方向,ChatGPT 在这些领域的应用前景广阔,也预示着其在未来的发展潜力。
图14 对中国引用前10 专利应用领域分布进行分析,以发现最受中国专业研究人员关注的应用领域。
图14 中国ChatGPT 相关研究引用前10 位专利的应用领域分布
从图14 中可见字符和模式识别、特殊数据处理应用、生物学模型这3 个领域是中国ChatGPT 相关研究引用前10 的重点关注领域。与图12 相比,在中国研究人员中字符和模式识别的受关注程度比特殊数据处理应用更高,而且研发人员更为关注生物学模型领域的应用。
由图14 的数据和结论,可以说明在中国ChatGPT 有着以下方面重要的应用前景和研究价值:(1)可以通过分析和识别字符和模式,帮助人们更好地理解和利用这些信息,有助于文本分析和自然语言处理任务。例如,在社交媒体分析中,ChatGPT可以识别用户情感和言论趋势,为企业和政府提供有关公众看法的重要洞察。(2)可以根据不同行业的需求,进行个性化的数据处理,从金融分析到医疗诊断,都有可能受益于它的应用。这种灵活性为ChatGPT 在不同领域的应用打开了新的可能性。(3)可以用于构建生物学模型,模拟生物系统的行为,分析遗传数据等,帮助科学家理解生命的奥秘。例如,它可以分析基因组数据,预测蛋白质结构,甚至辅助药物研发,为医学科研提供有力支持。
2.8.1 全球专利创新词云分析
通过创新词云可以了解ChatGPT 相关领域内最热门的技术主题词,帮助分析ChatGPT 相关领域内最新的重点研发主题。通过提取最近5 000 条专利中最常见的关键词,得到的创新词云如下图15 所示。其中,不同的颜色深浅和大小表示不同级别的相对重要性,字体越大越显眼,则表示对应词汇被提及的频率越高。
图15 ChatGPT 相关领域创新词云
首先,预训练、人工智能、神经网络、深度学习等关键词的频次表明了ChatGPT 在现代技术和科学中扮演的关键角色。这些技术驱动了ChatGPT 的能力,使其能够理解和生成自然语言。深度学习和神经网络的应用使得ChatGPT 能够从大量数据中学习规律,进而提供高质量的输出。其次,与自然语言处理相关的词汇,如语言模型、上下文、训练方法等,突显了ChatGPT 在处理文本和语言数据方面的优势,能够理解和生成各种类型的文本信息。最后,在应用方面的关键词,如机器翻译、医学图像、情感分析等,暗示了ChatGPT 在实际场景中的多样应用。它不仅可以用于文本生成,还可以在医学、情感分析等领域提供支持。可见,ChatGPT 的多功能性和潜在应用范围之广,能在各种领域的应用中都发挥积极作用。
2.8.2 全球专利热点演进分析
记录2019 年至2023 年最近5 年的全球ChatGPT相关领域专利数据的研究热点,得出热点演进的规律。具体情况如下表1 所示,其中热点热度顺序为从左至右。
表1 2019—2023 年全球ChatGPT 相关领域研究热点演进分析
由表1 可知从2019 到2023 年全球ChatGPT 相关领域的热点研究在不断演进变化。首先,神经网络在这几年中一直保持着高度的关注,表明其在ChatGPT 相关领域中的核心地位。这种持续的热度可能反映了神经网络在处理自然语言、图像和其他数据类型时的有效性和灵活性。其次,数据集在各年中都占据了重要位置。这反映了数据在训练和评估机器学习模型时的至关重要性。随着时间推移,研究者和开发人员可能越来越意识到数据质量、多样性和规模对于构建强大的ChatGPT 模型的影响。再次,深度学习的持续热度也是一个显著现象,其在自然语言处理、图像处理等领域都有广泛应用。另一个值得注意的现象是,自然语言和语音的关注度逐渐增加。这可能反映了ChatGPT 越来越多地应用于语言理解和生成任务,以及语音识别和处理领域。此外,网络模型和训练方法的热度也在逐渐上升。这可能意味着研究者们正在不断优化模型和算法,探索更高效的模型结构和训练策略,以提高ChatGPT 的性能和效率。最后,问答系统和特征提取在近年来逐渐受到关注。这可能反映了ChatGPT在与用户进行交互和回答问题方面的应用正在日益受到更多关注,以及在从大规模数据中提取关键特征以支持模型训练方面的重要性在提升。
(1)美国在ChatGPT 相关领域人工智能研究和创新方面居于领先地位,同时我国也在加大对人工智能研究和创新的投入,形成全球科技竞争的多极格局。其中,美国在ChatGPT 相关领域的专利技术体系较为完善,如“摄像机、头戴式、穿戴设备、视频内容、成像”“自动驾驶、车道、摄像机、道路、物体检测”“手势输入、话语、语音输入、虚拟助手、言语”“非语言、智能插头、音频输入、智能助理、活跃度”等可能是未来的潜在机会领域。中国在ChatGPT 相关领域的专利主要涵盖了人脸识别、医学、语义文本分析和交通等应用,但是硬件方面的专利技术偏少,“文本分类、中文分词、双语、短文本、图像描述”“语义表示、话术、语法、法律、训练文本”“微博、篇章、中文分词、短文本、文本分类”等可能是技术盲点。
(2)我国在ChatGPT 相关领域的研究实力大致可以分为3 个梯队,北京市和广东省位于第一梯队,江苏省、浙江省、上海市位于第二梯队,其中北京市的领域技术创新能力和活跃程度最高。在当前初期阶段,方法和算法创新在推动中国ChatGPT 技术的发展和应用方面占据主导地位。
(3)在ChatGPT 相关领域全球主要存在4 个合作机构群体,分别是以IBM 公司、谷歌公司、腾讯公司和三星集团为核心的合作网络。
(4)目前国际上在ChatGPT 相关领域的研究对智能设备和装置的关注度很高,其中“语音交互、语音数据、智能机器人、语义识别、语音信息”“虚拟助理、用户简档、帖子、虚拟助手、知识图”“识别方法、目标检测、深度网络、高分辨、高分辨率”这3 个领域可能是未来的潜在机会领域。神经网络处于ChatGPT 相关领域中的核心地位,数据集的选择和准备、深度学习的持续热度也是一个显著现象。特殊数据处理应用、数字数据信息检索、商业这3个领域是全球重点关注领域,G06F 和G06Q 这2 个主题为全球ChatGPT 相关领域专利技术研发的主要趋势和核心。
(5)G06K、G06F、G06N、G06T 这4 个主题是中国ChatGPT相关领域专利技术研发的研究热点,字符和模式识别、特殊数据处理应用、生物学模型这3 个领域是中国的重点关注领域。
(6)ChatGPT 相关领域内最热门的技术主题词包括:预训练、人工智能、神经网络、深度学习、电子设备、计算机、自然语言处理、机器学习等。此外,应用主题词包括:机器翻译、医学图像、情感分析、自然语言理解、阅读理解、缺陷检测、分类器、语音识别、图像处理、计算机视觉、人机对话等。
(1)尽管我国在人脸识别、交通、网页内容查询和分析等应用领域有一定的专利技术积累,但在ChatGPT 领域的理论深度和智能设备方面的创新上还存在不足。因此,建议增加对人工智能和深度学习基础研究的投入,鼓励学术界和企业界合作,共同推进相关领域的技术进步。
(2)我国在ChatGPT 领域的研究主要偏重于软件应用,但在硬件方面的创新相对较少。为了全面提升技术实力,需要注重硬件与软件的协同发展,鼓励在芯片、传感器等硬件方面的创新研究,以提升整体技术水平。
(3)尽管我国在某些应用领域已有一定的专利技术积累,但可以考虑进一步拓展应用领域,如智能制造、智能家居、智慧医疗等,以推动ChatGPT技术在更多领域的应用和发展。针对不同行业和应用场景,开发定制化的ChatGPT 解决方案,如智能客服、广告投放、创意作品生成、自动翻译、编程辅助等。
(4)面对国际ChatGPT 领域的专利布局和研发实力,我国可以通过加强国际合作,共享技术资源,共同推进技术进步。同时,应积极培育丰富的创业生态系统以及风险投资网络,为技术创新提供了强大的资金支持,并加速技术的商业化进程,同时提升人才储备,吸引全球各地的科学家、工程师和研究人员聚集,为创新提供强大的动力。
(5)基于ChatGPT 相关技术盲点和未来潜在机会的分析,我国应加强对虚拟助理、智能机器人、语音交互、穿戴设备、手势输入、语音输入和音频输入等技术的研发,特别是提高识别精度、降低延迟、增强用户体验等方面,探索如何将ChatGPT 技术更好地与这些设备和应用结合,实现更自然、高效人机交互。
(6)鼓励跨行业合作,如将ChatGPT 技术与医疗、养老、教育、娱乐等行业结合,开发适用于这些领域的专业化应用;并与硬件厂商合作,共同研发集成ChatGPT 技术的智能设备,如智能家居设备、可穿戴设备等。