中外图书馆人工智能技术应用专利比较研究

2019-09-10 09:54
图书馆研究 2019年4期
关键词:申请专利专利申请专利

(1.上海大学图书情报档案系,上海 200444;2.上海大学图书馆,上海 200444;3.邯郸学院图书馆,河北 邯郸 056003)

1 人工智能概述

人工智能(Artificial Intelligence,简称AI)一词是1956年由McCarthy提出来的。学术界关于人工智能的定义莫衷一是。麻省理工学院Marvin Minskyren提出,“人工智能是一门科学,它使机器做那些由人需要通过智能来做的事情”[1]。在此基础上,G.F.Luger认为,“人工智能是计算机科学中关于智力行为自动化的分支”。刘凤岐在其著作中结合G.F.Luger定义和人工智能的发展趋势,将其定义为“人工智能研究构成智力行为基础或呈现智力行为机制,途径是构造与评价按制定的这些机制设计的人造物”,并将人工智能分为博弈、自动推理与定理证明、专家系统、自然语言理解、模拟人生的性能、规划与机器人、AI语言和环境、机器学习、神经网络与遗传算法、AI与哲学等十个应用领域[2]。

目前,全球即将进入人工智能引领的第四次产业革命。人工智能作为2016年底Gartner公布的2017年十大具有战略意义的重大科技发展趋势之一被广为关注[3]。根据麦肯锡发布的报告《人工智能:下一个数字前沿?》可以看出,人工智能在高科技、金融服务、通信、医疗、零售、电力等行业有着广泛的应用[4]。2018年9月17日,世界人工智能大会在上海举办,并发布了《2018世界人工智能产业发展蓝皮书》,提出人工智能是科技革命与产业变革的核心驱动力量,对世界各地的经济、社会和人类生活产生了深刻的影响[5]。在图书馆领域,人工智能在《新地平线报告2017年图书馆版》中被列为六大技术发展之一[6]、在《国际图联趋势报告》中被列为四大技术趋势之一[7]、在吴建中的论文《再议图书馆发展的十个热门》中被列为十大热门话题之一[8]。本文通过对中外图书馆人工智能技术应用专利在申请趋势、技术构成、主要申请人等三方面的比较分析,探索我国人工智能技术在图书馆领域应用的发展趋势。

2 数据来源和研究方法

2.1 数据来源

表1 人工智能在图书馆中的应用领域及具体技术一览表

本文采用IncoPat科技创新情报平台进行检索,该平台数据覆盖世界范围的海量专利信息、全面可靠、检索功能专业、效率高、界面友好,是企事业单位的研发工程师、专利管理人员常用的专利检索系统[9]。在进行专利检索之前,笔者调研大量与“图书馆”和“人工智能”主题相关研究文献后,总结出人工智能在图书馆的应用技术及应用产品,详见表1。笔者提炼出相应的关键词及其英文,结合相应的IPC分类号,得出检索式:TIABC=(((自然语言 AND 处理)OR((natural language process*) OR nlp)) OR ((智能 AND 排名) OR ((Intelligen* OR smart) AND rank*)) OR (((专家 AND (选书 OR 订购 OR 集成)) AND 系统) OR ((expert* AND ((book AND (choose* OR select*)) OR (order OR subscription) OR integrat*)) AND system*)) OR ((机器人 OR robot*)) OR ((学习 AND (深度 OR 机器))OR((learn* OR study) AND (machine OR deep))) OR ((识别 AND (身份 OR 生物)) OR ((recognition OR identif* OR verification ) AND ((personal OR human OR authorship) OR (biometric OR biological)))) OR ((神经 AND 网络) OR (neural AND network)) OR ((计算机 AND 视觉) OR (computer AND (vision OR visual)))) NOT (IPC=C OR A6 OR G01N)。使用高级检索途径在IncoPat中检索,去除无关项和重复项之后,得到国内外专利28 303项,使用IncoPat简单同族合并功能合并后,最终结果为16 778项专利。

2.2 研究方法和过程

笔者采用文献调研法和比较研究法,首先对国内外有关人工智能技术在图书馆中应用的专利文献和非专利文献进行调研,掌握该领域的研究进展和应用状况,以及面临的问题和发展趋势等。然后根据检索到的人工智能在图书馆应用的专利结果,从申请趋势、技术构成、申请人三个方面进行统计分析,以国内状况和国外状况作为比较对象,将分析结果与实际应用情况相结合,提出国内人工智能技术在图书馆应用的发展建议。

3 中外图书馆人工智能应用专利对比分析

笔者对16 778项专利进行统计分析得出,在incoPat科技创新情报平台中,国内申请专利数量最多,为8 222项,其次是美国、日本、韩国、世界知识产权组织、欧洲专利局等,详见图1。将国外专利数量合并后得到国外专利8 556项,检索结果与《2018世界人工智能产业发展蓝皮书》中对人工智能专利技术的分析结果大致吻合,在人工智能专利技术中,中国的专利申请量已跃居第一位,其次是美国、日本、韩国等国家[10]。下文采用比较分析法从申请趋势、技术构成、主要申请人等方面进行对比分析。

图1 人工智能在图书馆中应用专利全球布局

3.1 申请趋势分析

笔者统计分析了国内外图书馆人工智能应用专利申请日期,得出申请趋势。在起步方面,国外早在1950年就将人工智能技术引进图书馆领域,是由英国国家发展研究公司申请的“Improvements in or relating to digital data storage systems”,该产品是有关数据存储的光学扫描装置。此后,国外进入30年左右的探索时期。国内图书馆领域最早出现有关人工智能技术的专利是在1985年,共有3项,分别是“垂直—水平自动传送系统”“计算机智能外部存储设备”“24针打印机用的新型汉字库板”。与此同时,北京大学谢元泰在《新技术革命的挑战与图书馆的发展策略》一文中提到微缩技术、大容量存储技术、复印技术、光电传输技术等图书馆自动化技术是图书馆发展的重要课题[11]。从此,国内图书馆开始重视人工智能技术的应用。2000年之前相关专利零星分布,这一阶段属于探索阶段。由此可见,与国外相比,国内人工智能技术在图书馆的应用专利申请起步晚,探索阶段比较短。

发展过程方面,20世纪80年代国内图书馆开始引进人工智能技术时,国外人工智能技术在图书馆已经在积蓄了30多年之后进入发展阶段,申请专利数量增长迅速,1991年数量突破百项,可将这段时间视为初步发展阶段;1991-2000年可以看作快速发展阶段,笔者在Web of Science平台检索相关文章,这一阶段发表的相关文章数量年均10篇以上,增长幅度较小,说明这一阶段国外人工智能在图书馆领域内的研究以实践为主;2001-2017年,这一阶段为重点发展阶段,年平均专利申请数量398项,始终保持高速发展。该阶段国外学者发表的文章从2001年的22篇快速增长到2017年的106篇,这说明国外学者在图书馆实践基础上,掀起了人工智能的研究热潮。

国内人工智能技术在图书馆中应用专利申请在2000年开始进入初步发展阶段,此时国外开启快速发展模式。但是与国外相比,国内专利申请的初步发展阶段较短,在2004年专利申请数量超过100项。从2006年起,国内人工智能专利申请快速发展,值得注意的是,仅用5年的时间,2011年中国申请专利数量就超过国外。2011年之后,中国专利申请数量急速攀升,其中2015-2017年年均专利突破千项,远超国外。与此同时,该阶段国内研究人工智能技术在图书馆中应用的学者越来越多,但发文量与国外仍有较大差距。

从发展趋势看,由于数据发布滞后,目前2018年专利数据未收录全,但根据趋势可以断定,人工智能技术在图书馆中的应用已势不可挡,发展潜力较大。

3.2 技术构成分析

3.2.1 国外技术构成分析

表2 国外图书馆人工智能应用专利技术构成前10位一览表

笔者统计分析了国外人工智能技术在图书馆中应用专利数量前10位的IPC分类号(小类),详见表2。可以看出,G06F小类专利申请数量最多,是国外图书馆领域应用最广泛的人工智能技术;G06F代表的是有关电数字数据处理方面的技术,在国外图书馆中的应用如:电子书架系统、认证系统、云虚拟机的系统、手势识别机构、数据转换方法和系统、自动生成代码深度学习系统、过滤兴趣项目图形用户接口等。G06Q小类申请专利数量远低于G06F类,但也占到国外有关专利的10%,该IPC分类号代表的是专门适用于行政、金融、商业、管理、预测或监督目的的数据处理系统或方法,在国外的应用如:认证方法和系统、图形用户接口、声音输出信息系统、智能卡读取、写入方法及其装置等方面。另外,H04L(数字信息的传输)、G06K(数据识别;数据表示;记录载体及其处理)、G11B(信息存储)、H04N(图像通信)、G06T(一般图像数据的处理或产生)、G05B(一般的控制或调节系统)、H01L(半导体器件)、G10L(语音分析、合成、识别及处理)等IPC分类号涉及的人工智能技术也在国外图书馆中应用广泛,如网络管理设备与服务器、密码推送方法以及顶推系统、指纹识别系统、优选内容的选择、视觉图形识别系统、面部表情识别、自然用户输入手势库、自动数据存储库、人脸分辨率重建方法及自动语言学习机等方面。

笔者进一步统计了国外图书馆人工智能应用专利技术前10位的申请时间,分析技术构成的发展趋势。发现G06F小类年专利申请量始终保持在200—300项之间,起伏较小,说明国外在电数字数据处理技术方面的研究持续时间长,且具有活力,是人工智能技术在国外图书馆应用中重要的一部分。另外,其他技术在1999年到2017年间也并未出现较大幅度的波动,其中,G06Q、G06K、H04L在2012年到2016年之间出现小幅度增长,数据处理系统、数字信息的传输、数据识别、数据表示等方面申请专利数量增多,该技术在图书馆应用也随之增多。

图2 国外图书馆人工智能应用专利技术地域分布

笔者统计国外图书馆人工智能应用技术的地域分布(见图2)以及前10位地域分布。由图2可见,美国申请专利数量最多,其次是日本。其他申请数量较多的地区有韩国、世界知识产权组织、欧洲专利局、英国等。美国在申请数量和主要技术数量上都占绝对优势。

综上所述,国外图书馆人工智能应用专利技术主要集中在数据处理、数据传输、数据存储和识别技术方面。占绝对优势的技术是G06F小类,且申请数量变化趋势平稳。美国是国外图书馆领域人工智能技术研发的领头人,日本位居次位。

3.2.2 国内技术构成分析

表3 国内图书馆人工智能应用专利技术构成前10位一览表

笔者统计分析了国内图书馆人工智能技术应用申请专利数量,前十名的IPC分类号(小类)、分类号代表含义、申请专利数量见表3。可以看出,与国外专利技术构成一样,G06F小类专利数量最多,占总数量的43.42%。不同的是,国内专利技术构成相比国外较为分散。G06K小类在国内技术构成中居第二位,占17.10%,H04L小类是第三位,占10.20%,其次是G06Q,占9.66%,接近H04L。G06F小类代表电数字数据处理,国内应用领域为:滑动窗口文献检测、分布式文本检测、皮肤生成方法、卫星导航系统、数据处理方法、人名检测方法及信息网络自动构建等;G06K小类代表数据识别、数据表示,记录载体及其处理,主要应用在:人体图像性别识别、动态人脸识别、网络视频人脸识别、行人特征提取及处理、座位管理系统、自然场景多标记分类、图书盘点定位系统、共享书柜装置等;H04L小类代表的是数字信息的传输,主要用于指纹认证方法、账号登录保护方法、通信故障预警装备、设备安全控制系统、云端内容规则库识别、电子图书馆管理系统等。另外,G06Q(数据处理系方法)、G10L(语音分析、合成、识别或处理)、G06T(一般图像数据处理)H04N(图像通信)、G05B(一般控制、调节系统)、G07G(登记收到的现金、贵重物、辅币)、G06N(基于特定的计算模型的计算机系统)等人工智能技术也在国内图书馆领域申请专利较多,如:智云库、信息推送、预防长期占座系统、声纹识别终端控制方法、高清语音识别系统、语音交互系统、虚拟现实技术装修、空座检测系统、新型借还设备以及图书分发设备等。

笔者进一步分析国内图书馆人工智能应用专利技术申请趋势可知,与美国申请趋势不同,前十名技术申请数量基本呈逐年增长的态势,其中G06F申请数量最多且在国内应用较早,增长最快;G06K、H04L、G06Q等小类从2008年陆续出现,近三年来增长最快。说明,电数字数据处理、数字识别、数字处理、数字传输等技术同样是国内图书馆采用的最广泛的人工智能技术,且近年来发展势头良好,发展潜力较大。

通过对国内图书馆人工智能应用专利技术所处省份的分布情况分析可见,北京和广东技术分布较为集中,是人工智能科技高地。在电数字数据处理方面,除北京、广东外,上海和四川的技术实力也比较强。在数字识别、数字处理、数字传输等方面,依然是北京和广东占有明显优势。由此可见,国内图书馆人工智能应用专利技术分布地域集中化的特征较为明显。

综上,同国外相比,国内同样在电数字数据处理、数字识别、数字处理、数字传输等技术上占有优势。不同之处在于,国外在信息存储和半导体器件方面申请专利数量所占比重较大;国内在语音分析、合成、识别或处理技术研发力度较大。国外技术申请趋势涨幅不明显,属于平稳、快速发展,而国内技术申请趋势明显涨幅较大,属于快速发展;国内外都存在技术构成和技术分布空间集中化的情况。

3.3 申请人分析

笔者将申请人合并后,按照申请专利数量进行统计排名可见,中外申请人所占比重旗鼓相当,其中公司居多,高校较少。申请专利数量最多的是美国IBM公司,该公司是计算机产业的领头羊,早在1959年就申请了“比较信息项以确定相似性的系统”专利,且至今一直持续申请专利,近20年是其人工智能专利技术的高产期。该公司在组织系统、社会网络、语言解释器、语言代码等方面技术力量较强。第二名是美国微软公司,于1992年申请第一项相关专利,2005年申请专利数量达到高峰。该公司在社会网络、虚拟机、组织系统和安全管理等方面具有优势。其他排名前十的国外企业有:日本富士通株式会社、日本电气株式会社、日本制作株式会社、美国甲骨文公司、美国惠普研发公司、韩国三星集团等。

国内进入前二十名的申请人有7个。国家电网公司排名第六,该公司在智能识别、输电系统、计算机可读存储介质、模式识别等方面具有技术优势。排名第七的为腾讯科技(深圳)有限公司,该公司在特征识别技术和通信技术方面技术实力较强。北京奇虎科技有限公司的技术优势在恶意代码、系统修复、个性化推荐、主动防御、机器学习等方面。华为技术有限公司在人脸模型、人脸识别、语音识别、路由收敛、网络数据流量、图像识别、图像匹配、隐私保护等方面表现不凡。阿里巴巴集团控股有限公司则在身份验证、文字识别、信息搜索、信息管理、图像索引等技术上优势明显。值得一提的是浙江大学和上海交通大学是前二十名中的高校代表,浙江大学在激光雷达、移动机器人、运书车、主分量分析、情感识别、数字图书馆、数据挖掘方面申请专利数量较多,而上海交通大学更专注于图书管理机器人、计算机辅助决策、特征数据库、图像检索方法、形态学神经网络等方面。

排名前20的专利申请人中,国外申请人为13个,皆为企业申请人;其中IBM公司具有显著的优势,并且前5名都是美国、日本的公司。国内申请人有7个,其中5个为企业、2个为高校。值得肯定的是,人工智能技术在图书馆应用专利申请领域,浙江大学和上海交通大学走在世界高校的前列。

4 图书馆人工智能技术应用发展建议

通过上述数据分析发现:在专利申请趋势方面,国内外专利申请总体发展势头良好。与国外相比,我国近年来在专利申请数量和速度上都实现了突破性进展,但此时基础理论研究已经跟不上专利申请的发展趋势,亟待进一步加强;技术构成方面,国内外的优势技术基本上集中在电数字数据处理、数字识别、数字处理、数字传输等方面,但在人工智能的核心技术如硬件、算法等方面处于弱势。因此,我国应该一方面保持技术优势,继续开发新技术,另一方面应该加大核心技术的研发力度,争取掌握主动权;在申请人方面,与国外企业申请人占有技术优势相比,我国的企业和高校申请人都在TOP20中崭露头角;技术研发方面,应重视挖掘高校科研实力,加强校企合作,推动科技成果转化;除外,智慧图书馆的兴起是图书馆领域近年来的热议话题,智慧图书馆的发展离不开人工智能技术的技术支撑和推动。为此,为推动人工智能在图书馆的应用,笔者建议可从以下几个方面进行尝试。

4.1 借助人工智能发展趋势,夯实理论基础研究

清华大学课题组《中国人工智能发展报告2018》指出:中国在人工智能论文总量以及高被引论文数量上排在世界第一;在人工智能专利方面,中国已成为专利布局最多的国家,其次是美国和日本[12]。由本文分析可知,与国外相比,人工智能技术在图书馆应用方面,我国专利申请起步晚,相关研究少,虽然后期发展快速,但论文发文数量仍与国外有较大的差距。《2018世界人工智能产业发展蓝皮书》数据显示,中国在人工智能领域的发文量近年来不断增长,但全球占比仍然较小[10]。人工智能技术的发展,给图书馆的文献资源采购和编目、图书上架和管理、读者导航、阅读推广、参考咨询等方面带来了技术变革,我国学者应借助人工智能研究热度,以图书馆的实际应用情况为基础,加强实证性研究。尤其是图书馆馆员研究群体,对人工智能技术在图书馆中的实际应用情况了解程度高,基于实践做出的理论研究更具说服力。在人工智能时代,图书馆员应该注重学习人工智能、机器学习等相关知识、掌握计算机、互联网和通信技术,及时跟踪人工智能在图书馆领域的新应用和新发展[13]。

4.2 调整人工智能专利布局,加强核心技术研究

《中国人工智能发展报告2018》提出,中国人工智能技术的发展和应用市场已处于国际领先地位。但中国的优势主要是在人工智能技术应用开发领域,而在硬件、算法等人工智能核心技术领域,还比较薄弱[12]。报告提出的观点,也在本文的专利分析中突显出来,国内图书馆界应该加强人工智能核心技术的研究。譬如,黄晓斌和吴高提出以人工智能核心技术为支撑的智能搜索引擎面临很大的发展机遇,但是目前,仍然在交互性差、无法提供多维搜索、无法呈现高度个性化结果等方面,无法实现人工智能算法技术突破[14];孟庆宇提出,在数字图书馆人工智能技术应用方面,面临人工智能技术硬件设备的研究经费不足、人工智能技术人才不足等问题[15];由此可见,巩固应用技术的发展,加强核心技术的研发,应该成为我国人工智能专利布局的新方向。

4.3 坚守人工智能技术高地,重视研发新型技术

结合上述分析及全球技术申请趋势对比,在技术分布方面,国内外数字数据处理技术专利申请数量一致居高不下,说明数据的处理在图书馆领域仍然具有较强的活力。另外,近年来陆续增长的数字信息传输、数据识别、数据表示、记录载体及其处理等技术即将进入快速发展阶段。在与国外技术构成对比时发现,我国在语音分析、合成、识别或处理技术研发力度较大,在信息存储和半导体器件方面申请专利数量较少,明显的优缺点对比,说明中国应该在保持语音处理技术优势的同时,加强信息存储、半导体器件的研发。国内技术分布较为集中,应该在保持成熟技术稳步发展的前提下,重视新兴技术的发展热潮,如识别技术、参考咨询机器人、深度学习、神经网络模型等。譬如,2017年12月华中师范大学图书馆开通“刷脸”进馆和“刷脸”借书服务,该图书馆筹划利用人工智能技术建设自建数据私有云、网络安全多维度防护、手机借还、业务大数据平台、高精度三维导航、读者蓝牙物联等服务与应用平台[16];2017年9月,百度联合武汉大学把人工智能引入图书馆,合作建设AI图书馆,实现个性化推送服务[17]。

4.4 加强产学研相结合,推动科技成果转化

上文申请人分析中提到,人工智能技术在图书馆应用专利申请数量排名前20的申请人中,包含浙江大学和上海交通大学两所高校。通过进一步统计前50名申请人可知,华中科技大学、西安电子科技大学、北京理工大学、北京航空航天大学、清华大学、华南理工大学、武汉大学等8所高校也位列其中。这说明,中国高校在人工智能技术领域的研究地位举足轻重。2017年,全国申请开设“人工智能”相关专业的高校有250多所[18]。高校的热情来源于市场的需求,人工智能领域内的产学研结合势在必行。2018年6月,同济大学举办了人工智能研讨会,汇集领域专家学者和校友代表,挖掘人工智能应用场景,探讨如何促进产学研合作。同月,字节跳动公司和吉林大学人工智能学院,达成战略合作,双方将在人才培养、技术交流、科研建设等方面深度合作[19]。《2018世界人工智能产业发展蓝皮书》中也提出要促进技术的迭代和成熟、实现产品应用的落地,同时应该重视人工智能技术人才的培养,尤其是算法层面,加强人才储备,鼓励创新,挖掘人工智能研究者的强大潜力[10]。

4.5 把握人工智能契机,建设智慧图书馆

由上文可知,国外人工智能的研究快速发展阶段持续了20年左右,国内人工智能正处于快速发展阶段的黄金时期。与此同时,业界对于智慧图书馆的研究如火如荼。可以推测,人工智能在智慧图书馆中的应用研究将成为图书馆界当前乃至今后较长一段时间内的一大研究热点。为此,王世伟提出,智慧图书馆是以数字化、网络化、智能化的信息技术为基础,以互联、高效、便利为主要特征,以绿色发展和数字惠民为本质追求,是现代图书馆科学发展的理念与实践[20]。蒋康提出,人工智能可以应用在智慧图书馆的个性化感知系统、信息资源智慧处理系统、信息智能化分析系统、图书资源信息收集、图书资源分类的智能化、资源安全管理、网络建设等方面,并且对人工智能在智慧图书馆中的应用进行了可行性分析。由此可见,人工智能技术与互联网、云计算、物联网等技术相结合在图书馆发展中的应用逐渐增多,人工智能技术能够提高图书馆的工作效率、改善图书馆的服务方式,加速智慧图书馆的发展与最终实现。

5 结语

人工智能技术将会被应用到图书馆的每个角落和各项业务之中,本文通过对比分析国内外图书馆人工智能技术应用专利的申请趋势、技术构成和申请人,发现国内图书馆应用人工智能技术起步较晚,准备阶段较短,发展较快,现在处于快速发展阶段。根据国内外专利申请的趋势和特征,提出五点发展建议,希望通过对中外图书馆人工智能应用专利的对比分析,能为图书馆人工智能研究及应用提供参考,拓宽研究思路。

此外,值得关注的是,习近平总书记在写给2018年世界人工智能大会的贺信中提出,人工智能为经济发展注入新的动力,要把握人工智能发展趋势,同时也要处理好人工智能与法律、政府治理、安全、道德伦理、就业等方面的关系[21]。因此,在今后学术研究中,除了要考虑人工智能功能属性、技术特征、应用范畴等技术因素外,还需要跳出这些微观范畴,从国家战略、社会伦理等宏观层面思考如何将人工智能研究与社会人文、政府治理等问题相结合,除外,在制定人机共存规则和道德规范框架方面同样还有诸多问题需要进一步探索和研究。

猜你喜欢
申请专利专利申请专利
从一件无效宣告请求案谈专利申请过程中的几点启示和建议
专利
Joseph F. Engelberger
唑啉草酯中国专利申请分析
专利文摘
韩国AI内容专利申请数5年激增10倍
便携式热解炉
今年前两月中关村示范区企业共申请专利12609件
专利申请三步曲
不是为挣钱