夏舒娴,段异兵
(中国科学院 科技战略咨询研究院,北京 100190; 中国科学院大学 公共政策与管理学院,北京 100049)
在国际技术竞争加剧的背景下,全球科技创新呈现出新的发展态势。随着中国经济和科技的迅速发展,中国科技创新在技术宽度和技术深度方面持续拓展演进,正在发生整体性、格局性的变化。本文从技术多样性和热点领域的视角,研究2000—2021年中国科技创新的发展态势,探讨中国技术多样性发展有何特点?在多样性的技术中有哪些技术热点领域?这些热点领域是如何演化的?
专利是技术信息的有效载体,包含技术发展相关的宝贵信息[1]。据世界知识产权组织(WIPO)统计,专利文献包含世界上90%~95%的技术信息,并且技术信息的公开要比其他载体早1~2年[2],是测度技术创新的重要工具。本文基于USPTO的专利数据,通过挖掘专利IPC分类号包含的信息,分析2000—2021年中国总体和特定企业的技术多样性和热点领域。
2000年以来,中国研发投入持续增加,作为研发产出的专利申请和授权量迅速增长,对专利质量的担忧也引起学术界的关注[3-4]。选用USPTO的中国授权发明专利数据作为样本。由于USPTO有严格的专利审查机制,获得授权的发明专利有较高质量,选用USPTO的中国专利在一定程度上可以更客观地反映中国科技创新演进特征[5]。国际专利有全球化的特点,中国在USPTO的专利活动也体现了中国在全球技术市场上的技术能力[1]。
样本数据源自智慧芽软件的USPTO专利数据库。智慧芽是专利计量研究常用的数据源[6-7]。通过检索式“ISD: [20000101 TO 20211231] and PATENT_TYPE: B and AN_COUNTRY: CN”进行检索(最后检索日期2022年1月15日)和下载,获得2000—2021年中国授权发明专利314 873项。剔除港、澳、台专利,缺失关键信息的专利和含有异常值的专利,最终获得100 900条样本数据。
基于专利的IPC分类信息,选用熵指数测度技术多样性。熵反映了系统有序化程度,是测度技术多样性的常规指标[8-9]。第t年技术多样性的熵指数计算公式为
(1)
式中:Nt为t年的IPC数量;Nit为t年第i个IPC代码的数量,一个专利中重复出现的代码只计算一次。熵的取值范围为0~lnn,0表示只专注于一个技术领域,lnn表示该专利在不同技术领域之间均匀分布。熵值较低意味着专门化和集中化,接近于lnn的值意味着多样化。
利用Python程序提取样本数据IPC(国际专利分类号)的前3位代码IPC 3(部、大类)、4位代码IPC 4(部、大类、小类)和6位代码IPC 6(部、大类、小类、大组),分别计算3种层次IPC代码的熵指数。熵指数能够反映专利在不同层次中的分布状况,但不能直观地反映技术领域的多少,因此,还考虑了3个层次IPC代码类别的数量。
共现次数分析是挖掘热点技术领域的常用方法。郭晨等通过统计专利主IPC号的频次对无人机领域的技术热点进行识别[10];王友发等利用专利文献中关键词的频次识别人工智能领域的技术热点[11]。本文通过共现次数分析识别技术热点领域。
IPC分类号是识别专利所属技术领域的重要工具。专利审查员在收到一项专利申请后会依据专利的技术主题确定专利的IPC分类号。依据技术主题分类的标准使得IPC分类号可以很好地用于识别发明所属的技术领域。本文通过计算IPC代码的共现次数,挖掘技术热点领域。IPC代码共现次数越多,表明专利活动在该IPC代码所代表的技术领域越活跃,相应的技术领域即为热点领域。
对每年IPC 3、IPC 4、IPC 6层次上不同IPC代码的数量和熵值进行统计分析,结果见表1,相应的趋势状况如图1所示。从IPC类别看,自2000年以来3个层次的专利代码类别均呈上升趋势:IPC 3代码从2000年的45种增加到2021年的123种,增长1.7倍;IPC 4代码从97种,增加到552种,增长4.7倍;IPC 6代码从207种,增加到3 651种,增长16.6倍。这表明中国在USPTO专利活动的技术领域处于持续增加的演进状态。2000—2021年的USPTO中国专利的IPC 3代码有126种,占全部IPC 3代码(131种)的96.2%;IPC 4代码有623种,占比96.4%;IPC 6有5 596种,占比74.4%[12]。中国专利的IPC 3和IPC 4代码占全部代码的比例都超过96%,表明中国总体上已具有在所有领域参与国际技术竞争的能力;IPC 6代码的比例相对较低,表明在约1/4的细分领域还未参与国际技术竞争。
表1 2000—2021年不同层次IPC代码数量和熵值
图1 2000—2021年不同层次IPC代码数量和熵值
从熵指数计算结果看,2000—2013年IPC 3熵值呈现下降的趋势,2013年之后趋于稳定;IPC 4熵值总体上趋于稳定。IPC 3和IPC 4代码数量不断增加,而其熵值趋于稳定,表明专利活动的领域虽不断增加,但总体上技术多样性程度较为稳定。IPC 6熵指数在波动中保持上升态势,结合IPC 6类别数量的上升趋势,可知中国在细分领域的技术多样性处于拓展演进状态。由此可见,2000—2021年USPTO中国专利活动的技术领域越来越多,分类较宽的IPC 3和IPC 4领域的多样性程度较为稳定,细分的IPC 6领域的多样性程度越来越高。
选用技术领域中观层次的IPC 4信息,探讨技术热点领域。统计2000—2021年每年IPC 4代码的共现次数,取每年共现次数前5位的代码得到热点领域演化图(图2),相应的共现矩阵略。
图2 2000—2021年IPC 4热点领域演化趋势
2000—2006年共现次数前5位的IPC 4代码为A01N、A61K、A61P、B01J、C07C、C07K、C10G、C12N、G01N、H01L、H01M,主要分布在人类生活必需品(A部)、作业和运输(B部)、化学和冶金(C部)3个部;其中A61K(医用、牙科用或梳妆用的配制品)连续11年共现次数排在前5位,是技术活动的热点领域。自2007年,技术热点领域逐渐向物理(G部)和电学(H部)转移。自2011年起,A、B、C部中的IPC 4代码共现次数全部退出前5位,G部和H部的IPC 4代码(G02F、G06F、G09G、H01L、H04B、H04J、H04L、H04W)进入前列;其中电数字数据处理(G06F)、半导体器件(H01L)、数字信息传输(H04L)、无线通信网络(H04W)连续多年位列前5位,是技术活动的热点领域。2020年,控制装置或电路(G09G)共现次数首次位列前5位,成为新的热点领域。
上述结果表明,2000—2021年,中国技术热点领域发生了一次较为明显的整体性、历史性、格局性转移,新兴技术领域成为中国科技创新的主要阵地。即从人类生活必需品、作业和运输、化学和冶金部的IPC 4领域转移到物理和电学部的IPC 4领域。到2020年和2021年位居前5的技术热点领域是电数字数据处理、控制装置或电路、半导体器件、数字信息传输、无线通信网络,其中控制装置或电路是新增的热点领域。
为深入揭示中国技术多样性演进特点,以下对专利数量排前3的专利权人进行分析。统计本文样本,得到专利数量排在前10位的专利权人(表2)。他们均为企业,专利数量占中国USPTO专利总量的42%。其中,前3家企业为华为、京东方、华星光电,他们的专利数量占专利总量的30%。对华为、京东方、华星光电的技术多样性和热点领域分析,有助于更细化、更具体地理解中国技术多样性演进状况。
表2 排名前10位的专利权人拥有专利数量及占比
图3是2000—2021年3位专利权人发明专利授权量时序图。专利数量在一定程度上可以反映企业的创新能力。由图3可知,华为在美国的专利活动开始较早,授权专利数量呈上升趋势,显示其创新能力在不断提升。京东方在美国的专利活动晚于华为,早于华星光电。尽管相比于华为,京东方专利活动起步较晚,但其授权专利数量增长速度较快,2014年以后授权专利大幅增长,2017—2019年授权的专利数量反超华为,说明京东方创新能力的提升速度较快。华星光电在美国的专利活动起步较晚,专利数量总体上也保持上升的趋势,专利总量低于华为和京东方,发展速度相对平稳。
图3 2002—2021年3位专利权人发明专利数量
图4~图6分别是3位专利权人每年IPC 3、IPC 4、IPC 6层次上不同IPC代码数量和熵值的趋势状况。总体上,2000—2021年3位专利权人不同层次IPC代码类别的数量在增加,相应的熵值也呈增加趋势,表明3位专利权人的技术多样性和热点领域总体上处于持续拓展状态。
图4 2002—2021年3位专利权人IPC 3类别数量和熵值
图5 2002—2021年3位专利权人IPC 4类别数和熵值
图6 2002—2021年3位专利权人IPC 6类别数和熵值
表3是3位专利权人授权发明专利总量、不同层次IPC代码类别的总量和相应的熵值。由表3可知,3家公司拥有的专利数量差异较大,华为和京东方拥有的专利数量较多,分别占3家公司专利总量的44.24%和36.26%。
华为拥有的专利最多,但专利覆盖的技术领域相对较少,IPC 3、IPC 4和IPC 6代码类别均少于京东方,也少于华星光电。这表明,总体上华为专利在技术领域分布上较为集中。从熵值来看,华为的IPC 3熵和IPC 4熵低于华星光电,表明华为专利在其IPC 3和IPC 4代码所代表的技术领域上的分布较为集中,而IPC 6熵相对较大,表明其专利在更加细分的技术领域上多样性程度较高。
专利数量排第2位的京东方,其专利覆盖的技术领域最多,覆盖的IPC 3、IPC 4、IPC 6代码分别占全部代码的72.52%、51.24%、18.01%。从熵值来看,京东方3个不同层次的熵值均高于华星光电,IPC 3熵值和IPC 4熵值均高于华为,IPC 6熵值略低于华为,表明京东方技术在不同层次技术领域的多样性程度均较高。
专利数量排第3位的华星光电,在不同层次的IPC代码类别均高于华为,表明其技术覆盖的技术领域多于华为。华星光电IPC 3熵和IPC 4熵值也高于华为。这表明,华星光电在IPC 3和IPC 4层次上的技术多样性程度大于华为。
表3 专利数量排名前3位的专利权人IPC类别数、熵值
统计3家公司的IPC 4代码频次,并展示排在前5位的IPC 4代码,得到3家公司的技术热点领域(图7)。由图7可知,3家公司的技术领域都集中在电学(H部)和物理(G部)两个大的技术领域,但关注的IPC 4领域有差异。华为的IPC 4技术领域包括数字信息传输(H04L)、无线通信网络(H04W)和电数字数据处理(G06F)等。其中,数字信息传输和无线通信网络两个领域分别覆盖华为48.71%、40.88%的专利,而排在第3位的电数字数据处理领域仅覆盖20.62%的专利。这表明,华为技术研发热点是数字信息传输和无线通信网络2个领域。
京东方关注的IPC 4技术领域包括半导体器件(H01L)、光学装置(G02F)、控制装置或电路(G09G)等。前5位技术领域覆盖的专利比例差距较小,表明京东方关注的技术领域更加多元化。
华星光电关注的IPC 4领域包括光学装置(G02F)、半导体器件(H01L)、控制装置或电路(G09G)等。覆盖专利比例前3位的技术领域(光学装置、半导体器件、控制装置或电路)分别覆盖40.09%、36.29%、28.49%的专利,而第4位的电数字数据处理(G06F)领域仅覆盖8.87%的专利。这表明华星光电技术研发的热点是光学装置、半导体器件、控制装置或电路3个领域。
图7 3家公司排在前5位IPC 4覆盖专利占比
基于USPTO的中国授权发明专利数据,研究了2000—2021年中国技术多样性和热点领域,得到以下结论:
2000—2021年中国专利活动的技术领域逐年增加,在分类较宽的大领域(IPC 3、IPC 4)内多样性程度较为稳定,在细分领域(IPC 6)内的多样性程度越来越高。这一期间中国技术热点领域发生了一次较为明显的转移,从2007开始,技术热点领域从生活必需品、作业和运输、化学和冶金领域转移到新兴的物理和电学领域。2020年和2021年的技术热点领域是物理和电学领域的电数字数据处理、控制装置或电路、半导体器件、数字信息传输、无线通信网络,其中控制装置或电路是新增的热点领域。
对比分析专利数量排名前3位的专利权人(华为、京东方、华星光电),发现不同专利权人的技术多样性和热点领域总体上处于持续拓展状态,但程度上有差异。京东方技术多样性程度最高,关注的技术领域更加多元化;华为在细分的技术领域上有较高的多样性,技术研发热点领域是数字信息传输和无线通信网络;华星光电在更大技术领域上的技术多样性比华为大,技术研发热点在光学装置、半导体器件、控制装置或电路。