杜若鹏 寇远涛 朱亮
(中国农业科学院农业信息研究所,农业农村部农业大数据重点实验室,北京 100081)
采用信息计量分析与专家分析相结合的方法,对中国番茄发明专利技术信息进行分析。统计数据显示,2009 年以后中国番茄发明专利申请量显著增加,2010—2020 年公布的申请量占全部申请量的91.0%。按照栽培、植保、生物技术、机械化数字化和加工等6 个研究领域进行分析,在栽培和加工两个领域中,番茄专利技术研究最为活跃,具有绝对的数量优势,而生物技术领域的专利技术研究呈现日益加强的态势。将专利技术内容进一步细分为21 个分支进行分析,种植技术、肥料基质、育苗嫁接、调味品、食品等技术分支为番茄专利研发的重点方向,而基因工程、分子标记、自动化数字化为当前和近期未来的番茄热点研究方向。
专利是技术创新最重要的成果形式之一。专利信息数量庞大,来源广泛,在生产、经营、科研中具有重要的价值。由于公开发布的专利需要经过严格的审查和新颖性评估,因此专利文献是反映相关技术最新研究动态的高质量信息源(尹忠博等,2018)。利用信息计量分析的方法(文庭孝,2014)对专利信息文献进行加工、整理和分析,可以获得能够反映相关技术发展趋势动态的情报,为技术创新和产品开发的立项决策提供重要参考。
番茄是重要的蔬菜作物,也是生物学研究中的模式植物。中国是番茄生产大国,面积和产量均居世界第一(李君明 等,2021)。有关番茄的研究在中国蔬菜科学研究中占有十分重要的地位,近10年来每年仅在“中文核心期刊”上发表的番茄相关论文达400 多篇(杜若鹏 等,2020);近几年中国番茄发明专利每年申请量达500 多件。马桂莲等(2018)曾对截至2017 年公布的2 859 件中国番茄发明专利申请进行分析,发现中国番茄专利的申请主要集中在番茄营养的制备、番茄栽培技术、番茄育种方面,其次为番茄的生物技术及遗传工程研究等领域。张志刚等(2018)对1985—2017 年公布的2 943 件中国番茄发明专利申请信息进行了分析,得出:番茄专利核心技术主要是关于食品或食料的制备和处理、园艺栽培、微生物或酶及其组合物、肥料或农药或土壤调理剂等组成的混合物等内容。上述研究都根据分析结果提出了中国番茄发明专利集中研发的技术领域,但是由于其技术领域或技术内容的分类及其表述是完全遵照国际专利分类方法(international patent classification,IPC)解释的,与人们通常所习惯的技术研究领域分类不一致,不便于专业技术人员参考理解。另外,根据IPC 提出的专利技术重点研究领域偏于宽泛,如“园艺栽培”“生物技术及遗传工程”等,而专业人员感兴趣的是更具体一些的研究方向或技术分支的相关信息。
本文通过采用信息计量学分析与专家分析相结合的方法,从专业技术领域分类的角度,对国家知识产权局公布的中国地区番茄发明专利技术内容进行分析,挖掘其技术发展的趋势和热点,以期为番茄科技创新提供参考。
数据来源于“万象云企业版专利检索平台”。该平台囊括了全球100 多个国家和地区的专利信息,其中中国地区的专利数据来自中国国家知识产权局,每周3 次进行同步更新,确保了专利数据的有效性、及时性与权威性。
以专利名称包含“番茄”或“西红柿”为检索策略,专利地区和专利类型分别选择为“中国”和“发明专利”{检索式:专利类型=(发明专利)AND 地区=(中国大陆 OR 中国台湾 OR 中国香港OR 中国澳门)AND 〔专利名称=(*番茄*)OR 专利名称=(*西红柿*)〕},共检索到1986—2020年12月31日公布的中国专利局受理的发明专利申请5 007 件。
以文献计量统计为基础,使用Java 与Python 编程语言,实现对材料数据的IPC 分类号聚合统计分析,再结合农业专家意见将相近研究方向或主题进行归并调整,形成6 个研究领域。然后针对每个研究领域,对专利名称进行高频特征词统计、词根统计和共词分析等,形成研究领域特征词集,经过专家判定分析后形成研究领域正则表达式。依据表达式对材料数据进行快速细分主题、自动聚类。聚类结果由专家审核分析后进行人工合并或调整,形成不同的技术领域和技术分支信息。最终根据技术分支统计结果进一步分析番茄发明专利技术变化趋势。
为了提高特征词抽取的准确性,对材料数据进行停用词与干扰词屏蔽,过滤掉如“一种”“具有”“及其”等与研究主题无关的干扰词。同时,所有的特征提取词均通过《农业科学叙词表》及《农业专业词表》进行筛选,保证抽取的特征词具有农业专业性。
发明专利申请量是指专利机构受理的技术发明专利申请的数量,能够反映技术发展的活跃程度,以及发明人谋求专利保护的积极性,申请量越多,表明该技术创新力越高。
中国1985 年建立了专利制度(1985 年4月1日起《中华人民共和国专利法》施行),1986 年有了第一件番茄发明专利申请。1986—2000 年,中国番茄发明专利申请量很少,仅为31 件,平均每年仅2 件;2001—2009 年逐步增加,总计418 件,平均每年46.4 件;而2009 年之后大幅上升,2010—2020 年公布的申请量占全部申请量的91.0%,每年为134~709 件,其中2015、2016 年和2017 年这3年申请量最多,分别为607、709 件和696 件,占所有申请量的12.12%、14.16%和13.90%(图1)。需要注意的是,由于发明专利从申请到公开通常有6~18 个月或更长的滞后期(王友华 等,2018;代丽荣,2019),图1 中2018—2020 年公布的专利申请量(用虚线表示)会比实际的申请量低,所以不能据此数据得出近几年我国番茄专利申请量呈明显下降趋势的结论。
中国番茄发明专利申请量的变化与国家推动科技创新战略的实施密切相关。2008 年《国家知识产权战略纲要》颁布实施,2012 年国家实施“创新驱动发展战略”,并将实施知识产权战略作为支撑国家创新驱动发展的重要基础构成,极大促进了创新驱动的发展,由此中国番茄发明专利数量快速增加。
IPC 是世界各国专利机构通用的分类方法,它根据技术内容将发明专利按照部(1 个字母)、大类(2个数字)、小类(1 个字母)、主组(1~3 个数字)、分组(2~4 个数字)逐级进行分类,赋予每个专利一个IPC 分类号码。IPC 对于专利检索几乎是必不可少的工具,而且通过分析IPC号代表的技术分支的发明专利申请数量情况,可以了解相关专利技术发展的热点及趋势。
通过分析发现,5 007 件中国番茄发明专利分属于755 个IPC 分类号,绝大部分属于A 部(生活必需品)和C 部(化学、冶金)。申请量居前的20 个小组如表1 所示,其中A01G 1/00(园艺;蔬菜栽培)、C05G 3/00(一种或多种肥料与无特殊肥效组分的混合物)、A01G 22/05(水果作物,例如草莓、西红柿或黄瓜栽培)这3 个小组的专利申请量居前,分别为439、299 件和250 件,占总量的8.77%、5.97%和4.99%,表明在中国这些技术研究成果比较多且具有明显的应用与发展优势。
但是从表1 也可看出,IPC 的分类方法及类别的描述术语,与科研和生产实际中人们习惯的按照专业技术研究领域的分类方法和表述用语有很大不同,也与国内农业叙词表的分类不同。IPC 分类较细,有时会把本应属于同一技术研究领域的内容分类到不同的类别中。另外,IPC 分类类别的技术描述语句一般都较长,往往是包含多个领域词语的解释,而不是一个技术领域的名称。所以,对于从事番茄研究的专业人员来说,通过直接参考番茄发明专利技术的IPC 分类信息来掌握相关技术发展全局和发展趋势,往往难以达到一目了然的效果。因此,为了便于读者理解和掌握,有必要对中国番茄发明专利技术IPC 分类分布信息进行数据加工处理,形成与专业人员所熟悉的学科和研究领域分类相一致的中国番茄发明专利技术分类分布信息。
表1 中国番茄发明专利申请量居前的20 个IPC 分类小组
将5 007 件番茄发明专利依据其IPC 分类号聚合成了46 类,然后按照专业分类习惯,人工将内容相同的类别合并调整为栽培、育种、植保、生物技术、机械化数字化和加工(包括贮藏保鲜)等6个研究领域及其所包含的21 个技术分支。
统计6 个研究领域的发明专利申请量发现,加工领域的申请量最多,为1 968 件;第二为栽培领域,为1 753 件;第三为生物技术领域,为536 件;其余的植保、育种、机械化数字化领域,分别为455、158 件和137 件(图2)。
分别对各研究领域中不同技术分支的发明专利申请量进行统计,对于少数可以属于两个或多个分支的发明专利采用了交叉分类。结果表明:在专利总申请量最大的加工领域,调味品(539 件)、食品(399 件)、番茄红素(380 件)和饮品(275 件)的专利申请量较大,保鲜质检(93 件)和香料饲料染料等(42 件)很少;在栽培领域,种植技术(810件)、肥料基质(686 件)和育苗嫁接(325 件)的专利申请量较大;在生物技术领域,基因工程(387件)的专利申请量明显高于分子标记(120 件)和病原微生物检测(110 件);植保领域的病害防治(279 件)专利申请量较多,药剂制备(110 件)和虫害防治(94 件)较少;育种领域包括材料方法和繁种制种技术,两者的专利申请量相当;机械化数字化领域中,自动化数字化(102 件)的专利申请量多于机械化(图3)。
2.4.1 不同研究领域发明专利申请量的变化 为了分析不同研究领域番茄发明专利技术的发展趋势,对6 个研究领域番茄发明专利申请量的年度变化进行统计分析,结果发现:加工领域专利技术发展最早,也最快,至2014 年其申请量每年都为6 个研究领域中最高,之后增加趋势减缓,2017 年申请量有所下降;栽培领域专利申请量在2008 年之前很少,之后逐步增加,2013 年之后快速增加并超过加工领域;生物技术领域专利申请量在2009 年之后呈平稳增加趋势,尤其是2019 年和2020 年在有些申请尚未公开的情况下,申请量仍呈明显上升态势;植保领域专利申请量在2010 年之前很少,之后有所增加,2015—2017 年增加较明显;育种和机械化数字化领域发明专利申请量较少,但保持了少量增加的趋势(图4)。以上结果表明,在中国番茄发明专利技术研究中,栽培和加工两个领域最为活跃,具有绝对的优势,而生物技术、植保和机械化数字化领域呈现日益增强的态势。
2.4.2 不同技术分支发明专利申请量的变化 为了进一步了解中国番茄不同技术分支发明专利技术发展的趋势,对2000 年以后6 个研究领域中不同技术分支发明专利申请量的变化进行统计分析,结果如图5 所示,栽培领域中的种植技术和肥料基质分支的专利申请量2012 年之后高速增长,育苗嫁接分支申请量增长也较明显;育种领域中的材料方法分支呈波动增长趋势,繁种制种分支近年增长更快,2017 年有所回落;植保领域中的病害防治分支申请量增长较快,近期略有回落,虫害防治和药剂制备分支呈小幅增长趋势;生物技术领域中的基因工程、分子标记和病原微生物检测分支申请量均呈增长趋势,尤以基因工程增长较明显;机械化数字化领域中的自动化数字化分支申请量近几年呈增长趋势,尤其是2014 年以后增加明显;加工领域近年来除装置工艺分支申请量有所增加外,其他分支均呈下降趋势。
根据番茄不同技术分支发明专利申请量的变化,大体可将其分为4 种类型:①增加趋势十分明显,且数量较大,例如生物技术领域中基因工程分支。② 虽然数量不大,但呈增加趋势,例如育种领域的材料方法分支,生物技术领域的分子标记和病原微生物检测分支,机械化数字化领域的自动化数字化分支。③虽然有下降趋势,但仍保持明显的数量优势,例如栽培领域的种植技术、肥料基质和育苗嫁接分支,植保领域的病害防治分支,加工领域的调味品、食品、番茄红素和饮品分支。④数量一直较少,变化平缓或略有下降趋势,例如育种领域的繁种制种分支,加工领域的保健品化妆品、保鲜质检、装置工艺、香料饲料染料分支等。
2.4.3 番茄发明专利技术发展趋势 番茄发明专利技术研究的重点和热点应从两个方面挖掘,一是申请量多的技术分支,二是近年来申请量上升的技术分支。从数量上来看,种植技术、肥料基质、育苗嫁接、调味品、食品等分支的专利申请量显著高于其他分支,表明这些技术是中国番茄发明专利技术研发的重点。从增长趋势来看,基因工程、分子标记、自动化数字化等分支的专利申请量近年增加明显。例如近5年以来基因工程的申请量达到223件,占其全部申请量的57%,分子标记和自动化数字化分支的专利申请量分别占各自总申请量的63%和77%,表明这3 个技术分支为当前和近期未来的研究热点。进一步分析发现,在2016—2020 年公布的基因工程分支发明专利申请中,与果实品质相关的专利数量占41.7%(93 件/233 件),远高于2016年以前22.5%(37 件/164 件)的同类占比,表明果实品质相关的专利技术研究已成为热点之中的重点方向,这与近期番茄相关的科技创新研究中越来越重视果实品质的趋势(杜若鹏 等,2020)是一致的。
本文对在中国研究申请的番茄发明专利技术进行了研发重点及热点分析,采用信息计量学分析与专家分析相结合的方法,对已公布的中国番茄发明专利技术的国际分类信息按照专业上习惯的技术领域将其分类归纳合并成6 个大的领域,再进一步细分成21 个技术分支。结果表明,种植技术、肥料基质、育苗嫁接、调味品、食品等技术分支是番茄专利研发的重点方向,基因工程、分子标记、自动化数字化为中国番茄专利技术当前、近期和未来的热点研究方向。采用该方法获得的分析结果更具体、更直观。采用信息计量学分析与专家分析相结合的方法对专利技术信息进行研究分析属首次尝试,尚需进一步改进和完善。例如尝试采用深度学习技术和神经网络分类模型训练等手段,提高分类效率与准确性。