大数据视域下铁皮石斛专利/文献可视化分析

2022-07-08 00:56蒋梦雨杨创陈宇韦洁敏白娟杨晓红廖明亮王季春王卫卫
关键词:铁皮石斛专利

蒋梦雨, 杨创, 陈宇, 韦洁敏, 白娟,杨晓红, 廖明亮, 王季春, 王卫卫

1. 西南大学 农学与生物科技学院, 重庆 400715; 2. 西南大学 工程技术学院, 重庆 400715;3. 重庆市渝北区经济作物技术推广站, 重庆 401120; 4. 西南大学 园艺园林学院, 重庆 400715;5. 遵义市播州区中等职业学校, 贵州 遵义 563100

铁皮石斛(Dendrobiumofficinale)为兰科多年生附生草本植物, 具有润肺止咳、 降低血糖、 抑制肿瘤、 提高人体免疫力等作用, 有着极高的药用价值, 是我国传统药用石斛的重要品种之一[1-3], 铁皮石斛属于石斛中非常珍贵的品种, 被誉为“九大仙草之首”, 市场需求量大. 然而, 野生铁皮石斛生长条件严苛、 自然产量较少, 20世纪90年代我国开始大量采挖野生铁皮石斛, 使得野生铁皮石斛资源逐年枯竭[4-5], 产量供不应求. 为了满足市场需求, 我国在铁皮石斛人工培育方面开展了卓有成效的工作[4], 使得种植面积逐年增加[6]. 然而, 种植面积增加后产量过剩导致价格下跌, 药农生产积极性降低, 产业发展进入瓶颈[7]. 因此, 突破瓶颈寻求新的发展机会成为了铁皮石斛产业当前亟待解决的问题.

本研究以铁皮石斛专利和发文数量为切入点, 利用Innojoy专利检索平台和中国知网(CNKI)数据库, 对铁皮石斛专利和文献的数据进行挖掘, 采用可视化技术, 计量分析产业发展历史、 热点领域、 创新机构、 产业特色与分布、 领军人物等, 寻找产业发展方向, 以期为铁皮石斛产业的可持续性发展提供直观、 可视化的数据支撑.

1 数据来源与方法

1.1 数据来源

1.1.1 专利数据

Innojoy专利检索平台集合了全球105个国家和地区1.2亿多条专利数据, 高度整合专利资源, 提供方便快捷的全球专利检索通道. 本研究利用Innojoy全球专利检索平台, 选取关键词“铁皮石斛”进行专利检索.

1.1.2 文献数据

本研究所使用的文献均来源于中国知网(CNKI)数据库, 检索2002-2020年国内外主题为“铁皮石斛”的所有文献, 共检索出5 270篇.

1.2 分析方法

1.2.1 数据挖掘技术

数据挖掘技术涉及到聚类、 分类、 关联分析以及特征分析等方法[8]. 本研究运用数据挖掘技术对铁皮石斛科研领域的数据进行处理, 同时对已有成果数据反复挖掘, 找出产业的研究现状、 研究热点以及发展的新领域.

1.2.2 数据可视化技术

数据的可视化是将挖掘到的数据以图像的形式呈现出来, 这种方式不仅能直观地观察到数据中的基本信息, 还能分析海量数据中隐藏的规律. 本研究是利用ECharts可视化工具来进行数据分析, 绘制折线图、 柱状图、 条形图、 散点图、 饼图等图表, 把挖掘处理后的科研数据直观呈现出来, 有利于发现铁皮石斛产业的发展趋势, 寻找产业未来发展方向.

2 结果与分析

2.1 专利发展与分析

2.1.1 专利数量的逐年变化分析

图1是根据Innojoy专利搜索引擎检索的结果, 截止至2020年12月31日, 专利总计6 690项, 首项专利出现在2002年. 图1数据显示, 铁皮石斛科研的发展分为3个阶段: ① 发展前期. 2002-2010年专利数量较少, 专利的增长量一直处于低水平浮动状态, 表明参与研发的机构和人员开始关注到这一领域的研究, 成果初显; ② 快速发展期. 2011-2016年铁皮石斛的专利逐年迅速增加, 总量最多, 铁皮石斛产业迎来了发展的黄金时期, 更多的企业和人员加入到这一领域的研究, 铁皮石斛市场交易火热; ③ 稳定发展期. 2016年专利数量达到峰值后, 迅速呈现出回落的趋势, 但仍然高于2013年及之前年份的数量. 由此表明: 2017-2020年铁皮石斛产业的发展经过起始期、 快速发展期后向稳定期转变, 并趋于饱和, 一些产业机构逐渐退出或减少了这一领域的研究投入.

图1 铁皮石斛专利历年申请量(2002-2020年)

2.1.2 专利类型分析

图2是2002-2020年期间铁皮石斛专利申请的类型分布, 可以看出: 77.3%的专利是发明专利, 18.6%是新型专利, 4.1%是外观专利. 数据分析表明: 在铁皮石斛的专利研究中, 大多属于高水平技术层面的发明专利, 实用新型专利相对较少, 代表着铁皮石斛专利研究中科技创新占主导地位.

图2 铁皮石斛专利类型(2002-2020年)

2.1.3 专利区域分布与产业龙头态势分析

图3对2002-2020年期间专利数量排名前十的省份进行了统计, 其专利数量之和占总量的84%, 从图3可以看出: 浙江和广西专利数量最多, 其专利量分别约占总量的18.4%和17.5%, 分别占据排名的第一和第二, 从全国范围来看, 这两省的专利申请量远高于其他各省, 具有龙头示范作用, 领跑全国的石斛产业发展; 东部沿海地区专利申请量较为突出, 浙江、 广东、 福建以其优越的地理位置和专利技术成为产业的主产区和海外交易的主场, 位于产业后端.

图3 全国排名前十省份专利申请数量(2002-2020年)

统计铁皮石斛产业申请专利量排名前十的省份逐年专利量情况, 结果如图4所示, 可见:

图4 各省份铁皮石斛专利量的变化(2002-2020年)

① 浙江省最早对铁皮石斛专利进行研究, 直到2013年, 一直处于产业龙头位置, 引领产业发展方向, 其他省份从2010年开始逐渐发展, 落后于浙江省7到8年的时间. 从2002年开始, 涉及铁皮石斛产业的专利数量逐年增加, 在2016年达到顶峰, 然后逐年下降.

② 广西壮族自治区铁皮石斛产业发展迅猛. 自2012年增势明显, 在2016年达到专利量269项的峰值, 迄今未有地区超过其数量. 广西专利量到达顶峰后, 其专利量几乎是断崖式下降, 在2019年达到谷底. 与此类似的还有安徽、 江西、 福建等省份与此类似, 说明这些省份的铁皮石斛产业受市场的影响波动大, 容易大起大落, 产业尚不够稳健, 持续发展能力不足.

③ 产业前端发展平稳, 产业基础坚挺牢固. 山东、 云南、 贵州等省份虽然近几年专利数量有所下降, 但由于总体数量原本不高, 因此下降幅度不太突出, 表明该石斛产业在该区域的发展仍然比较稳定, 可持续性较强.

④ 产业龙头发展稳定, 引领作用持续有力. 2018年后, 专利数量前三是浙江、 广东、 福建, 虽然2016年是一个“拐点”, 专利量逐年有所下降, 但相对比较平稳, 2020年仍然位居前三, 尤其是浙江, 占据产业龙头位置. 表明上述3个地区的铁皮石斛产业仍然最为活跃, 我国铁皮石斛产业发展总体平稳.

2.1.4 专利技术热点分析

对2002-2020年的专利数据进行反复挖掘, 依据文本聚类并运用可视化工具进行分析, 提炼出了铁皮石斛专利研究技术热点, 如图5所示, 其专利的研究主要分为四大方向, 分别对应图中4种颜色, 蓝色对应“医药”、 绿色对应“栽培”、 黄色对应“饮品”、 红色对应“化妆品”, 在医药、 栽培、 饮品以及化妆品这四大类中, 可以看出栽培和医药方面的研究比较突出, 同时化妆品方面的研究开始受到关注.

图5 中国铁皮石斛专利研究热点(2002-2020年)

2.1.5 专利应用领域的发展趋势

国际专利分类(Internatoral Patent Clasifiation, IPC)是以功能分类为主, 应用分类为辅的分类原则进行分类, 分为5个等级: 部、 大类、 小类、 大组、 小组, 本研究选取IPC大组里的专利数据进行分析.

以“栽培”“组织培养”“药物制剂”“化妆品”“饮料”“茶类制品”“营养制剂”为关键词进行搜索查询, 将专利服务领域区分为种植、 制药、 化妆品、 食品4个行业方向, 其中“栽培”“组织培养”对应为种植行业, “药物制剂”对应为制药行业, “饮料”“茶类制品”“营养制品”对应为食品行业.

图6是利用前述关键词搜索到的截止于2020年底的专利数据在4个行业的分布情况, 共有有效专利3 848项, 其中关于种植行业的专利最多, 有1 475项, 占比38.3%, 其次是制药行业, 有999项, 占比26.0%, 排名第三的是食品行业, 专利数937项, 占比24.4%, 化妆品行业有437项, 占比11.4%. 由此表明: ① 在铁皮石斛产业的发展初期, 由野生到人工栽培的过程中, 科研人员投入了大量研究, 解决人工栽培过程中的关键技术问题; ② 铁皮石斛主要应用于药物治疗, 因此, 随着种植产业的发展, 科技人员对其药理作用进行了深入研究; ③ 铁皮石斛除用于药物治疗外, 还应用于饮料、 茶类制品及化妆品中, 拓宽了其应用领域, 注入了新的活力, 为铁皮石斛产业的发展找到了新出路.

图6 中国铁皮石斛专利的IPC分布(2002-2020年)

图7展示的是2011-2020年铁皮石斛在前述4个分支行业相关专利的逐年变化情况. 可以看出, 专利数量在2012年以后明显增加, 并具有如下3个特征: ① 2016年是铁皮石斛在制药、 食品行业的专利数量的“拐点”, 2016年前逐年增加, 2016年后逐年减少, 并在2019-2020年趋于稳定, 表明这两个行业进入稳定发展期, 发展空间较大; ② 种植行业的专利“拐点”是在2017年, 2017年前逐年增加, 2017年后逐年减少, 同样也在近两年趋于稳定, 表明栽培技术中的关键问题已基本解决; ③ 化妆品行业在2019年达到最多, 2020年略有下降, 表明铁皮石斛在化妆品领域的发展还未成熟, 具有较大的拓展空间[9].

图7 应用领域中专利数量的变化(2011-2020年)

2.1.6 专利权属单位分析

按照专利权属(企业和科研单位)单位进行搜索, 并依据专利数量进行排名, 选取2002-2020年专利权属前十的单位列成表1. 从表1可以看出: ① 企业专利数量最多, 占比83.5%, 科研院所的专利较少, 占比16.5%, 表明企业更加关注科学技术的创新价值; ② 广西、 江苏发展较快, 专利总数占专利数量前十的 43.8%, 企业与高校联合, 对产业发展的推动作用大; ③ 广西、 江西、 福建、 安徽、 贵州、 浙江、 广东等省份有实力雄厚的石斛科技型龙头大企业, 具备可持续发展能力.

表1 铁皮石斛专利数量前十名权属单位(2002-2020年)

2.2 文献发展与分析

2.2.1 文献发表总量分析

依据中国知网电子数据库, 以“铁皮石斛”为检索词进行检索, 检索结果显示: 其收录的铁皮石斛相关文献最早发表于1957年, 此后的几十年间, 相关文献数量较小, 直到2002年才出现明显的上涨趋势, 因此选取了2002-2020年期间的文献数量作为研究对象, 文献范围涵盖了与“铁皮石斛”相关的所有文献, 包括期刊、 学位论文、 专著、 研究报告等.

图8显示了这19年间铁皮石斛相关文献发表数量的变化情况, 共计有5 270篇, 文献数量表现出缓慢上升、 到达顶峰后又缓慢下降的变化趋势, 大致也可分成3个阶段: ① 发展前期. 2002-2009年, 文献发表量虽然逐年有所增加, 但相对于其他年份而言, 数量相对较少, 8年间共发表文献604篇, 年均约76篇; ② 快速发展期. 2010-2015年, 6年间共发文数量达1 981篇, 年均约330篇, 约为起步阶段的4倍. 在这个阶段, 每年发文数量几乎是成倍增长, 到2015年达到顶峰; ③ 稳定发展期. 从2016年开始, 总体趋势是发文数量逐年减少, 但减少得不多, 2016-2020年, 5年间共发文2 685篇, 年均约537篇, 仍然维持在较高的水平, 高于2015年前面任何一个年份, 说明铁皮石斛的研究投入逐渐趋于理性, 进入了稳定发展阶段.

图8 铁皮石斛文献发表数量(2002-2020年)

2.2.2 文献研究机构分析

挖掘2002-2020年铁皮石斛文献发表数量排列前27位研究机构的数据, 如图9所示: 铁皮石斛文献的研究机构主要分布在我国南方, 尤其是沿海地区, 北方研究发文量少. 发文数据呈现以下2个特征: ① 浙江研究机构的发文量遥遥领先. 发文量排名前五的科研院校中有3所(浙江农林大学、 浙江中医药大学、 浙江大学)院校在浙江, 发文量最多的是浙江农林大学, 远超其他研究机构, 表明浙江省在铁皮石斛科研成果方面领先于其他省份; ② 除排名前五的科研院校发文量较为突出外, 剩下24所科研院校发文量从58篇到22篇依次递减, 且递减的数量不超过5篇, 表明这24所院校在铁皮石斛方面的研究差距不大.

图9 研究单位铁皮石斛文献发表数量(2002-2020年)

2.2.3 文献研究作者分析

选取2002-2020年发表铁皮石斛相关文献排名前20名作者的相关信息, 关键词是选取对应作者发表论文中频次较高的5个关键词, 研究领域是笔者根据关键词所划分的领域(表2). 斯金平是发文量排名第一的作者, 高达71篇, 其次是郭顺星48篇, 吕圭源40篇, 陈素红与张岗各发表30篇, 其余作者的发文量均低于30篇; 从研究领域来看, 发文量前20名的作者研究集中于农作物、 中药学、 中医学、 生物学、 化学、 园艺等领域, 其中中药学、 中医学领域的研究居多; 总体来看, 发文量排名前十位的作者主要是从事于铁皮石斛医药学方面的研究, 其他作者主要从事基础性农艺方面的研究, 由此可以看出铁皮石斛医药学方面的应用是研究的热点.

表2 发文量排名前20的作者(2002-2020年)

2.2.4 文献高频关键词分析

在2002-2020年的5 270份文献中, 对关键词进行数据挖掘得到表3. 结果表明: ① 选取频次高于3次的关键词, 定义其为高频关键词, 共有高频关键词54个, 并依据其频次的高低进行排序, 如表3所示, 总频次为1 608次. 排在首位的是“多糖”, 其频次远远高于其他关键词, 紧随其后的分别是“组织培养”和“原球茎”, 虽然排名第二、 第三, 且频次也远高于其他关键词, 但他们频次的总和低于“多糖”的频次; ② 54个高频词可分为栽培与育种、 医药及化学、 功能产品和产业化研究四大领域, 归纳凝练为表4, 涉及栽培技术研究(如组织培养、 原球茎等)的高频词有31个, 频次达854次, 占总频次的53.1%, 居于第一, 在种植栽培技术领域内的关键词较多, 涉及的面比较广, 对铁皮石斛的栽培种植技术起到了积极推动作用; 涉及医药及化学领域的高频词有17个, 频次达716次, 占总频次的44.5%, 位居第二, 表明“多糖”研究不仅是医药及化学领域研究的热点, 也是铁皮石斛产业研究的热点[10]. ③ 纵然在种植栽培领域研究的文献量较多且面较广, 但绝大多数是组织培养和原球茎等现代新技术对传统产业的改进与升级技术的研究, 其传统栽培技术研究相对较少[11]. ④ 功能产品研发是拓展铁皮石斛产业未来发展的方向, 但该领域文献较少.

表3 高频关键词排序(2002-2020年)

表4 高频关键词领域分类排序(2002-2020年)

2.2.5 文献超高频关键词发展趋势分析

表3中频次排名前五的关键词“多糖” “组织培养” “原球茎” “内生真菌” “组培苗”, 因出现的频次相对较高, 将其定义为超高频关键词, 其中“多糖”为功能成分高频词, 后面4个为组织培养系统高频词. 对这些超高频关键词再进行挖掘, 制成图10, 研究其逐年变化情况, 探究其产业研究趋势. 结果表明: ① 在铁皮石斛产业的发展初期, 主要的研究内容是铁皮石斛的组织培养, 解决工厂化育苗快速繁殖的问题, 文献数量逐年增多, 到2015年达到顶峰, 但从2015年开始, 文献数量开始减少, 说明铁皮石斛组培的关键技术基本解决; ② “多糖”在2011-2020年发展得最为迅猛, 至今仍有较大的发文量, 表明“多糖”这一化学成分是产业研究的重点和热点, 对拓展该产业的应用领域是十分必要的[12]; ③ “原球茎” “组培苗” “组织培养” “内生真菌”这4个关键词都可归属于栽培技术这一类研究, 表明利用现代技术提升传统产业的发展, 是积极有效的, 栽培技术的研究与应用仍然是产业发展的基础[13-14]; ④ 内生真菌的文献数量虽然相比于栽培、 化学药理方面较少, 但2011-2020年的关注度几乎呈直线上升, 是一个热度不减的研究领域, 表明人们对铁皮石斛与内生真菌共生生物学特性的认识在逐年加深, 已经认识到铁皮石斛与内生真菌共生体系的构建是铁皮石斛健康生长发育的基础, 预示共生生物菌肥的研发对铁皮石斛产业链的分支和延伸有着巨大的贡献潜力, 必将推动铁皮石斛产业的可持续发展[15].

图10 超高频关键词的变化情况(2002-2020年)

3 结论

经过20年的发展, 铁皮石斛产业在专利和论文数据方面发生了有规律的变化:

铁皮石斛科学研究的发展可分为发展前期、 快速发展期和稳定发展期3个阶段. 2002-2010年为发展前期, 科研成果增长幅度缓慢; 2011-2015年为快速发展期, 大量学者进入该领域, 科研成果迅速增加; 2016-2020年为稳定发展期, 技术趋于成熟. 发展前期工作主要集中在栽培育种领域, 研究如何提升产能; 产业快速发展期, 人工栽培技术取得显著成效, 产量大幅提高; 产业稳定发展期, 基础性研究逐渐成熟, 产业趋于饱和, 因而转向医药及化学领域.

铁皮石斛产业发展的基础和核心是提高原材料的数量和质量. 在经历发展前期后, 种植栽培问题基本解决, 从文献超高频关键词的发展趋势来看, 近年来仍有不少研究集中在栽培领域, 表明铁皮石斛产业发展基础仍旧是种植栽培, 用现代技术提升传统种植栽培体系, 从而提升产量和质量是学者研究的核心.

东南沿海省份铁皮石斛科研领域起步早、 发展快, 引领产业的发展方向. 浙江、 福建、 广东等省份拥有地理位置、 经济水平、 科研成果的优势, 成为铁皮石斛加工与销售的主产区, 位于产业链的后端; 而云南、 贵州、 广西等省份, 由于经济发展较缓, 药材需求不大, 科研能力较弱等因素, 成为种植栽培的主产区, 位于产业链的前端.

随着铁皮石斛研究的深入, 产业发展拓展到了食品、 医疗保健以及化妆品等应用领域, 目前这些领域的科研成果不多, 因此新领域的研发是未来产业发展的趋势, 同时也是铁皮石斛产业突破发展瓶颈的新动力.

猜你喜欢
铁皮石斛专利
石斛兰
铁皮侠的装备
杨景波 石斛花开香满城
加工铁皮管
仙草石斛的护肤传奇
药用石斛种质资源生物学特性观察
我的爸爸(下)
2007年上半年专利授权状况统计