陈欣宇 郭婷 戴红君 孙艺伟 罗瑞 任妮
摘要:通过开展农业领域的科技竞争力与态势分析方法研究,为农业领域科技工作者与管理者的科技创新与管理决策活动提供数据参考和情报支撑。首先,从基础研究和技术创新2个维度构建包含科研生产力、科研影响力、科研卓越力、科研合作力的科研竞争力评价指标体系,并通过数据规范化处理,构建综合竞争力评价模型,测算综合竞争力指数,以评价科研群体的科研实力;然后,融合基础研究和技术创新的数据集,采用分级聚类技术开展领域研究重点的挖掘,并构建基于主题强度、主题新颖度、主题学科交叉度的多维指标研究前沿识别模型来识别领域研究前沿;最后,以长三角地区畜牧兽医领域为研究对象进行实证研究。研究发现,江苏省的综合科研竞争力排在前列,其次是上海市、浙江省和安徽省;研究挖掘出生理生化与免疫调控技术等4个重点研究方向、代谢及免疫调控技术等10项重点研究内容,识别出养殖装置研发与利用等3项研究前沿。该方法体系具有可行性、科学性与合理性,可以为农业领域科研竞争力、科技态势分析等情报研究提供参考,但在数据源、研究重点挖掘等方面还有待进一步完善与深化。
关键词:科研竞争力;科技态势;研究重点;研究前沿;多源数据
中图分类号:G311 文献标志码:A
文章编号:1002-1302(2023)23-0236-08
随着当今科学研究进入大科学时代,科技文献数量和科学知识急剧增长,在较短时间内掌握学科领域的全局动态变得越来越困难[1]。农业领域发展历史悠久,科技文献体量大且类型多,因此开展农业领域的科技竞争力与发展态势研究,分析领域的发展现状与趋势,揭示领域各研究群体科研竞争力的异同和差距,挖掘领域研究重点、热点与前沿,是农业领域科技工作者与管理者全面了解农业领域研究现状与知识布局、掌握科技发展脉搏、识别合作对象与竞争对手、明确战略发展方向与优劣势、精准制定政策决策、优化科技资源配置、占领科技发展制高点等的有效手段。
国内外已有学者基于各类科技文献在学科领域的科研竞争力分析方法[2-7]、科技态势分析方法[8-15]研究上做了大量探索。农业领域有关科技竞争力与发展态势分析的研究与应用始于20世纪90年代,已有学者基于论文、专利、品种权、项目、奖项等多类数据构建评价指标体系开展有关地区[16-17]、科研机构[18-19]、高校[20-21]、学科[21-22]等多个维度的科研竞争力分析;也有学者基于论文、专利等科技文献开展有关各类作物[23-25]、节水农业[26]、循环农业[27]、农业信息技术[28]、作物模型[29]、移栽机械[30]、转基因作物育种[31]等多个领域的科技态势分析。目前在针对农业领域的方法流程、评价指标体系构建、热点前沿挖掘等技术方法上的创新研究较少,适应于农业领域的方法体系亟待研究攻关。
基于此,本研究基于论文与专利数据,综合文献计量、专利计量、统计分析等技术开展评价指标体系构建、综合竞争力测算、研究重点挖掘、研究前沿识别等方法研究,构建农业领域科技竞争力与态势分析方法体系;选择长三角地区畜牧兽医领域为研究对象,以验证本研究构建方法的可行性、科学性与合理性,并为长三角地区畜牧兽医领域科技创新、管理决策等提供情报支撑与数据参考。
1 研究框架与方法
2.1 研究框架
本研究框架如图1所示,主要包括数据获取与预处理、科技竞争力与态势分析方法体系构建、实证研究3个环节。
1.2 研究方法
1.2.1 科研竞争力分析方法
1.2.1.1 评价指标体系构建
本研究以武汉大学中国科学评价研究中心(RCCSE)制定的大学、科研机构科研竞争力评价指标体系为基础,结合文献调研,依据科学性、系统性、可比性、可行性、简易性、客观性原则,从科研生产力、科研影响力、科研卓越力、科研合作力4个维度构建科研竞争力评价指标体系(表1)。由于论文和专利是基础研究和技术创新最主要的产出形式,因此本研究创新性地从基础研究和技术创新的角度,将4个维度的指标细化到基础研究生产力、技术创新生产力、基础研究影响力、技术创新影响力、基础研究卓越力、技术创新卓越力、基础研究合作力、技术创新合作力8个二级指标;三级指标囊括论文量、专利量、年均增长率、总被引频次、CNCI值、潜在被引指数、G指数、专利价值度、合作量、合作地区数、合作贡献度等32个指标。
1.2.1.2 综合竞争力测算
数据规范化处理:为了消除量纲不同的影响,本研究采用规范化(极差正规化)的赋值思路对原始数据进行处理。具体公式如下:
正指标:
逆指标:
式中:yi为正规化评价值;xi为第i个指标的原始值;xmax为指标原始数据的最大值;xmin为指标原始数据的最小值。
经过规范化处理之后就得到正规化评价值,所赋分值均在0~1分范围内,且逆指标已完成逆向化处理,符合得分越高则综合竞争力越强的需求,从而可以进一步计算综合指标值得分。
综合竞争力评价模型:综合竞争力的评价结果为各项指标分值与权重乘积的累积之和,本研究采用了简化处理的方式,各指标间的权重无差别,采用算术平均求和的方法,建立综合竞争力评价模型。以下为具体计算方法:
二级指标得分:
一级指標得分:
综合竞争力得分:
式中:Cj为第j个二级指标得分;Dk为第k个三级指标规范化得分;n3为三级指标的个数;Bi为第i个一级指标得分;n2为二级指标的个数;A为综合竞争力得分;n1为一级指标的个数。
1.2.2 科技态势分析方法
1.2.2.1 研究重点挖掘
本研究基于融合基础研究和技术创新的论文与专利合集,开展作者关键词与标题词的分词、抽取、清洗等工作,构建重点主题词集合及共现矩阵,利用共词分析、聚类分析等技术构建主题聚类图,挖掘领域的重点研究方向;并针对重点研究方向开展分级聚类研究,构建重点研究方向的主题聚类图,挖掘各研究方向的重点研究内容。
1.2.2.2 研究前沿识别
本研究通过文献调研,构建基于主题强度、主题新颖度、主题学科交叉度的多维指标研究前沿识别模型,针对不同研究主题多维指标参数以识别领域研究前沿。各指标的计算方法及含义如下。
主题强度:研究主题内所包含的中外文论文与专利文献量总和。
式中:Ts表示主题s的主题强度;n表示主题s内的中外文论文与专利文献总量;Pi表示主题s内的第i篇文献。
主题新颖度:研究主题内所包含的中外文论文与专利文献的平均发表/公开时间。
式中:Ns表示主题s的新颖度;n表示主题s内的中外文论文与专利文献总量;yi表示第i个论文的发表年份或专利的公开年份。
主题学科交叉度:研究主题内所包含的中外文论文与专利文献的平均学科类别数。
式中:ITt为主题t的学科交叉度;n表示t主题内的中外文论文与专利文献总量;Si表示第i篇论文的学科数量。
本研究将主题强度、主题新颖度、主题学科交叉度大于均值的结果分别标记为“主题强度强”“主题新颖度高”“主题学科交叉度高”,3类指标有任意2个指标位于高区间的研究主题均定义为“研究前沿”。
2 长三角地区畜牧兽医领域科技竞争力与态势分析
2.1 选择研究对象
长三角地区是长江三角洲地区的简称,涵盖3省1市(江苏省、浙江省、安徽省、上海市),覆盖有41个地市级行政单位,是我国经济发展活跃、开放程度高、创新能力强的区域,是我国农业发展较为领先的区域,也是我国畜牧兽医学领域发展最悠久的地区之一。本研究以长三角地区畜牧兽医领域作为研究对象,分析比对长三角地区的科技竞争力与研究态势情况,以期为长三角地区畜牧兽医领域的科技创新、管理决策等提供数据参考和情报支撑。
2.2 数据获取与预处理
本研究选择Web of Science、万方、Incopat分别作为外文论文、中文论文和专利文献的数据源,上述3类数据源在数据的可获取性和权威性上均具备优势。首先,根据省市名称、学科、分类号、研究方向、主题词等限定长三角地区畜牧兽医领域,时间范围限定为2016—2020年(“十三五”时期),下载获取中外文论文及专利初始数据集;然后,通过构建数据判断的标准,综合人工和自然语言处理技术筛选相关数据,得到包含4 998篇外文论文、12 379篇中文论文、17 831件专利的最终数据集;最后,利用DDA软件、Excel软件及Python编程工具进行省份、机构的数据清洗及预处理工作。
2.3 科研竞争力分析
2.3.1 科研生产力分析
通过测度3省1市在畜牧兽医领域的科研生产力(表2)发现,从论文来看,江苏省的中外文论文量及高质量中外文论文量均远高于其他省(市),其基础研究生产力最高;另外,各省(市)外文基础研究量均呈现增长趋势,中文基础研究量均呈现减少趋势,其中安徽省的外文基础研究量增长最快,中文基础研究量下降最快。从专利来看,安徽省的专利申请量最高,江苏省和浙江省的专利授权量排在前列,三者的技术创新生产力均较高;另外,各省(市)的年均增长率差距悬殊,仅上海市的技术创新量为增长趋势,其余省(市)的技术创新量为减少趋势,其中上海市增速最快,安徽省下降最快。
2.3.2 科研影响力分析
通过测度3省1市在畜牧兽医领域的科研影响力(表3)发现,从论文来看,江苏省中外文论文的总被引频次均远高于其他省(市),其基础研究总体影响力最高;浙江省和上海市中外文论文的CNCI值均高于0.9且潜在被引指数相对更低,其基础研究质量及潜在影响力更高。从专利来看,安徽省专利的总被引频次远高于其他省(市),其技术创新的总体影响力最高;上海市专利的CNCI值高于其他省(市)且潜在被引指数低于其他省(市),其技术创新质量及潜在影响力更高。
2.3.3 科研卓越力分析
通过测度3省1市在畜牧兽医领域的科研卓越力(表4)发现,从论文来看,江苏省的中外文论文G指数均排在第1位,其基础研究卓越性水平均最高;安徽省的中外文论文G指数均不高,其基础研究卓越性水平相对较低。从专利来看,各省(市)的专利价值度有所差距,其中上海市的专利价值度达到了6.22,其技术创新卓越性水平最高;安徽省的专利价值度为4.47, 其技术创新卓越性水平相对较低。
2.3.4 科研合作力分析
通过测度3省1市在畜牧兽医领域的科研合作力(表5)发现,从论文来看,各省(市)基础研究对外合作广泛且合作贡献度均在较高水平,其合作地区数及合作贡献度差距不大,其中江苏省的中外文论文对外合作量均远高于其他省(市),其基础研究合作量最高。从专利来看,江苏省的专利对外合作量及合作地区数均高于其他省(市),其技术创新合作量最高且合作地区更为广泛;各省(市)的技术创新合作贡献度整体维持在较高水平,其中浙江省的技术创新合作贡献度略低于其他省(市)。
2.3.5 综合科研竞争力分析
通过测度3省1市在畜牧兽医领域的综合科研竞争力(表6)发现,江苏省的综合竞争力最强,其次是上海市、浙江省和安徽省。江苏省的综合竞争力得分排在首位,其生产力、卓越力和合作力得分也高于其他省(市);上海市和浙江省的综合竞争力得分分列2、3位,其中,上海市的影响力得分排在首位,卓越力得分僅次于江苏省,浙江省的生产力得分和影响力得分均排在第2位;安徽省的综合竞争力得分最低,其中在卓越力得分和合作力得分上与其他省(市)差距较大。
2.4 科技态势分析
2.4.1 研究重点挖掘
长三角地区畜牧兽医领域的总体研究分为4个研究方向,分别为生理生化与免疫调控技术、养殖技术与装置研发利用、疾病诊治与防控技术、营养健康调控与饲料制备技术(图2);其中,以论文为代表的基础研究主要聚焦于生理生化与基因调控技术、疾病诊治与防控技术、养殖技术与产业发展等方向;以专利为代表的技术创新主要侧重疾病诊治与防控技术、养殖技术与装置研发利用、营养健康调控与饲料制备技术等方向。
生理生化与免疫调控技术主要研究生物胁迫、非生物胁迫、基因调控、遗传改良、育种技术、免疫调控等对鸡、鸭、鹅、猪、牛、羊等动物生长发育、体内代谢、生理与品质特性的影响及调控作用,以提高畜禽类动物对生物及非生物胁迫的免疫能力,促进畜禽类动物生长发育及产量品质。通过聚类分析,可以分为3个方面内容(图3):(1)代谢及免疫调控技术:主要研究山羊、蚕等动物的细胞凋亡、氧化应激、细胞因子、代谢组学、脂肪酸、抗炎、免疫反应、抗氧化剂、脂质代谢、抗菌等代谢特性,并对多糖、黄酮类化合物、活性氧等对畜禽类动物体内代谢、免疫力的影响及调控技术进行研究。(2)遗传育种及基因改良技术:围绕猪、鸡、鸭、牛等动物,利用基因表达、miRNA、转录组、基因克隆、RNA测序、CRISPR/Cas9、实时荧光定量PCR等技术对其生长、繁殖、抗病、耐逆、免疫等基因进行定位、表达、克隆、分析与调控技术研究;利用SNP分子标记、SSR分子标记、杂交育种等技术开展种质资源的创制、选育,并借助主成分分析、聚类分析等统计学方法开展种质资源的评价、遗传变异、系统发育及遗传多样性研究。(3)生理生化与品质特性:主要研究肉鸡、仔猪、蛋鸡、鹅、奶牛等动物的肉品质、肠道菌群、抗氧化能力、屠宰性能、血清生化指标、蛋品质、抗生素、抗氧化、益生菌、体质量、免疫功能、产蛋性能、消化率、肠道健康等生长表现与生理生化特性,并对温度、饲养密度等非生物胁迫对畜禽类动物生长状况及生理生化特性的影响及调控技术进行研究。
养殖技术与装置研发利用主要研究鸡、鸭、鹅、猪、牛、羊等动物的养殖技术、养殖模式、养殖装置、养殖环境、养殖废弃物处理等,以促进畜禽类动物的生长、发育、产量、品质与经济效益,实现畜禽类动物的生态、环保绿色、高产、高质、高效生产。通过聚类分析,可以分为2个方面内容(图3):(1)养殖及粪污处理技术:主要研究畜禽类动物的孵化、配种、繁育、饲喂、防疫、驱虫等养殖技术,种养结合、规模化养殖、高密度养殖等养殖模式,畜禽粪便等养殖废弃物的处理技术等。(2)养殖装置研发与利用:开展用于畜禽类动物饲喂、居住、清洗、清理、饮水、消毒、搅拌、粉碎、投料、通风、保温等过程的圈舍、食槽、喂料装置、清理装置、机器人、围栏,以及自动化、智能化、一体化等装置、设备、系统的研发及其利用技术,并将物联网、互联网、人工智能等信息技术应用于畜禽业智能装备的研发,以提高畜禽业装备的现代化、智慧化水平。
疾病诊治与防控技术主要围绕畜禽类动物的主要病原及疾病,开展有关病毒检测及免疫工程、致病机理及基因调控、疫病诊断与防控技术等方面的研究,以实现畜禽类动物主要疾病的快速诊断、精准治疗与及时防控,并提高其抗病及免疫能力。通过聚类分析,可以分为3个方面内容(图3):(1)病毒检测及免疫预防:利用实时荧光定量PCR、检测试剂盒、酶联免疫吸附测定、定量逆转录PCR等技术开展猪圆环病毒、猪流行性腹泻病毒、禽流感病毒、新城疫病毒、猪繁殖与呼吸综合征病毒等畜禽类病毒的检测;基于感染病毒的畜禽类动物,开展单克隆抗体、多克隆抗体等的(灭活)疫苗的制备与利用技术研究。(2)致病机制及基因调控:主要开展大肠杆菌、沙门氏菌、猪链球菌、金黄色葡萄球菌、沙门氏菌、副猪嗜血杆菌、鸭疫里默氏杆菌、产气荚膜梭菌等畜禽类动物病原体的分离鉴定、毒性测定、传播特点、致病机制、发病机制等研究;基于序列分析、基因组分析、PCR技术等生物学技术,对耐药基因、毒力基因等进行定位、挖掘、表达与分析研究。(4)疫病诊断与防控技术:主要围绕非洲猪瘟、猪流行性腹泻、大肠杆菌病、猪蓝耳病、鸡球虫病、口蹄疫、呼吸道疾病、伪狂犬病、鸡传染性支气管炎、小鹅瘟等畜禽类动物重大疫病,开展有关临床症状、病因诊断、流行病学、感染与致病机制、疫病防控、药物治疗、药剂研发等方面的研究。
营养健康调控与饲料制备技术主要研究鸡、鸭、鹅、猪、牛、羊等动物的健康与营养调控技术、饲料制备与利用技术,以促进畜禽动物的生长发育,提高其产量和品质。通过聚类分析,可以分为2个方面内容(图3):(1)健康与营养调控技术:研究鸡、鸭、鹅、猪、牛、羊等动物的饲料喂养与营养调控技术,以提高育肥期、哺乳期、妊娠期、产蛋期等各个阶段的成活率、抗病能力、产蛋率、消化能力、产蛋量、肉品质、生长速度等。(2)饲料制备与利用:主要开展配合飼料、复合饲料、发酵饲料、生物饲料、秸秆饲料、蛋白饲料等畜禽类饲料的配方、发酵、制备与利用技术研究;并研究通过施用添加剂、乳酸菌、中药、微生物等技术改善饲料的营养品质。
2.4.2 研究前沿识别
通过测度长三角地区畜牧兽医领域重点主题的前沿性(表7)发现,从主题强度来看,饲料制备与利用技术、健康与营养调控技术的研究热度最高,其次是养殖及粪污处理技术、养殖装置研发及利用、遗传育种及基因改良技术。从主题新颖度来看,致病机理及基因调控的新颖度最高,其次是病毒检测及免疫工程、养殖装置研发及利用、代谢及免疫调控技术。从主题学科交叉度来看,致病机理及基因调控的学科交叉性最强,其次是病毒检测及免疫工程、疫病诊断与防控技术。综合来看,养殖装置研发与利用、病毒检测及免疫预防、致病机制及基因调控是长三角地区畜牧兽医领域的研究前沿。
3 结论
本研究创新性地从基础研究和技术创新2个维度构建包含科研生产力、科研影响力、科研卓越力、科研合作力的科研竞争力评价指标体系,并通过数据规范化处理、构建综合竞争力评价模型,测算综合竞争力指数,以评价科研群体的科研实力;融合基础研究和技术创新的数据集,采用分级聚类技术开展领域研究重点的挖掘,并构建基于主题强度、主题新颖度、主题学科交叉度的多维指标研究前沿识别模型来识别领域研究前沿;以长三角地区畜牧兽医领域进行实证,研究发现,江苏省的综合竞争力最强,其次是上海市、浙江省和安徽省;研究挖掘出生理生化与免疫调控技术等4个研究方向、代谢及免疫调控技术等10项研究内容即是该领域的研究重点,识别出养殖装置研发与利用等3项研究前沿,验证了方法的可行性、科学性与合理性。
本研究的局限性在于仅融合了论文与专利数据,未能结合其他类型数据源,如基金项目、科技文本等,未来将进一步考虑融合更多源的数据进行研究;创新性地采用分级聚类技术开展研究重点的挖掘,但研究结果依赖高频词,未来可利用自然语言处理等信息技术构建主题识别模型,以进一步保证研究重点挖掘的科学性。
参考文献:
[1]余云龙,邱均平,金 钊. 学科领域发展态势分析与可视化研究——以全球同位素徑流分割为例[J]. 情报科学,2022,40(5):144-153.
[2]邱均平,赵蓉英,马瑞敏,等. 世界一流大学及学科竞争力评价的意义、理念与实践[J]. 科技进步与对策,2007,24(5):138-142.
[3]刘 勇. 高校科研竞争力评价指标体系构建及实证分析[J]. 大学图书情报学刊,2017,35(2):82-89.
[4]罗星华. 基于RCCSE评价指标和科研评价工具的高校科研竞争力分析——以工信部直属七所高校为例[J]. 情报探索,2020(12):65-71.
[5]俞立平,张晓东. 基于熵权TOPSIS的地区高校科技竞争力评价研究[J]. 情报杂志,2013,32(11):181-186.
[6]刘 宇,方 曙,杨志萍,等. 面向技术领域的科研机构竞争力评价模型研究与实践[J]. 情报理论与实践,2018,41(10):105-110.
[7]丁敬达,邱均平. 科研评价指标体系优化方法研究——以中国高校科技创新竞争力评价为例[J]. 科研管理,2010,31(4):111-118.
[8]张超星. 学科领域发展态势分析:五维分析法[J]. 情报学报,2020,39(11):1204-1213.
[9]周 鑫,陈媛媛. 关键词词频变化视角下学科研究发展趋势分析——以国内情报学研究为例[J]. 情报杂志,2016,35(5):133-140,112.
[10]关 鹏,王曰芬,傅 柱. 不同语料下基于LDA主题模型的科学文献主题抽取效果分析[J]. 图书情报工作,2016,60(2):112-121.
[11]Mustafee N,Katsaliaki K,Fishwick P. Exploring the modelling and simulation knowledge base through journal co-citation analysis[J]. Scientometrics,2014,98(3):2145-2159.
[12]Shibata N,Kajikawa Y,Takeda Y,et al. Detecting emerging research fronts based on topological measures in citation networks of scientific publications[J].Technovation,2008,28(11):758-775.
[13]郑彦宁,许晓阳,刘志辉. 基于关键词共现的研究前沿识别方法研究[J].图书情报工作,2016,60(4):85-92.
[14]白如江,刘博文,冷伏海. 基于多维指标的未来新兴科学研究前沿识别研究[J].情报学报,2020,39(7):747-760.
[15]陈 稳,陈 伟. 科学与技术对比视角下的前沿主题识别与演化分析[J].情报杂志,2022,41(1):67-73,163.
[16]林 巧,孔令博,聂迎利,等. 京津冀地区农业核心科研机构竞争力分析[J].农业工程,2021,11(9):97-102.
[17]齐 帆,陈进红. 基于文献计量学的长三角地区农业基础研究能力分析[J].浙江农业科学,2020,61(6):1208-1213.[HJ2mm]
[18]袁 雪,刘敏娟,王 婷,等.农业科研机构作物学科科技竞争力评价研究[J].科技管理研究,2016,36(5):57-60.
[19]任 妮,陆学文,虞德容,等. 基于SCI论文产出的江、浙、沪、鲁4省市农科院科研竞争力评价研究[J].农业图书情报学刊,2016,28(3):70-76.
[20]郑美玉. 基于Innography的农林类高校专利竞争力研究[J].图书情报工作,2018,62(1):117-124.
[21]于 奇,王艳丽,贾裕娇. 基于InCites和CNKI数据库的我国10所高校园艺学学科文献计量分析[J].江苏科技信息,2019,36(26):7-12.
[22]梁晓贺,黄 政,孙 巍. 学科领域竞争力分析方法研究——以动物资源与育种领域为例[J].数字图书馆论坛,2015(12):21-28.
[23]孙铭阳,徐世强,张闻婷,等. 国内外穿心莲研究态势分析[J].中国农学通报,2022,38(34):155-164.
[24]杨兰伟,许皓月,吕军海. 基于文献计量的板栗研究态势分析[J].河北农业科学,2020,24(5):97-100.
[25]赵艳侠,张久慧,亓桂梅. 基于CNKI文献分析我国葡萄研究发展态势[J].农业科学研究,2017,38(4):56-61.
[26]陈 雪,袁紫仪,林湘岷,等. 基于Web of Science文献计量的我国节水农业研究态势分析[J].中国农业大学学报,2022,27(8):198-207.
[27]熊 晶,陈晓炜,谭康铭,等. 基于文献计量的我国循环农业研究态势分析[J].西南师范大学学报(自然科学版),2020,45(8):58-66.
[28]李灯华,许世卫,李干琼. 农业信息技术研究态势可视化分析[J].农业展望,2022,18(2):73-86.
[29]郭 婷,任 妮,贵淑婷,等.基于气候变化的作物模型研究态势分析[J].江苏农业科学,2017,45(24):17-25.
[30]吴磊琦,谌 凯,吴巧玲. 基于专利文献的移栽机械发展态势分析[J].江苏农业科学,2018,46(22):7-13.
[31]颜志辉,郑怀国,赵静娟,等. 基于SCI论文的作物转基因育种领域发展态势分析[J].中国农业科技导报,2016,18(2):208-215.