葛慧丽张培锋苏 成程薛柯
(1.浙江省科技信息研究院, 浙江杭州 310006;2.中国科学技术信息研究所,北京 100038)
浙江省肿瘤领域基金资助项目分析研究
葛慧丽1张培锋1苏 成2程薛柯2
(1.浙江省科技信息研究院, 浙江杭州 310006;2.中国科学技术信息研究所,北京 100038)
文摘:本文采集浙江省科技报告共享服务系统、国家科技报告共享服务系统以及中文科学论文、Web of Science数据库中的外文科学论文等肿瘤领域数据,进行可视化分析研究,比较分析近年来浙江省肿瘤领域基金资助研究情况,探究浙江省肿瘤领域基金资助对科技成果产出的贡献,分析浙江肿瘤领域研究与国家及世界肿瘤研究的关联情况,为科技报告资源增殖服务的开展以及基金资助对学科研究的支持和推动情况探索思路。
浙江省;肿瘤;基金资助;科技报告;内容分析
科技报告是科研人员在科研活动的各个阶段,按照有关规定和格式撰写,能完整而真实地反映科学和技术研究结果或研究进展的记录,是科技知识的宝库和源泉,是一种稳定、雄厚的国家战略资源,也是政府部门进行科研项目测评的主要内容和依据。我国科技报告制度建设自2013年启动,已有5.5万份国家项目科技报告实现公开共享。浙江省科技报告制度自2014年10月开始建立,“十二五”期间已完成项目及2014年10月后新验收项目的可公开科技报告,均通过共享服务系统提供检索与全文浏览服务[1-2]。
本文以肿瘤领域为例,采集浙江省科技报告共享服务系统、国家科技报告共享服务系统以及中文科学论文、Web of Science数据库中的外文科学论文相关领域数据,进行可视化分析研究,以期全面了解近年来浙江省肿瘤领域基金资助研究及其与国家及世界肿瘤研究的关联情况,从而为科技报告资源增殖服务的开展、基金资助对学科研究的支持和推动情况探索思路。
科技报告和科学论文具有较强的互补性。科学论文对内容的独创性有着严格要求,需要经过专家评议,同时其内容和篇幅受刊物版面限制,只有部分重要的研究成果能够公开发表。科技报告无需经过专家严格评议,不受篇幅限制,可以翔实记载科研工作的整个过程、方法、结果等[3]。但因我国的科技报告资源建设工作尚处在起步阶段,报告内容质量的控制还在不断完善之中,因此,从基金资助项目科技报告和科学论文两方面入手进行数据的可视化分析就更为全面和系统。
1.1 基金资助项目科技报告
本文的基金资助项目科技报告数据来源于浙江省科技报告共享服务系统及国家科技报告共享服务系统。检索步骤为:(1)在关键词、题名和摘要中抽取包括“癌 or 肿瘤”的报告;(2)对得到的数据进行人工判读,删除明显不属于肿瘤领域的报告。经筛选后得到浙江基金资助项目科技报告264份,国家科技计划资助项目科技报告1344份。
科技报告数据分析主要包括两部分:著录项分析和文本内容分析。著录项分析主要包括支持渠道、编制机构、合作单位等字段,文本内容分析主要涉及报告标题、关键词、摘要等字段。为保证原始数据的统一规范,在数据分析之前对中文分词以及字符进行全半角转换,对英文逗号、中文逗号、英文分号、中文分号、英文点等关键词分隔符进行规范处理,对编制机构进行简单规范,如将“浙江大学医学院”归属到“浙江大学”等。
1.2 科学论文
本文所涉及的外文科学论文以国际上权威的科学文献数据库《科学引文索引扩展版》(SCIExpanded)为数据源,中文科学论文以中国知网中文期刊全文数据库为数据源。采集2005-2014年发表的相关论文数据,共检出外文论文467785篇,中文论文442995篇。
将采集获得的科学论文数据通过自编程序导入数据库。在统计分析之前完成筛查、校正、合并等规范处理,避免出现同一国家、机构以及人名等存在多种写法甚至错误写法,不同年份、SCI缩写标准不一致等情况。
本文主要采用文献计量法、文献调研法、数据可视化分析等方法进行研究。采用文献计量学方法体系中的词频分析方法,对反映文献核心内容的关键词出现频次进行统计;采用自编程序对相关著录项、词频等进行统计分析并生成合作网络;利用Gephi等可视化工具,对肿瘤领域浙江基金资助项目科技报告、国家科技计划科技报告和国内外科学论文进行分析研究。
浙江基金资助的肿瘤领域项目共产生科技报告264份(表1)。从资助项目的支持渠道看,浙江省自然科学基金资助产生最多,为194份,占73.5%。而在自然科学基金资助项目中,面上项目占比最高,达74.2%;其次为青年项目,占18%。排名第二的是浙江省公益技术应用研究项目,共产生报告44份,占比16.7%。
本文采集了2009-2014年浙江基金资助项目产出的肿瘤学领域中文科学论文共716篇,由浙江省自然科学基金资助完成的中文科学论文为444篇,其中核心期刊226篇;浙江省重大科技专项、公益技术应用研究项目、创新人才培养引进项目等资助完成的中文科学论文328篇(其中56篇为与浙江省自然科学基金共同资助完成),其中核心期刊121篇。浙江基金资助项目为科技论文成果的产出起到很大的支持作用。
浙江基金资助项目科技报告的编制机构(即项目承担单位)中,高校占70.45%,医院占24.24%,研究机构占4.17%,企业占1.14%(表2)。
编制机构产出报告超出5份(包括5份)的单位共10家。其中,浙江大学遥遥领先,共106份,占比高达40.2%;排名第二的是温州医科大学,共23份,占比8.7%;位列第三的是浙江省肿瘤医院,共16份,占比6.1%。除浙江省肿瘤医院外,绍兴市人民医院和浙江省人民医院均进入前10(表3)。
国家科技报告系统中,肿瘤领域报告数量排名前20的单位主要分布在北京、上海。其中,北京大学以63份排名第一位;紧随其后的是中国科学院上海生命科学研究院,共60份;第3、第4名是复旦大学、上海交通大学,分别产出报告52份和43份;浙江大学位居第五,产出报告42份,是浙江省唯一跻身全国前20的单位(表4)。而浙江省内其他机构的报告产出量与浙江大学相去甚远,除杭州师范大学产出2份外,其他均仅有1份。值得关注的是,浙江海正药业股份有限公司和浙江医药股份有限公司两家医药公司也分别产出了1份国家项目的科技报告(表5)。
表1 浙江省肿瘤领域科技报告支持渠道分布
表2 浙江省肿瘤领域科技报告编制机构类型(浙江省科技报告系统)
表3 浙江省肿瘤领域资助项目完成单位产出科技报告数量情况(浙江科技报告系统)
比较表3和表4可见,在国家科技报告系统中,排名前20的编制机构均为大学和科研院所,而在浙江省科技报告系统中,排名前10的编制机构中,医院占30%,是产出报告不可或缺的主力军,这可能与浙江省肿瘤领域基金资助偏重临床应用有关。从表3和表5可见,浙江大学、杭州师范大学和浙江理工大学同时承担了肿瘤领域国家级项目和省级项目,充分显示了浙江高校的科研实力,而以海正药业、浙江医药为代表的浙江医药企业表现出较强的技术创新能力和产品研发能力。
从地域角度可以把合作研究分为省内合作、省际合作和国际合作。总体来说,在浙江基金资助项目中,独立完成的占主导地位,共227份,占比86.0%;合作完成的共37份,占比14.0%。其中,省内合作27份,占比10.2%;省际合作7份,占比2.7%;国际合作3份,占比1.1%(表6)。
从机构类型角度可以发现,合作研究项目以高校+医院、高校+高校和高校+研究机构等方式居多。高校+医院共产生报告11份,占比29.7%;高校+高校8份,占比21.6%;高校+研究机构5份,占比13.5%(图1)。
根据机构间合作关系,利用自编程序生成合作网络矩阵。利用Gephi生成图2。其中,字体大小反映机构合作强度,连线表示合作关系。从图2可以看出,浙江省肿瘤领域研究主要有两大核心集团:一是以浙江大学为核心,主要采用高校+医院模式进行合作研究;二是以浙江省肿瘤医院为核心,主要采用医院+公司+高校模式进行合作研究。
表4 肿瘤领域报告数量排名前20的编制单位(国家科技报告系统)
表5 浙江省肿瘤领域科技报告编制机构分布情况(国家科技报告系统)
关键词是文献核心内容的浓缩和提炼,如果某一关键词在其研究领域中反复出现,说明该主题是该领域的研究热点。对肿瘤领域文献的关键词出现频率进行排序,可大致反映出肿瘤领域在这一时期内的主要研究范围和关注重点[4-6]。
4.1 科技报告关键词词频
表7给出了浙江省科技报告系统中频次超过5次的关键词。除“抗肿瘤”、“肿瘤” 两个关键词分别位列第2位和第6位外,其他出现频次较高的关键词主要分为3种类型,一是表征肿瘤类型的,如胃癌、肺癌、肝癌、卵巢癌、前列腺癌、非小细胞肺癌、大肠癌、胰腺癌等;二是表征肿瘤诊断治疗的,如转移、预后、耐药、化疗耐药、基因治疗等;三是表征肿瘤基础研究的,如凋亡、抗肿瘤活性、自噬、增殖等[7]。
据报道,浙江肿瘤发病排名第1位的是肺癌,其次为结直肠癌、胃癌、甲状腺癌和肝癌[8]。从表7可以看出,这些多发肿瘤在高频关键词排名中大多处于较前的位置,说明浙江基金资助项目与社会的现实需求有着密切的正向相关关系。
表8是国家科技报告服务系统中词频较高的关键词。与浙江省科技报告系统相似,“肿瘤”、“抗肿瘤”两个关键词依然成为高频词,高居第一、第二位。同时,肝癌、肺癌、乳腺癌、胃癌、白血病等多发癌症,肿瘤干细胞、纳米材料、基因治疗、靶向治疗等新型治疗技术研究受到科研工作者重点关注。在基础研究方面,则较多关注肿瘤微环境、蛋白质组学、临床前研究、肿瘤标志物等。
对比表7与表8发现,浙江肿瘤领域基金资助与国家科技计划项目资助都较关注我国多发癌症的研究。在治疗方法上都较为注重基因治疗等最新治疗方法的研究,在基础理论方面,都较为关注细胞凋亡方面的研究。
表6 合作类型分布情况(地域角度)
图1 合作类型分布情况(机构类型角度)
图2 机构合作网络图
表7 高频关键词(浙江省科技报告系统)
4.2 科学论文关键词词频
利用采集自中文期刊数据库和SCI-Expanded数据库的肿瘤领域相关论文,对其关键词进行词频分析。从使用频次最多的20个主要关键词大致可以看出,肿瘤领域近期研究的热点方向是乳腺癌、肺癌尤其是非小细胞肺癌、结直肠癌、前列腺癌、胃癌、肝癌等癌症,较常出现的医学技术方法有化学治疗、放射治疗及荟萃分析等,而诊疗、预后、存活率、肿瘤转移相关的生物学标记和微小核糖核酸等与检验相关的研究也颇受关注(表9、表10)。
根据表7、表8、表9和表10形成图3,以点阵展示同一关键词在浙江科技报告系统、国家科技报告系统、SCI科学论文及中文科学论文中的频次情况,乳腺癌、细胞凋亡、肺癌、胃癌、肿瘤为共同高频关键词;浙江科技报告系统中的预后、非小细胞肺癌、卵巢癌、结直肠癌、前列腺癌、肝癌等高频关键词与SCI科学论文高频关键词重合,表明浙江与国际肿瘤领域研究热点的吻合度非常高。
目前,科技报告主要来源于政府资助的科研项目,是政府科技投入的重要产出。经过前期的研究,国家颁布了推荐标准,对科技报告撰写、元数据规范等作了规范,通过对科技报告的各项元数据--支持渠道、编制单位、合作单位、关键词等进行归类和分析,已经为动态监测科技项目的实施、研究力量的分布和培育、科技发展最新进展、领域研究热点的转换提供了一定基础数据[9-10]。但总的来说,由于我国科技报告制度建设实施时间不长,尤其是地方层面,制度实施尚未完善。浙江省科技报告资源建设工作开展仅2年,科技报告资源的积累、数据格式的规范、报告内容质量的控制等各项研究工作还在探索之中。因此,本文对浙江省基金资助项目的分析研究尚有许多待深入之处。相信随着科技报告元数据规范、报告内容质量评价控制等方面的加强,数据源质量将进一步提高,科技报告资源的挖掘利用价值也会进一步提高。
表8 前20高频关键词(国家科技报告服务系统)
表9 前20高频关键词(SCI论文)
表10 前20高频关键词(中文期刊论文)
5.1 浙江肿瘤领域科研力量集聚度高
从地域上看,浙江肿瘤领域科研力量主要集聚在杭州,这与杭州汇聚了浙江大学、浙江中医药大学、杭州师范大学等知名高等学府以及浙江省肿瘤医院、浙江省人民医院等省级医疗机构有较大关系。
从科技报告编制机构上看,浙江大学承担了全省40%的肿瘤领域科研项目,是该领域研究的绝对主力。一方面体现了浙江大学卓然超群的研究实力,另一方面也与科技报告的编制规范有关。根据科技报告的编制规则,报告编制单位应为项目的承担单位,而在科技项目管理中,项目承担单位均为具有科研管理职能的一级单位。浙江大学下属的数家附属医院科研项目均归口浙江大学统一管理,因此在编制科技报告时均显示为浙江大学。
除浙江大学外,温州医科大学也是浙江肿瘤领域一支重要的研究力量。作为浙江省政府、国家卫生和计划生育委员会与教育部共建高校,温州医科大学科研实力不断增强。近年来承担省部级以上科研项目1530余项,在省内医学研究领域的优势引领作用显著提升。
5.2 机构间合作研究需加强
浙江机构间的合作情况不理想,以独立完成为主要研究形式,这说明浙江协作科研规模较小,研究领域间的互动、交融还有待提高,协同合作有很大的发展空间。而在合作研究过程中,由于地缘因素的影响,同一地域或邻近地域不同机构间的合作相对较为频繁。从图2可见,以浙江大学、浙江省肿瘤医院为核心的两大研究主体,其合作地域主要限于杭州、湖州、绍兴等省内地区以及浙江的近邻上海。
图3 高频关键词重合图
表11 中国发表SCI论文量前20机构
从合作机构的类型看,高校、医院、科研机构间的合作较为紧密,医药领域的公司参与较少,医院间的合作深度也有待提高。图2提示我们,应加强不同机构、不同地区以及与国外肿瘤领域相关机构的交流与合作,促进医疗科研事业的健康、持续发展。
据对SCI-Expanded数据库肿瘤领域相关期刊统计,作为浙江肿瘤领域研究领军团队的浙江大学,在国内机构SCI论文发表量排名中位列第七,排名第1-6位的分别是复旦大学、中国医学科学院、中国医科大学、中山大学、上海交通大学和北京大学。这些机构同时也承担了多项国家科技计划项目(表11),代表了国内肿瘤领域研究的最高水平,引领着我国肿瘤学研究的快速发展,浙江可增强与这些高校院所的项目合作研究和技术联合攻关。
5.3 浙江肿瘤领域研究方向走在国际前沿
从关键词词频分析可以发现,浙江省科技报告、中国科技报告的研究热点与世界论文的热点大多重合。在病种研究方面,浙江省研究的与我国乃至世界研究的基本一致。我国增加了食道癌和白血病研究热点,而全球论文研究热点增加了宫颈癌研究。在治疗研究方面,浙江省乃至全国多侧重于研究传统化疗和放疗之外的基因治疗、靶向治疗、干细胞治疗、纳米材料技术和抗癌新药等,而全球的治疗手段仍倾向传统的化放疗,并关注荟萃分析。在基础研究方面,浙江省与全国乃至世界一样,都关注肿瘤标志物研究。但我国还关注肿瘤微环境的研究,如空气颗粒物和健康风险/环境交互作用、蛋白质组学、代谢组学和细胞自噬/信号转导等;世界其他国家还关注微小核糖核酸的研究。
[1] 张培锋,葛慧丽,张玮,等.浙江省科技报告制度建设的实践与探索[J].中国科技资源导刊, 2016(1): 26-31.
[2] 张玮,张培锋,徐锦英,等.限制级科技报告延期公开现状及问题探讨[J].中国科技资源导刊, 2016(1):67-71,87.
[3] 科技报告知识问答[EB/OL]. [2016-06-09]. http:// www.nstrs.cn/admin/Content/ArtileDetails.aspx?arid= 4624&type=3.
[4] 郑彦宁,许晓阳,刘志辉.基于关键词共现的研究前沿识别方法研究[J].图书情报工作, 2016(4):85-92.
[5] 朱丹浩,王东波,华康.国家社科基金哲学领域项目成果及热点分析:以1991-2015年所立项目及论文成果为研究对象[J].西南民族大学学报(人文社会科学版),2016(5):235-240.
[6] 李佳.1998-2007年我国肿瘤治疗研究的主题分析[J].医学信息,2009(1):57-61.
[7] 程薛柯,苏成.基于共词分析的世界肿瘤学研究主题演化分析[J].国际肿瘤学杂志, 2015(10):795-800.
[8] 杨威, 陈浩鼎.浙江“癌情”公布肺癌发病率仍居第一[EB/OL]. [2016-06-09]. http://zjnews.zjol.com.cn/ system/2016/04/15/ 021112443.shtml.
[9] 苑世芬.国家科技报告制度与高校开放获取政策的整合策略[J].图书馆学研究,2015(24):32-36.
[10] 杨小芳,周杰.从知识管理角度看科技报告资源建设[J].中国科技资源导刊, 2015(6):74-81.
Analytical Research on the Fund Aid Projects for Tumor Field in Zhejiang Province
GE Huili1, ZHANG Peifeng1, SU Cheng2, CHENG Xueke2
(1. Institute of Scientific and Technical Information of Zhejiang Province, Hangzhou 310006; 2. Institute of Scientific and Technical Information of China, Beijing 100038)
Based on the tumor field, this research collected the data in Zhejiang Science and Technology Report Service System, National Science and Technology Report Service System, Chinese Scientific Papers, Chinese and Foreign Scientific Papers in the Web of Science Database to carry out visualized and analytical study.Through the comparison and contrast on the researches of funded projects for tumor filed in Zhejiang province, this research studied the contributions made by the funded projects for tumor field in Zhejiang province and analyzed the relationship among researches on tumor field in Zhejiang, the whole country and the world, which could explore ideas for value-added service of scientific reports resources and for the support to the subject research from the funded projects.
Zhejiang province, tumors, funded project, scientific reports, content analysis
G322.7
A
10.3772/j.issn.1674-1544.2016.04.016
葛慧丽*(1969-),女,浙江省科技信息研究院研究馆员,研究方向:科技信息资源利用与科技决策服务;张培锋(1973-),女,浙江省科技信息研究院副研究馆员,研究方向:科技文献利用与科技决策服务;苏成(1973-),男,中国科学技术信息研究所副研究员,博士,研究方向:科学计量学与科技评价;程薛柯(1990-),男,中国科学技术信息研究所硕士研究生,研究方向:科学计量学。
浙江省自然科学基金“融合科学计量的科学基金资助评价模型构建与实证研究”(Y14G030063)。
2016年6月29日。