基于学位论文的水产学学科相关性分析及学科体系构建研究

2020-03-11 06:38张红林程锦祥欧阳海鹰
渔业信息与战略 2020年1期

张红林,程锦祥,曹 淼,欧阳海鹰*

(1.中国水产科学研究院长江水产研究所,湖北武汉 430223; 2. 中国水产科学研究院,北京 100141)

学科体系在科学研究、高等教育、科学评价以及信息资源管理中具有重要作用。目前国内常见的学科体系有四大类别:一是主要用于类分文献资料、编制目录、建立数据库和进行文献检索的《中国图书馆分类法》体系[1];二是作为招生和授予学位的学科、专业范围划分依据的《授予博士、硕士学位和培养研究生的学科、专业目录》[2-3];三是主要用于科技统计、学科建设和产业统计的《学科分类与代码》(GB/T 13745-2009)[4];四是各科研院所用于梳理研究内容、明确学科方向和区分人才专长的知识体系,例如中国水产科学研究院十大学科体系[5]。在水产学的科研工作中,科研人员常发现自己所做的工作无法用中图分类号或学科代码准确标识,也无法在本学科既定的知识体系中找到准确的定位。例如,关于鱼类遗传育种、鱼类生态环境、水产品质量安全等方面的研究工作,其研究内容在《中国图书馆分类法》等体系中无法准确体现;而关于鱼类生理学、行为学、渔文化等方面的研究内容在中国水产科学研究院既定的十大学科体系中也无法准确归纳。因此,在学科建设与学术评价中,始终存在建立、健全学科体系的需要。

在中国工程知识中心渔业知识分中心建设过程中,为集全、集准中文期刊论文、学位论文、会议论文3类水产学文献数据,课题组针对中国知网(China National Knowledge Infrastructure,CNKI)和万方数据2个文献资源库设计了多种检索策略,获取了3类资源完整的元数据集,经检验,检全率与检准率均超过90%[6]。学位论文是3类文献资源中数量最少,但元数据信息最齐全、标引最准确的一类文献,而且其与成果产出机构在研课题的联系最为紧密,比较全面地反映了水产学科的主题内容和研究热点。因此,通过对学位论文进行系统的统计分析,可以更好地了解水产学学科的知识体系结构。

在获取完整的元数据基础上,课题组对采集到的学位论文按中国水产科学研究院十大学科[5]进行了标引和分类,对各学科的主题概念进行了归纳,提出了十大学科的二级类目建议,丰富和完善了水产学学科体系的内容。本研究采用的图书情报学方法,可应用于其他学科及其子学科的学科体系分析与构建。

1 材料与方法

1.1 水产学学位论文的定义

传统上水产学是以渔业资源、水产养殖和捕捞为研究对象的学科,在《中国图书馆分类法》[1]中将水产学划分为水产基础科学、水产资源、水产保护学、水产工程、水产养殖技术等8类,而将渔业经济、渔业生态环境、水产品贮藏与加工仅作为交叉学科列入其他类。近年来,关于水产动物遗传育种、水产品质量安全的研究已非常普遍,有些研究如休闲渔业和渔文化甚至已经超出了传统水产学定义的范畴。唐启升[7]认为,渔业产业方式包括捕捞、养殖、增殖、加工流通、休闲服务以及装备制造等,产业对象为水生动物、植物及微生物,渔业应定义为对水生生物资源进行开发利用及其相关经济和科技活动的产业。因此,本文的水产学学位论文泛指以渔业、水产品和水产生物为研究对象的各类博士论文和硕士论文。

1.2 水产学学位论文的检索

在CNKI、万方数据的学位论文库中,只有中图分类号、学科专业两种途径适用于对学位论文的全面检索,但两者都不能概括完全。在研究过程中经反复试验,确定了在CNKI库中以中图分类号检索为主、部分结合主题检索的策略,在万方数据库中以学科检索为主、部分结合专业检索的策略。

(1)CNKI库中的水产学学位论文检索策略

检全水产学学位论文的检索策略设定如下:

(CLC=S9?-TS9?+D922.65+F307.4+F316.4+F326.4+Q17?-TQ17?+Q959.4?+TQ914.2+TS225.24+TS254?+TS295.4+U674.4?+X503.225+X714) OR (CLC=X52? AND SU=养殖) OR SU=水产+渔业+鱼类+海产品

用此式检索到2006—2015年学位论文14 500篇。

(2)万方库中的水产学学位论文检索策略

检全水产学学位论文的检索策略设定如下:

学科:(水产、渔业)+专业:水产品加工及贮藏工程+((学科:(水体污染及其防治+海洋污染及其防治))*主题:养殖)+主题:(渔业+水产+鱼类+海产品)

用此式检索到2006—2015年学位论文20 927篇。

1.3 检索结果的筛选与元数据字段的提取

按2个检索式分别下载2006—2015年元数据,合并去重,再人工结合机器筛选(主要通过专业、分类号、题名判别),剔除明显不相关论文,得到水产学学位论文完整记录18 091条(其中含博士论文记录2 968条,硕士论文记录15 123条),作为课题研究的基础素材。研究中用于统计、分析和标引的字段主要有题名、关键词、中图分类号、学位专业、毕业时间等5个字段。

2 结果与分析

2.1 水产学学位论文的学科分布

2.1.1 按中图分类号的类目分布

作者或文献收录机构根据《中国图书馆分类法》标注的代码,每个代码都有对应的学科类目,分别将博士、硕士论文记录按中图分类号二级类目分类统计,得出2006—2015年水产学学位论文分布的学科类目情况,结果见图1。

图1列出了水产学学位论文数量排名靠前的13个学科类目,这些类目所包含的学位论文数占学位论文总数的90.2%,可被认为是水产学的重点学科或交叉学科。相比较而言,传统学科中的水产资源、捕捞学论文占比不高,而非传统学科水产加工工业、渔业经济的内容相对较多,尤其是水产生物学论文占比遥遥领先。

2.1.2 按学位专业分布

来源于《授予博士、硕士学位和培养研究生的学科、专业目录》,由作者或招生单位标注分别将博士、硕士论文记录按学位专业分类统计,得出2006—2015年学位论文的专业分布情况,结果见图2。

样本数据统计显示,水产学学位论文产出涉及400多个专业(含衍生专业),学位论文的专业分布非常广。图2列出了学位论文分布排名靠前的11个专业名称,这些专业所包含的学位论文数占学位论文总数的70.3%。图2显示,海洋生物学、水生生物学、分子生物学这3个生物类专业与水产学密切相关,环境科学专业与水产学交叉较深。此外,产出学位论文数在100~200篇的还有兽医学、微生物学、产业经济学等专业。

2.2 学位论文的学科标引

为了对水产学学位论文所属的学科进行准确识别,进一步研究不同学科的主题内容,课题组针对检出论文定制了从中图分类号转换到中国水产科学研究院十大学科[5]的对应关系,从而进行了论文的学科属性标引。标引规则的设定及标引论文数见表1。

通过学科标引,将全部水产学学位论文划分到十大学科进行分析研究,以便分析和了解各学科的论文产出量及主要研究内容。表1显示,2006—2015年,关于水产生物技术(水产生物学)、水产养殖技术、生态环境评价与保护、水产品加工等方面的论文产出量相对较多,而在渔业资源保护利用、水产遗传育种、水产品质量安全、渔业装备与工程技术等方面的论文产出量相对较少。

2.3 学科高频关键词分析与主题概括

对表1中标引的论文按学科逐个统计分类号词频和关键词词频,分析高频分类号和典型高频关键词的学科属性,并归纳其主题概念,提出二级类目建议(见表2)。

由于关键词数量太多,表2不能将高频词一一列举,一般只选择了语义独立、具有学科属性、能直观体现主题概念的4~6个关键词。实践上,大多数关键词学科属性不是唯一的,论文分类或标引时,还需要分析题名中的名词组配关系。二级类目建议是本研究的重要结果,高频词学科属性归纳、类目编制与命名还参考了《渔业叙词表》(编制中)《农业大百科全书—渔业卷》(未出版)等。

表2中,在对水产生物技术类主题分析时,发现本类掺杂了较多水产动物组织学、生物化学、分子生物学的内容,而且许多论文属基础研究,应用目的不明确,暂时难以归属到其他学科。另外,还有一些关于渔业政策、管理、渔文化、休闲渔业等方面的论文实际上也不属于渔业信息与经济范畴。

2.4 论文标引检验

利用所设定的二级类目对2015年2 146篇渔业相关学位论文进行人工标引,借以检验二级类目的完整性与准确性,结果(表2第4列)表明,2 106篇论文可以准确归入所设类目,仅40篇论文因与渔业相关性不强难以归纳,标引成功率98.14%,说明所设二级类目具有较强的科学性和实践意义。

表1 标引规则的设定及标引论文数Tab.1 Setting of indexing rules and number of indexing papers

表2 十大学科论文主题分析及二级类目建议Tab.2 Topic analysis of dissertations of ten disciplines and suggestions for secondary categories

·续 表·

注:表中标注“*”的类目可以考虑归并到其他类

Note: The categories marked with "*" in the table can be considered to be merged into other classes

3 讨论

国内关于学科体系建设的理论探讨非常之多,在农业相关领域,可见若干篇关于动物遗传育种[8]、农业经济[9-10]、林业经济[11]等分支学科的研究报道,在水产学相关领域,也有几篇关于渔药[12]、水产品质量安全[13]、渔业经济[14]等分支学科体系的研究报道,其研究或基于科研或基于教学需要,且局限在某个分支学科内。用文献计量学的方法全面剖析某个学科的体系结构的研究尚未见到。从文献分布特征看,现代水产学与生物学、环境科学、食品科学、经济学、管理学等学科交叉融合形成了许多新的研究领域,这也就形成了新的学科体系基础。

水产学十大学科体系是中国水产科学研究院学术委员会基于科研计划与管理的需要提出的划分体系,在国内水产界被广泛接受,但每个学科应包含哪些分支学科或研究内容,虽有一般性定义但未形成严格的标准,实践应用时往往发现概括不准或不全。例如,水产生物学是水产学论文产出量最高的一类,《中国图书馆分类法》仅列了一个水产基础科学,把大量的水产生物学文献模糊聚集在一起,未起到分门别类的作用。由于在十大学科体系中未设置水产基础科学类,本研究在二级类目设置时,暂且考虑将水产生物的细胞学、遗传学、生理学分别归入生物技术、遗传育种、养殖技术等类目,避免了模糊分类。另外,生物技术与遗传育种常常是密不可分的,甚至已经是现代遗传育种的主要技术手段[15],在十大学科体系中,将生物技术与遗传育种单列,也造成许多文献归类的混乱,这也是需要构建二级类目并准确定义的原因之一。如果水产生物技术设置为一级类目,必须有更准确的子类目定义,并使之与水产遗传育种严格区别。此外,在十大学科体系中,将关于渔业的社会科学简列为渔业信息与经济,该名称在概括渔业综论、渔业管理、休闲渔业、渔文化等内容上显得不够准确。在2019年编制的《农业大百科全书—渔业卷》(未出版)书目中,一级条目设置了15条,其中包括了渔业综论、渔业捕捞、渔业经济与管理、饲料营养等条目,但生物技术未列入一级条目,仅将水产育种生物技术列为二级条目,信息管理也只列为二级条目。

本研究构建了较为完善的水产学十大学科二级类目体系,该体系基于水产学科研活动,理论上具有更方便水产学科研工作的划分与定位、更方便本学科文献信息与数据信息的系统管理的作用,相对于《中国图书馆分类法》S9类的设置更有针对性。本研究关键词源自学位论文,其代表性不如期刊论文关键词全面,可能有一些关于生产活动的内容被忽略。因此,关于二级类目概括是否准确、类目代表性是否完整等问题,还需要在今后的实践中不断检验和改进,希望本研究的结果有助于水产学学科研究体系标准的制定。

致谢:中国水产科学研究院长江水产研究所汪登强、范玉顶、茹辉军、岳华梅四位博士在本研究的主题分析与类目设置过程中做了大量工作,中国水产科学研究院南海水产研究所周李梅助理研究员在本文写作中提出了很好的修改意见,特此致谢。