于文超/Yu Wenchao
研究生学位论文是高等院校研究生为获得学位而撰写的研究性文章,是检验研究生学术水平的重要依据和获得学位的必要环节,也体现一个高校的研究水平。[1]研究生学位论文作为学校的“原生”资源,往往能反映一个学校学科、专业的学术动态、研究成果及学术思想等,具有较高的学术价值。在当今网络数字时代,如果采用传统的纸质文献方式收藏学位论文,借阅检索不便,导致研究生毕业论文的利用率较低。而中国期刊全文数据库(CNKI)作为商业性数据库,只收录一小部分研究生的毕业论文,无法满足读者的查询需求。因此,为充分发挥研究生学位论文的学术价值,提高研究生学位论文利用率,进而帮助读者借助论文数据库平台了解和学习前人的研究方向、学术成果、学术思想等,各高校都把建设自己的学位论文库作为必要项目。笔者以天津美术学院研究生学位论文数据库的建设项目为例,对高校学位论文库的建设进行探讨。
高等院校学位论文数据库的建设紧紧围绕将论文数字化、规范化、网络化的同时,最终实现具备全文检索和多种类型的关键词检索双重检索功能的数据库平台,我校学位论文数据库的建设采用清华同方的TPI数据库管理系统,建设流程包括论文提交与规范化、元数据的选取与著录、利用学位论文数据库建设系统构建数据库框架、数据导入、数据库发布等过程,具体流程如图1所示。
图1 高等院校研究生学位论文库建设流程图
第一,格式规范化,对研究生论文收集和加工要确保论文格式的规范与统一,使格式符合国家标准和行业标准。目前国内学位论文需要依据的标准规范,主要由全国信息与文献标准化技术委员会归口的国家标准《学位论文编写规则》(GB/T 7713.1-2006)、《信息与文献 参考文献著录规则》(GB/T 7714-2015)和由全国图书馆标准化技术委员会归口的行业标准《学位论文元数据规范》(WH/T 68-2014),电子版学位论文的基本格式主要由封面、独创性声明、版权授权书、中文摘要、英文摘要、目录、引言、正文、参考文献、附录和作者简历等部分组成,各个部分要尽可能符合国家标准和行业标准,避免出现论文格式不规范的情况。
第二,建库标准化,标准化既是网络数字资源共享的基础,又是数据库建设质量的保证,数据库的稳定性、可靠性、适用性、可移植性都有赖于建库的标准化。论文数据库的文献著录标引必须遵循统一的规范与标准,在数据库建设过程中,可以采取《文献著录非书资料》(GB/T 3792.4-2009)的标准规范,元数据的选取严格按照都柏林核心元数据(Dublin Core Metadata)标准或者依据CALIS中心制定的特色库建设规范,遵循国内、国际通用的元数据标准和数字资源对象著录规范,既保证了检索路径便捷化,提高检索效率,又有利于数据库之间的互联、互访,方便数据库跨平台迁移,最终实现资源共建共享的目标。
第三,功能人性化,在保证数据质量的前提下,通过设置合理的检索功能,建立友好的检索界面,可以保证读者方便快捷地获取研究生论文数据库的信息资源。在检索功能上,要建立完善的多功能检索系统,提供多种检索途径,比如提供基本检索与高级检索,支持全文检索技术及针对元数据内容的检索等,读者可以实现对著录信息的外部特征进行检索,或者针对全文进行检索,通过设置丰富有效的检索点,提高读者对文献获取的查准率、查全率。对数据库检索界面的设计,要简洁、清晰、友好,并设置浏览功能,提供数据库使用的帮助文档,以方便用户使用。
1.建库平台的选择
论文库建设平台的选择,既要满足建设学位论文提交系统的要求,也要满足学位论文全文检索的要求,学位论文的提交要遵循学位论文数据库建库标准和技术规范,能够通过OAI接口,对元数据的提交提供统一的格式,学位论文检索方面要支持通过OPENURL技术,实现学位论文与元数据的对应。TPI系统可以满足以上两方面的需求,该系统是同方知网发布的数字集成平台,它完全兼容当前国际上使用最为广泛的元数据标准Dublin Core标准,支持当前国内普遍使用的CNMARC 标准,兼容论文提交系统所要求的OAI协议和论文检索系统要求的OPENURL技术,且具备高性能的内容管理系统、KBASE检索服务器、全文数据库服务器和准确的信息检索系统,可以高效便捷地建立全文学位论文库。
2.元数据与著录规则的选择与制定
为符合数字资源开放建设的要求,在研究生学位论文数据库建设中,著录规则的制定决定了数据库的适用性,必须符合规范,TPI系统本身是符合Dublin Core元数据标准规范的,遵循中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS)提出的“高校学位论文全文数据库”建库标准,并且支持OAI(Open Archive Initiative for Protocol Metadata)协议[2],通过OAI协议提供统一格式的元数据。参照各项规范,并根据读者不同途径的检索需要,该学位论文数据库的元数据选择如下的描述字段:论文作者、学院名称、专业名称、研究方向、导师姓名、学位授予时间(年)、分类号、中文题名、外文题名、中文摘要、外文摘要、中文关键词、外文关键词、论文全文等十四个方面的描述性元数据信息。
3.论文数据的收集与检查
根据研究生学位论文的来源,一部分是在校生毕业前的要提交的学位论文,另一部分是要回溯建库的学位论文,为简化论文收集程序,减少论文收集、管理和利用的流程,方便作者对学位论文的提交和读者对论文数据的利用,第一部分的论文采用在线提交的方式,收集学位论文数据,回溯建库的学位论文则直接根据以往提交到学校的WORD文档建库。同时,为规范格式,加强知识产权保护,需要将收集到的学位论文转换成PDF格式,并进行加密,防止对PDF格式的论文数据再反向换成可编辑的WORD文档,进行编辑操作,或者继续复制使用文字的可能,利用TPI系统提供的文档转换工具,可方便地将WORD格式的学位论文转换成PDF格式。在用户通过论文提交系统提交论文后,要逐条对论文元数据进行检查,对不符合要求的标引进行修正,防止错误标引的发生。
4.学位论文库的发布
在元数据和学位论文库都上传完毕后,接下来进行学位论文数据库的发布工作,主要包括如下步骤:一是启动TPI系统的内容管理器(CPS)建立数据库设置向导,对学位论文库的基本信息如建立学位论文数据库所采用的模板,根据数据库的类型选择相应的模板,TPI系统根据不同用户的检索偏好,提供多种数据库发布类型,比如TPI、CNKI等,根据不同的发布类型,发布后的检索系统界面也会略有不同,之后对学位论文数据库在TPI系统中的名称等基本信息或内容进行配置。二是设置数据库的元数据检索字段,以确定发布后供读者使用的检索点,依次设置数据库的概览字段、细览字段和排序字段,在概览区显示概览字段配置的元数据信息,细览区显示细览字段配置的元数据信息,排序字段则根据相应的字段类型决定学位论文在数据库系统中的先后顺序。三是配置检索选项,设置初级检索界面和高级检索界面,对检索属性和检索点进行个性化的配置,从而完成学位论文库的发布。
专业是学院的下属类目,但近几年,由于各高校学科发展和专业发展的需要,很多专业对所在院系进行了调整,这种情况下,对学院调整之前的专业,就存在了学院上的归属问题。以我校(天津美术学院)为例,之前室内设计专业和景观设计专业属于设计学院,但2014年以后,我校新成立环境与建筑艺术学院,下设室内设计系、景观设计系。在研究生学位论文库中,为了保证各专业在学位论文数据库中的一致性,当专业或者学院类别发生变更时,将专业的上属类目归到新的学院类别下面,这也最大程度地降低了数据标引和检索时的“二义性”。
研究生学位论文作为研究生在校期间的学术成果,其著作权(包括数字化后的著作权)理应受到法律保护。[3]因此如何保护论文作者的版权,这是研究生学位论文数据库建设之初就应该考虑并应该妥善解决的问题。一方面,高校学位论文库不存在任何营利性行为,其目的是为高校教学和科研提供支持和服务,因此,高校相关部门可以和研究生签署论文的使用许可协议,在征得论文作者的同意之后,再将论文提交到学位论文库;另一方面,高校也要采取必要的技术手段,加强学位论文的知识产权保护,比如前述的将WORD文档转成加密PDF格式,或者在学位论文库的访问上,采用IP地址访问限制的方式,充分保护论文作者的利益。
学位论文库建成后,要安排专门人员不断地对数据库进行更新维护,才能保证论文库的价值。一方面,很多毕业生的学位论文在论文选题、研究内容、研究成果上本身是具有新颖性和时效性的,只有将每一届毕业生的学位论文及时上传到学位论文库,毕业论文的价值才能及时地并且最大程度地得到利用;另一方面,学位论文库的发布有赖于硬件平台和数据库系统,这就要求要有专门的技术人员,对服务器进行定期维护,包括硬件维护和软件维护,并且对数据库中的数据及时备份,最大程度地保证系统级安全和数据级安全,对论文数据库出现的论文提交问题或检索访问问题,也要在第一时间解决,以确保读者能有效地查询和使用论文库。
互联网时代,在读者对信息和资源的需求越来越多的情况下,各高校应该充分利用自身优势,加强本校数字化建设,构建本校的学位论文数据库,从而更充分发挥学位论文的学术价值,提高学位论文的使用率,为高校的教学科研工作和学科专业建设提供更好的支持。