灰色文献的多维度价值挖掘及呈现
——基于台湾大陆同乡会文献数据库的案例分析

2022-05-11 13:25
嘉应学院学报 2022年1期
关键词:同乡会文献数据库类目

罗 铿

(嘉应学院 图书馆,广东 梅州 514015)

一、引言

当前,随着信息环境和用户信息行为的不断变化,使得灰色文献的建设开始逐渐成为国内图书馆的核心业务之一。2018 年12 月7 日,东莞召开了第一届全国灰色文献开发与利用年会,在年会上宣读并通过了《灰色文献开发利用东莞宣言》和《关于成立灰色文献开发利用联盟倡议书》,就图书馆在灰色文献开发利用过程中的地位与责任,以及如何发挥应有作用问题进行了解答,提出图书馆应该成为灰色文献建设的承载者和组织者,发挥中坚和骨干的作用[1]。国内图书馆界于八十年代初就展开对灰色文献的研究,从灰色文献的含义、开发模式、建设方法都有了一定的研究基础,并逐步进行灰色文献建设的实践活动。但国内的灰色文献资源建设还是存在一定的问题,与国外发达国家相比,我国灰色文献资源建设工作在文献特征、建设背景、制度保障等方面存在较大差距[2]。尤其是在建设模式方面,缺乏一定的合作机制,多体现为单打独斗,条块分割,不成系统,造成建设质量不高、应用性不强。为了更具有现实参考意义,本文拟采取案例分析的方法,对当前灰色文献的价值挖掘和建设模式进行归纳总结,并结合已有的灰色文献研究成果,在对一个案例进行分析的基础上,就如何多维度挖掘及呈现灰色文献价值进行研究分析,以期为灰色文献的开发工作提供有益的参考和借鉴。

二、研究回顾

灰色文献的术语产生于70 年代的西方文献情报学界,通常称其为“非常规文献”、“难以获得”的文献和“非定型文献”等[3]。当前,主流的观点分别从灰色文献的流通和来源角度以及侧重于灰色文献的出版特征角度对灰色文献进行定义,前者强调灰色文献来源的复杂性和流通范围的有限性;后者强调灰色文献出版方式的不可控性和传播形态的非常规性。对灰色文献的研究,国内方面,笔者通过CNKI 数据库,利用“灰色文献”作为主题进行检索后,采取文献调研方法分析发现,高校图书馆和公共图书馆是国内“灰色文献”主要的研究机构,研究主题重点在于探究高校图书馆或公共图书馆对灰色文献的资源、体系建设、开发利用,以及对网络灰色文献、重点学科、机构知识库和特色馆藏方面的资源建设、开发利用,CNKI“灰色文献”主题文献可视化分析见图1。国内研究的学科方法以图书情报、计算机技术、新闻传播以及档案、博物馆等为主要学科。进一步通过限定年代发现,当前,灰色文献的数字化研究成为国内近期主要研究方向。国外方面,闵超等利用文本挖掘技术对国外专业会议论文进行定量分析发现:国外在国家层面和机构层面拥有稳定的灰色文献研究群体;文献服务、电子灰色文献(e-GL)和知识库等方向是重点的研究主题;文献计量方法尤其是引文分析方法是灰色文献的主要研究手段;国外灰色文献在科技、经济、环境、教育和公共卫生等领域的研究和利用较为频繁[4]。

图1 CNKI“灰色文献”主题文献的可视化分析

三、研究方法及设计

(一)研究方法

本研究采用单案例(个案)研究方法。相关的研究表明,采用单案例(个案)研究适用于解决有关“如何”和“怎么样”的问题[5],并且可以通过提供丰富的数据和材料进行支撑[6],适合解释特定现象背后复杂、动态的深层次问题[7]。本研究旨在探索灰色文献的价值挖掘及开发模式问题,研究信息开发机构如何实现对灰色文献的多维度价值挖掘和呈现,采用单案例研究方法将有助于对在灰色文献的价值发现和开发模式中存在的深层次问题展开深入剖析。

(二)案例选择

单案例研究需要遵循典型性原则,也就是说要求选择与研究现象高度相关的典型案例。此外所选案例的数据可获得性也是一项重要的因素,其关乎能否提供丰富的数据支撑进行案例分析。根据上述原则和因素,本研究选择台湾大陆同乡会文献数据库作为案例分析的研究对象。

台湾大陆同乡会文献数据库建设项目是在中国社会科学院和中华全国台湾同胞联谊会的支持下,由社会科学文献出版社于2013 年开始与台湾出版机构合作,着手开展同乡会文献的收集整理工作。截至2016 年10 月,已完成52 种、4958 期、约3.2 亿字的文献资源收集工作,共涉及 18 个省份。数据库悉数收录台湾大陆同乡会文献资源,以省份为基本单位建设不少于18 个子库,并从期刊、主题、人物、专题4 个维度,对同乡会文献资源进行整体展示和分类展示[8]。本研究选择台湾大陆同乡会文献数据库为案例理由如下:首先是其具有代表性和典型性,有一定的影响力。台湾大陆同乡会文献包含赴台人员撰写的人物回忆、纪念文集、历史掌故、家乡礼俗、艺文时评和学术论文等,内容涉及政治、经济、文化等诸多方面,具有较高史料价值和文献价值,也是两岸文化同根、一个中国的明证。其次是其具备很高的参考价值。笔者所处的广东省梅州地区,海外华侨众多,范围遍布欧洲、美洲以及东南亚各国,其同乡会刊物资料同样非常丰富,因此研究分析本案例对笔者以后对此类灰色文献进行采集、整理及开发方面具有很大的实践参考价值。此外,该数据库平台已可以在网络进行访问,用于进行相关分析的数据可获得性高。

(三)数据收集与处理

本文的数据收集方法包括网络调查、二手资料收集、电话、邮件咨询等。主要的数据来源包括:新闻媒体报道、网站分析、相关研究文献、网络调查等。本文根据收集的数据,结合相关文献调研资料进行分析。

四、案例分析及发现

(一)台湾大陆同乡会文献数据库的信息开发模式

灰色文献资源的组织开发模式可分为集中、分散、分布以及集成服务模式[9]等,见表1。“台湾大陆同乡会文献数据库”整个项目的实施由社会科学文献出版社牵头组建的“台湾大陆同乡会文献汇编”学术委员会指导下进行。委员会吸纳了来自台湾“中研院”近代史研究所、中国社会科学院近代史研究所、北京大学、厦门大学、华侨大学、台湾佛光大学、台湾逢甲大学、台湾大通书局、台湾花木兰出版社、社会科学文献出版社等机构的知名专家学者担任委员。学术委员会的主要任务是对台湾大陆同乡会文献价值做深度挖掘,并对“台湾大陆同乡会文献汇编”项目进行学术指导和远景规划,社会科学文献出版社则与台湾地区出版机构合作,进行同乡会文献的收集整理,并负责对整个项目的数字化加工服务进行委托招标采购。由此可见,“台湾大陆同乡会文献数据库”项目的信息组织开发比较符合“分布—集成服务”的混合模式,具有统一标准、协调管理、分散采集、集中开发、平台集中服务等特点。

表1 灰色文献的组织开发模式

(二)台湾大陆同乡会文献数据库的信息资源分类体系

信息资源分类是指,根据信息资源的内容属性和其他特征,将各种类型的资源分门别类地、系统地进行组织和揭示的方法。科学合理的信息资源分类是信息组织、深度开发、检索、共享和交换的基础,是信息资源管理和开发利用的重要前提。实现对信息资源的一致性组织和规范化,是解决信息资源“是什么、有什么、在哪儿、谁能得到、以什么方式得到”等问题的根本手段[10]。因此,本文主要从分类体系特征和类目结构两个方面对“台湾大陆同乡会文献数据库”进行信息资源分类体系分析。

1.分类体系特征

“台湾大陆同乡会数据库”在资源导航中显示了其分类体系。网站地图界面按照栏目所包含的信息内容划分为“期刊纵览”、“主题聚焦”、“杰出人物”、“特色专题”、“同乡会”、“学术委员会”等版块。从网站的页面结构和上下级类目页面跳转关系来看,“台湾大陆同乡会文献数据库”呈现明显树形结构的信息分类体系特征:利用层层筛选、逐级展开的形式提供信息,类目间除了父类目与子类目之间的纵向隶属关系外,还提供横向的逻辑关系。详见图2。

图2 “台湾大陆同乡会文献数据库”的树形结构

2.类目结构分析

在类目划分上,“台湾大陆同乡会文献数据库”根据同乡会刊物的栏目设置和内容主题情况,分别按主题分类法和体系分类法的原则进行类目划分。以广东省子库为例,其共收录广东旅台同乡会创办的《广东文献》、《台北市梅县同乡会会刊》、《嘉应五属年刊》等8 种文献,首先按照总库的大类划分标准统一划分为“期刊纵览”、“主题聚焦”、“杰出人物”和“特色专题”等四个大类。然后根据这些期刊的栏目设置和内容特征,分别按照体系划分和主题划分的原则进行类目设置,如“期刊纵览”将同乡会期刊所包括的所有文献期刊作为二级类目列出,保证每种期刊的相对独立性,从而方便用户按各种期刊的年、卷、期进行查找。而“主题聚焦”和“特色专题”则按主题划分原则设置二级类目,便于用户通过主题内容查找信息。详见表2。分类体系复杂性方面,从“台湾大陆同乡会文献数据库”中大类到最底层类目所经过的层数看,基本上跳转的层数为三层或是四层,如广东库收录的一篇文章“趣谈广东新姑爷”就按“主题聚焦——文学艺术——乡野趣闻”层级进行划分。由此可见其分析体系并不复杂,便于用户按类目层级查找信息。类目的纵向交叉性方面,属于同一信息但隶属不同的类目情况比较普遍。调查发现,其四个大类间均存在大量的信息纵向交叉现象,如广东库收录的刊载于《广东文献》第4 期的一篇文章“粤籍华侨在缅甸”,就分别被划分在“期刊纵览”和“主题聚焦”两个大类下,并且在“主题聚焦”大类中,又同时被划分在“两岸交流——海峡两岸”、“海峡形式——国际瞭望”、“史料谱乘——历史集萃”、“文学艺术——往事夙文”等四个类目下。这种类目间的纵向交叉关系无疑有利于用户多角度获得信息。

表2 “台湾大陆同乡会文献数据库”广东省子库类目表

(续上页表2)

五、结论与讨论

(一)实现多维度价值的开发

“台湾同乡会文献数据库”通过组建的学术委员会保证了对同乡会文献的多维度价值的深度挖掘和全面开发,具有学术的权威性和资源利用的普适性。分析“台湾大陆同乡会文献数据库”发现,其实现多维度价值的形式主要有以下几点:一是通过图像扫描、ORC 文字识别等信息技术对同乡会文献进行数字化开发,实现档案价值(原版同乡会刊物的电子文档保存)和文献价值(同乡会文献刊物的数字化阅读)的开发。在数字化的基础上,根据同乡会文献的内容特征和主题类型,通过提炼关键词、主题词等相关数据,利用内容标引和数据关联技术,从历史价值(如史料谱乘、人物春秋)、社会价值(如两岸交流、经教卫文)、智库价值(如海峡形势)和学术价值(如史料谱乘、学术专栏、文献动态)等多个角度,实现对文献的多主题聚焦开发。最后结合各个省份同乡会文献的内容特色和资源丰富程度,实现对各省份的人物类和独具特色类资源的特色化主题开发。

(二)实现了多主题的深度开发和较丰富的信息呈现方式

“台湾同乡会文献数据库”通过综合各个省份的同乡会刊物的栏目设置和内容特征方面形成具有4 个一级大类,16 多个二级类目,60 多个三级类目,构建了主题类型丰富、类目设置相对科学、完善的分类体系,从而最大限度地实现了对同乡会刊物资源的深度开发。在此基础上,“台湾同乡会文献数据库”还提供了较为丰富的信息呈现形式。如提供了同乡会刊物按年卷期进行原刊的图片浏览形式,不仅实现了利用数字化保存原始档案文献的目的,还方便用户从档案利用角度浏览同乡会文献刊物的原貌。如提供在线数字化阅读和数字文献的下载保存方式,从而方便用户通过网络进行数字化阅读和下载等。

(三)讨论和建议

1.基于多元化的信息加工和呈现,实现文献信息价值的增值

在“台湾同乡会文献数据库”的后续开发中,可以针对各省份同乡会文献的相关主题内容,利用现代化的信息技术进行多元化的信息加工和呈现,以实现对同乡会文献的增值化开发:如对经历重大历史事件、知名人物等的后人或相关人员进行口述历史的影音视频制作;对刊载其中的蕴含丰富人文价值、社会价值和历史档案价值的主题内容进行影视作品开发,如制作风俗人情的专题纪录片,合作创作抗战主题、或故土怀念主题的电视剧、电影等文艺作品;对于反映相关战役等历史进程的相关事件利用3D 虚拟技术进行虚拟动画制作演示等融合多种媒体类型的多元信息资源开发。

2.挖掘数据资源,实现数据共享和合作共建

通过多方合作、共建共享的资源建设模式是当前灰色文献资源建设的发展趋势[11],如由麦吉尔大学和图书馆成功合作的数字人文项目“明清妇女著作”(MQWW)数据库就通过下面两种方式实现共享共建:一是通过微软Access 数据库系统,在线更新并免费提供“明清妇女著作”数据库的全部著作信息、诗词信息、诗人信息等数据库元数据,方便研究人员利用ArcGIS 和SPSS 等数字人文软件工具进行数据分析;二是与中国历代人物传记资料库(CBDB)进行合作,将中国历代人物传记资料库纳入明清妇女著作的资料,为明清妇女著作资料库中的所有人物建立永久ID,并且相互间建立系统互通性,方便使用者跨系统使用。因此,利用灰色文献开发项目与大学、科研机构和档案馆、博物馆等机构就相关的项目领域挖掘诸如图表数据、元数据、本体知识等数据资源进行数据共享和合作共建,不仅可以优化和整合分散的灰色文献资源,还是实现灰色文献价值延伸的有效途径之一。

猜你喜欢
同乡会文献数据库类目
《感染、炎症、修复》杂志检索数据库
风雨兼程,紫荆花开——扬州(香港)同乡会十年侧记
《感染、炎症、修复》杂志检索数据库
“东方明珠”与“江中明珠”间的浓情厚意——记香港扬中同乡会
本期练习题类目参考答案及提示
近代旅外徽州同乡会的治理架构与社会功能
同呼吸 共祭奠——加拿大南京同乡会呼吁全球侨胞团体国家公祭日举办海外同步祭奠活动
论我国学术文献数据库的质量调控
中文文献数据库中撤销论文的分布规律研究
《中图法》第5版交替类目研究综述