金 峰
(广州图书馆,广东 广州 510623)
“灰色文献”通常系指非正式出版物、从非正式途径获得、在一定程度和范围内公开的文献,是图书馆文献资源的一个重要组成部分。当今中国正处于实现中华民族伟大复兴的关键时期,公共图书馆在文化建设事业中的职能和作用越来越重要。与此同时,以信息技术为代表的现代科技高速发展,人类已进入“大数据”时代,使得灰色文献的种类和形态极大丰富,进而对图书馆灰色文献资源建设和服务提出了诸多新要求。广州图书馆在“十四五”规划中顺应时代要求,有针对性地提出了一些颇具建设性的策略和行动方案。
1.1.1 关于灰色文献的定义
目前学界关于灰色文献的定义多有歧说,较为权威的《图书馆·情报与文献学名词》中将灰色文献解释为:“不经过公开出版物流通渠道、发行量小,为一部分特定用户使用的内部情报资料”[1]。其界定的灰色文献概念范畴颇为狭小。图书馆学界通常采用与正式出版物即所谓“白色文献”相对应的概念,如林泽明[2]、李泽文[3]等均以非正式出版作为定义灰色文献的重要条件。第3届国际灰色文献大会提出:“灰色文献是由各级政府、学术界、工商业界产出并以印刷型和电子格式制作且不受商业出版商控制的文献资料”[4]。第12届国际灰色文献大会对此定义略作修改,更加强调了“产生这些文献的主体不以出版作为首要活动”[5]。2018年召开的首届全国灰色文献年会,也倡导定义内涵更加宽泛的灰色文献。
1.1.2 “大数据”时代灰色文献的内涵
宓浩、黄纯元等倡导的“知识交流论”认为,图书馆的功能不仅在于对文献进行收集、存贮、整理、组织、传递和利用,更在于由此形成的知识的传承和传播,并主张图书馆的本质在于实现“社会知识交流”[6]。这一主张在很大程度上揭示了“图书馆”收集整理“图书”,亦即以典籍为主的传统文献资源建设的本质性价值和意义。也就是说,图书馆选择典籍或出版物作为馆藏资源最重要的原因,是传统文献资源承载了历史或当代人类社会文明的结晶,“文献”即“经典”。
但在“大数据”时代,对于公共图书馆而言,“大数据”意味着与人类文明传承相关的信息“海量”化。一方面,人们制造和产生了更大量的信息,并且这些海量信息可以被记载和传承下去。另一方面,人们拥有了可以高效分析处理海量信息的工具和手段。这就使得除了图书典籍等“经典”外,更多反映当代人类文明各方面“细节”、更加全面和精细的信息资源也有条件得到传承,许多在以往属于细琐或被认为没有绝对价值的信息,都有可能在未来成为“新经典”。
因此,笔者认为,“大数据”时代灰色文献的内涵,应当超越“图书”或“典籍”等传统“文献”概念,拓展至“数据”这一信息资源范畴,亦即“数据”已成为传承当代人类知识、文化的重要载体,任何一种数据都具有未来成为“经典”的极大可能,并且也具有传承和传播的意义和条件。如果将这些区别于正式出版物的信息资源以“灰色文献”的概念加以统摄,而不考虑其文献种类、载体类型、发布者和使用范围,则灰色文献不仅能够替代“图书”成为图书馆文献资源的重要组成部分,也必将极大地改变未来图书馆文献资源的概念。
1.2.1 灰色文献资源数量的海量化及相关特征
“大数据”具有海量(Volume)、多样(Variety)、获取快速(Velocity)、价值密度低(Value)等“4V”特征。其中与传统文献不在一个数量级的“海量”,是“大数据”最为重要的一个特征[7]。相对传统文献资源,“大数据”时代图书馆灰色文献资源出现了几何级数的增长,呈现出海量化特征。
与此同时,正是基于海量,传统意义上一些被认为是属于低价值密度、受污染和无效的“垃圾”数据[8],虽然作为个体不像传统文献那样具有高密度的知识和文化信息,但形成数量规模后,也具有了作为“整体”的文献和文化价值。对于很多灰色文献而言,不应基于文献个体,而是需要基于一定数量文献的总体,才能对其价值作出合理判断。亦即“大数据”时代灰色文献的规模化、体系化特征,为其具备传统意义上的文献价值提供了可能。
更重要的是,在“大数据”时代,海量灰色文献所记载和反映的社会生活各个方面具体而细微的面貌,包含有传统文献所未能关注到的人类文化和知识的诸多“细节”,符合“眼光向下”的社会科学发展潮流,对于未来构建更加全面、立体的社会科学系统具有极为重要的价值和意义。即与传统文献对知识或文明信息进行高度提炼浓缩不同,“大数据”时代的灰色文献还具有面向细节的“非经典化”或“非精炼化”等重要特征。
1.2.2 灰色文献种类和载体类型的多样化
金沛霖指出,地方文献“是记录有某地区知识的一切载体”,并列举了地方报刊、地方文献照片资料、地方金石拓片以及簿记、票据等地方经济史料,文契、文告等地方社会史料等各类所谓“地方特种文献”[9]。这里的“地方特种文献”,理论上都属于灰色文献的范畴。反映地方经济、文化和社会生活面貌的公私机构文书、家族或个人文书以及较为常见的商业文书等,都以“灰色文献”的形式存在,其本身的文献种类和载体形态等即已极为丰富。
在“大数据”时代,由于信息技术的发展,灰色文献的类型和载体变得更加复杂多样。除了普通图书等纸本传统文献以及现已归入传统文献的缩微和影像、音像资源之外,电子书、数据库、网页等电子资源越来越成为当代图书馆资源建设的重要组成部分。而在当代中国极为活跃和影响广泛、依托于网络平台的社会活动以及全媒体环境下的自媒体传播活动所生产的数字化信息资源,其载体和存在形式不仅有别于传统文献资源,与公共图书馆现有数字资源也有很大不同[10]。如电子邮件及手机短信、QQ、微信等诸多替代纸质信函的“无纸化”信息交流工具,不断生产出海量的社交信息资源。与之类似的还有行政、商业等办公工具生产出的信息资源,如替代了纸质账簿的电子账簿等。其他还有如国家图书馆针对“慕课(MOOC)”热潮纳入文献资源建设范畴的慕课资源[11]以及越来越受到图书馆界重视的“口述史”资源等。以数字化为主的新种类、新载体文献所包含的丰富知识和文化信息,并不亚于传统种类文献,在图书馆的资源建设中具有难以估量的潜在价值。
1.2.3 灰色文献存在方式的多样化
与传统文献往往以肉眼可见的物理方式存在于特定空间不同,“大数据”时代的灰色文献,多以数字化或网络数字资源的形式存在。相当数量的数字资源不再依靠纸质或磁盘、光盘等介质出现,而是依托互联网以云储存的方式存在,并且通过社交平台、OA等办公系统、数字财务系统等各类软件或平台展示出来。此外,随着图片、语音和文字间转换技术的普及应用,特定文献的种类也因使用者的选择和展示平台的设定而具有随机性或不确定性,这种特性也与传统文献有着很大不同。
“大数据”所带来的海量信息不仅意味着文献数量的简单增加,而是要求图书馆对文献处理手段、方法和模式乃至对于文献资源概念内涵的认知,都要发生革命性的变化。如陈力指出,信息时代信息环境、读者以及图书馆在阅读服务中地位的变化,都要求图书馆对传统文献资源建设的原则、方式、方法等做出与时俱进的调整[12]。同样,这也要求图书馆对灰色文献的定义、价值地位、管理和服务模式等进行全面的梳理和反思。
从总体上看,一方面,海量信息和能够处理海量信息的现代科技使得能够成为图书馆馆藏资源的文献信息的种类和数量极大丰富,但另一方面,海量信息意味着没有一家图书馆能巨细无遗地收集和处理这些信息。也就是说,如何在力所能及的条件下从海量信息中有选择地收集和处理最有价值的文献资源,成为每一家公共图书馆面临的重要课题。这就使得如何判断某种信息是否具有“经典”的资源价值成为图书馆资源建设的首要任务。与此同时,对于那些被认为是属于低价值密度、无效的“垃圾”数据,如何秉持“宁滥勿缺”的理念,仅从图书馆保存文化的职能出发,对其进行提取、存储、管理以及某种条件下的整理和研究利用,也应当成为公共图书馆资源建设中的一项重要工作。
目前国内公共图书馆大都越来越重视数字资源建设,除对传统文献资源进行数字化扫描,或者是利用计算机文字识别技术获取文本文件外[13],购买和自建数据库也是图书馆数字文献资源建设和服务的重要途径和手段。而对于电子书、数据库以及网页等新类型、新载体的灰色文献资源,集中采购等传统征集手段就明显存在短板。有研究者提出利用网页抓取、爬虫技术等数字资源整合手段,有系统、有目的地高效获取和存储资源信息,使之成为公共图书馆文献资源中的有机组织部分[14],即技术手段有时能够发挥比商业途径更大的作用。此外,对于实物等公共图书馆原本不具备存储和开放服务条件、不属于传统文献范畴的信息资源,通过扫描、影像处理,特别是在综合运用计算机图形、仿真、传感和显示等技术条件下,已初步具备了集成处理和服务的可能。在可以预见的未来,将会有越来越多富含信息的载体被纳入图书馆文献资源的范畴。如何利用现代数字技术,针对与传统文献迥然有别的新型信息资源进行加工和收集整理,对于公共图书馆来说具有极为特殊的意义。
当然,在文献资源数字化建设中,还应重视适应未来服务技术要求的标准化和兼容性问题。即在对传统文献进行数字化以及对数字文献进行信息编目加工时,对目录搜索指标和执行标准等各项要求进行规范化、标准化,为检索等各类服务的智能化提供条件[15];应重视数字化过程中的多维化加工,为未来可行的文献资源多载体和体验式服务奠定基础;应重视二维码等物联网技术的运用,对不同载体文献进行统一标准的数字化处理,以利实现文献资源的“智慧化”服务;应主动探索未来可用的技术手段,追求实现读者参与、促进资源开放存取和共享共建一体化的资源建设和服务系统。
资源载体形态及其存在、展示方式的变化除对图书馆资源建设提出新要求外,也必然要求其服务方式和手段的与时俱进。信息时代图书馆文献资源服务方式的数字化发展,不仅是指文献信息检索服务工具、手段的数字化以及对传统文献的数字化加工或数据库建设,利用软件和平台进行信息加工、整合势必成为图书馆越来越重要的信息服务手段。更重要的是,“大数据”时代的数据信息处理,是一个能够基于大数据+互联网的技术条件,利用云计算、云存储、分布式处理和分布式数据库等新型数字处理模式,对海量信息进行高效处理和价值发掘的智能化过程,这也为图书馆的“智能化”服务描绘了蓝图。
广州图书馆在“十四五”规划中,依托地方文献开展灰色文献建设,所拟定的建设策略和行动方案,顺应了“大数据”时代发展趋势,对于新时期公共图书馆开展灰色文献建设具有示范性、建设性的价值意义。
通常来说,普适性、经典性的普通文献资源是公共图书馆满足公共文化服务的重要基础。但《中华人民共和国公共图书馆法》还规定,政府设立的公共图书馆也具有“系统收集地方文献信息,保存和传承地方文化”的职责,即赋予了各公共图书馆传承和弘扬本土文化的重要职能。近年来,全国各地的公共图书馆大多积极开展了地方文献资源的征集和开发利用等工作,也有多家图书馆设置了专门的地方文献收藏机构。但在全国范围内,基层公共图书馆仍普遍存在征集不力以及地方文献种类、数量较少等诸多问题[16]。广州图书馆在“十二五”时期即策划设置了广州人文馆,通过广州人文馆开展专门的地方文献建设。在“十四五”规划中,广州图书馆拟定了“推进历史文献与地方史料建设、开发与服务”的地方文献建设策略,并相应拟定了“系统拓展历史文献与地方史料收集与服务”等行动方案。这些策略和行动方案不仅针对灰色文献海量化的特征划定了文献建设的合理范围,也满足了灰色文献种类、载体多样性的建设要求。
其一,针对“大数据”时代灰色文献的海量性特征特点,广州图书馆“十四五”规划将灰色文献与地方文献结合起来,将地方灰色文献作为建设重点,不仅很好地履行了公共图书馆地方文化建设的职能,也解决了面对海量文献难以抉择的文献建设范围问题。
其二,针对“大数据”时代灰色文献种类、载体多样性特点,广州图书馆“十四五”规划中就地方文献建设采取了不区分文献属性,即将灰色文献与白色文献一视同仁、不加区分的做法。在工作实践中,广州人文馆对不同种类和载体类型的文献兼收并蓄,收集整理了大量家谱、地方机构内刊、村镇志和机构志、老照片、名人手稿等灰色地方文献。这一做法虽未将灰色文献列为独立的文献资源门类,但却更加符合灰色文献价值特征和服务需求,使灰色文献具有了与白色文献相同的地位和属性。
其三,面对“大数据”时代文献数量海量化和种类载体多样化带来的灰色文献价值判断难题,广州图书馆对“十四五”规划中的文献资源概念进行了相应调整,将各类不同于传统典籍、书籍,理论上单位价值密度较低的灰色文献纳入文献资源建设工作中,并将以灰色文献为主的当代地方史料文献与古籍等地方文献中的传统历史文化资源并重。同时,不仅重视非传统文献经典的民间文书等历史文化资源,还重视开展面向未来的当代民间文献建设。其中广州人文馆依托广州图书馆“十四五”规划开展的“家庭文献”征集专项工作,将在当前社会生活中最为活跃的消费、社交等数字化信息资源也纳入文献收藏范围,拓展了图书馆“文献”的范畴,甚至可以说在某种程度上重新定义了图书馆“文献”的概念。
其四,面向未来,开展“新手稿”等新经典资源建设。广州人文馆一贯重视名人专藏和《广州大典》等传统或经典文献资源,以满足与地方历史文化研究相呼应的基础性学术资源的建设需求,使得广州图书馆的地方文献建设除满足传承文明、传播地方文化等公共文化职能外,在开展社会教育以及提供研究性服务等方面也发挥了越来越重要的作用。与此同时,广州人文馆还通过实施广州图书馆“十四五”规划中“新手稿”建设专项工作征集当代地方知名学者的“新手稿”,不仅使面向未来的“新经典”成为灰色文献的重要组成部分,也为提升公共图书馆研究性服务水平开辟了路径。
在“大数据”时代,实现整体化、系统化是海量灰色文献能够具有高价值的重要前提。广州图书馆“十四五”规划,通过专题文献建设,很好地实现了灰色文献的价值提升。近年来,许多公共图书馆都在进行专题资源建设,如陕西省图书馆地方人物专题文献和口述史资源建设[17]、顺德地方高校图书馆地方商业文化文献资源建设[18]以及浙江省文化和旅游厅针对非遗文献专门建设的非遗文献馆等。公共图书馆如何从地方特色出发,在海量信息中高效、有系统和有针对性地围绕地方历史和当代社会、经济、文化发展中最具特色的代表性事件、人物、机构或文化现象等组织开展专题文献资源建设,不仅是地方文献建设的迫切要求,也是“大数据”时代图书馆资源建设如何取舍的难点所在。
广州图书馆除继续开展家谱、革命历史文献、村镇志和广绣等“岭南非遗”等专题文献建设外,“十四五”规划还拟定了“推进粤剧粤曲史料文献资源建设”“建设广州图片资源库”“强化民间组织内刊、机构资料等灰色文献收藏”等多个面向专题的行动方案,并明确了开展“广交会”文献资源建设等工作任务。这些专题文献建设的重要意义在于:其一,使灰色文献摆脱了文献种类和载体类型的限制,能够以专题方式得到归集;其二,围绕最能代表广州地方文化特色的若干专题组织开展成系列的文献资源建设,一方面最能全面勾勒广州地方文化基本面貌,另一方面是面对“大数据”时代的海量信息,能够做到取舍有度,实现效率与效能的统一;其三,专题资源建设还为开展分众的、专题性的灰色文献阅读推广服务奠定了重要基础。
此外,广州图书馆“十四五”规划中,“延伸家谱收藏至家庭文献收藏,明确家庭文献范围,以多种方式推动入藏”“拓展新方志尤其是村镇志收藏”等行动方案,不仅构建了家庭(个人)文献-家谱-新方志(村镇志)的地方文献层级系统,更重要的是明确了眼光向下的视角,将作为社会细胞、能够呈现社会现实和历史微观面貌的家庭文献作为突破口,使得“文献”不仅能够呈现社会历史的整体面貌,也能够构建细节和显微的景象,使得单独看来无意义或无价值的灰色文献,都成为反映地方社会人文独一无二的“高价值”文献单元。
对于在“大数据”时代如何推进智能化的数据信息服务,图书馆界进行了诸多创造性的理论和实践探索。如有研究者倡导相对大数据而言针对经过筛选特定对象的更全面、集中的“小数据”收集和“小数据库”建设模式,即一种以点及面,不以社会整体为对象,而是“以个人为中心的全方位数据,包括被采集对象的生活习惯、身体状况、社交、财务、喜好、情绪、行为等数据”为重点的数据库资源[19]。又如中国劳动关系学院图书馆建设的“中国工运文库”,以“一个馆藏”的理念,将多种形态的资源看作是一个馆藏整体,基于功能而不是载体进行资源建设,将印刷、数字等资源整合在一起,形成“一个馆藏”“一个服务”“一个体系”整体格局的模式[20]。此外,在普通数据库基础上有针对性地抽取知识点,并按照知识体系进行整序而组建的知识集成系统即所谓“知识库”[21],也成为近年来颇具影响力的数字服务手段。即对现有馆藏文献或数据资源进行更加个性化、专业化和智能化的发掘利用,已成为公共图书馆文献资源建设和服务的重要内容。此外,近年来公共图书馆为地方政府行政决策提供辅助性咨询或“智库”服务的案例不断出现,这是公共图书馆发挥知识资源和信息获取手段等方面的优势,发挥其文化价值和功能的重要方式[22]。一些图书馆在创建服务于企业的知识库方面也在进行积极尝试。值得注意的是,如何充分发挥图书馆优势,主动融入地方文化、教育、科技、经济等各项社会建设事业,仍是新时期公共图书馆需要不断思考和研究的问题。
广州图书馆“十四五”规划针对“大数据”时代的地方文献服务,拟定了“强化地方历史文化的研究性服务,梳理地方文献、名人专藏等特色文献资源,开展馆藏专题性学术资源的整理、开发和利用,形成知识图谱、数据库、专题书目等成果”“以对象化服务为导向,开展分类研究服务”等行动方案。这些行动方案的主要特点在于:其一,重视馆员的知识生产。亦即在文献资源建设过程中,重视发挥馆员的主动性和研究能力,推动文献资源建设和馆员创造性研究活动的结合。其二,追求知识生产与文献服务的统一。即除传统馆藏文献目录编制外,还推动馆员围绕馆藏资源开展知识图谱甚至专题知识库的建设等研究性工作和服务,实现专业性服务和一般性服务的结合,发挥馆藏资源的最大效能。其三,重视研究型服务,追求实现地方文献建设与文化建设的统一。一方面,从学术研究出发,根据学术研究的需要开展地方文献资源建设和服务机制设计;另一方面,馆员主动面向研究活动,通过属于但不限于图书馆学领域的创造性研究活动,参与和影响关于地方历史文化的学术研究。在此过程中,馆员通过知识生产将资源建设、管理和读者服务贯通起来,形成全视野的地方文献建设,不仅丰富了图书馆知识服务的内涵,也使图书馆本身进入到地方文化创新和文化创造活动中去。
在“大数据”时代,相对正式出版物而言,灰色文献在图书馆文献资源建设中的地位变得越来越重要。但因其定义范围模糊和文献种类复杂,面临类型切分繁杂和资源整合困难等各方面的问题[23],目前图书馆界对灰色文献的征集、管理和服务等仍较为零散、随机。广州图书馆的“十四五”规划,通过开展与地方文献、专题文献相结合的灰色文献建设,顺应了“大数据”时代灰色文献海量化和种类形式多样化等特征,进行了取舍有度、资源建设范围明晰,并且既能够形成和发挥灰色文献资源的规模效益,又能凸显灰色文献原始性、唯一性价值的灰色文献建设工作。此外,广州图书馆“十四五”规划还重视顺应“大数据”时代信息技术发展的要求,开展了地方文献建设与地方文化建设相互融合、相互推动的知识生产和知识服务,为公共图书馆构建与传统文献资源有机融合的、系统化的灰色文献资源建设体系和服务机制,进行了诸多具有创新性意义的探索和尝试,其实践值得各公共图书馆借鉴。