赖茂生谈数字化时代的图书馆

2020-06-06 12:34赖茂生
晋图学刊 2020年2期
关键词:数字化图书馆信息

赖茂生

(北京大学 信息管理系,北京 100081)

0 引言

数字化时代,图书馆应该是个什么样子?怎么去发展?图书情报行业发展还有很多问题,我们应该如何去应对?相对来说,图书情报行业、专业有一定的封闭性。不仅是一栋大楼的封闭,在思维和活动范围上都有一定的局限。到了信息化时代,这样的封闭,实际上不是想不想突破的问题,外界大环境的变化就在打破这种封闭,打破这种界限、围墙。数字化大潮把我们裹挟其中,跟社会一起前进。原来的围墙、界限,慢慢地都不复存在了。现在比较流行的词“跨界”“跨界的发展”,我们发展不好,别人可能就会取代,跨行业、跨界来取代。这确实是一个现实的挑战。不仅是教学单位,业务单位、服务单位同样也是如此。这里主要讲到三个方面的内容:第一是大的社会经济发展趋势;第二是关于新技术特别是5G技术的应用前景;第三是数字化时代的图书馆。

1 社会经济发展大趋势

一个社会发展大趋势反应在很多方面,包括国内的,国际的,不同的领域都会有很多方面的表现。在这里侧重谈信息技术这一块,新一代信息技术的出现,对社会和经济产生了重大的影响。新一代信息技术的内涵主要体现在云计算、物联网、社交网、移动互联网、大数据、智能技术、5G技术等几个方面。其中包括近几年来非常热门的大数据、智能技术,还有5G技术。在新一代技术的推动下,信息社会进入到一个新的阶段,也就是所谓的数字化阶段,数字化时代。

1.1 信息社会新阶段的特征

信息社会新阶段有一些很明显的新特征,就是数字化、移动化、社交化和智能化,加上两个新的空间,即:Cyberspace(赛博空间)和信息-物理系统(CPS)。Cyberspace实际上指的就是一个网络空间或虚拟的空间。不仅仅是指互联网上的虚拟空间,它有一个重要的特征,在现实物理空间里有很多资源,在发现、利用等方面,都已经到了一个极限或者接近极限这样的地步。不管是物理资源还是空间资源,下一步要向何处发展?要寻找新的空间,比如人们要去寻找火星,要到火星上去发展,发现一个新的类似地球的空间去发展,也是一个思路。比较现实的还是把现在居住的空间和正在创建和发展的虚拟空间利用好。Cyberspace空间里,看不到它的边界,这个空间里的资源增长很快,越来越丰富。它已经成为新的竞争领域。

信息-物理系统,简称CPS(Cyberspace-Physical System),就是虚拟空间和现实的物理空间相融合形成的一个新的空间,如图1所示。这是一个三元的结合,从信息数据这个角度去看信息-物理系统如何将物理空间、赛博空间和信息空间连接在一起。

Fig.1 Concept map of Cyberspace-Physical System图1 信息-物理系统(CPS)概念图

CPS借助互联网的一些工具,把数据信息汇集起来。社会空间,借助社会网络等一些监控与手段,把社会数据汇聚起来,集成到一个空间里,就成了这样的空间。在信息空间里加以融合、分析、处理、再进一步加以应用、加以利用。如图2所示。

图3表示的是在CPS支持下的社会生产系统。左边是物理系统或物理空间的一些生产设备,右边是信息系统运行的各种基本东西,包括设备、工厂、人,还有制造系统等。通过互联网、物联网等系统设施连接起来,进行协同的交互运作。这样一个系统的信息物理空间里,形成一种新的社会生产系统。

Fig.2 Data connection in Cyberspace-Physical System图2 信息-物理系统中的数据联系

Fig.3 Social production system supported by Cyberspace-Physical System图3 信息-物理系统支持下的社会生产系统(来源: max.book118.com)

1.2 新一代信息技术促进社会观念的变革

新一代信息技术不仅催生和支撑着新的社会生产系统,还对一些基本社会观念的变革发挥很大的促进作用,促使人们的价值观、经济观、组织观发生一些重大变化。

1.2.1 改变人们的价值观、幸福观

体现在价值观上,人们的价值观、幸福观正在发生一些改变。比如,人们从事生产的目的,从原来主要为了生存,为了攫取利润,逐渐变为主要是为了创造幸福;体现在民生上,人们正在努力利用新一代信息技术去促进人与人之间的关系变得更加的和谐;体现在生态环境上,则是努力利用新一代信息技术去改善生态环境,使人与自然关系更加和谐。

1.2.2 改变人们的经济观

在改变经济观方面,主要表现为,新一代信息技术,特别是大数据和人工智能,正在推动生产者从消费者这个源头去识别产品的价值,而并非仅仅从生产的角度,而是从消费者的角度;经济活动的调节方式,也从原来的自由竞争,到政府的干预,再到现在更多的强调社会的协同;生产工具的改变就表现得更明显一些,从最早使用的分体工具(不管是工厂车间的工具,还是农村地头的工具),发展到一些大型的动力系统,再到今天各种网络形式的工具,如信息网络、物联网、车联网、移动互联网等,都是大的改变;经济伦理则从个人理性(看不见的手)到政府理性(看得见的手、国家调控),再到公共理性(指包括公民、各类社团和政府组织等在内的所有社会主体以公正的理念和自由平等的身份,借助新一代信息技术,在社会经济活动中进行广泛而充分的合作,以产生一种可以预期的共赢的效果)。

1.2.3 改变人们的组织观

组织是一种开放的社会技术系统,也是一种消除不确定性的机制。技术环境和制度环境对组织具有不同的影响。技术环境要求组织的内部结构和运行程序满足技术效率。信息技术正在改变组织的结构、形态和习惯,主要表现为:它简化了组织结构,减少了信息流通的中间环节,弱化了中间管理层的作用,使横向沟通和联系显得越来越重要和容易。结果就是推动组织结构的扁平化、网络化、去中心化、无边界化和内部市场化,产生了各种各样新的组织形式:任务型组织、非正式组织、以团队为单位的组织。如去中心化的社交媒体:维基百科、微博圈、微信群,以及各种依托网络平台的组织、内容中心型组织、话题中心型组织等。并促使去重视无组织的组织力量,重视以“湿件方式”(即知识、能力、信念、情感等)创建起来的组织。

1.3 新一代信息技术推动数字经济浪潮到来

以新一代IT为核心的新技术正在推动现有的经济体系向数字化转型。所谓数字化转型,就是利用新一代信息技术,构建数据的采集、传输、储存、处理和反馈的闭环,打通不同层级、不同行业间的数据壁垒,提高行业整体运行效率,构建新的经济体系。(国务院发展研究中心)对于企业来说,则是指企业对其业务模式、流程、活动和员工能力进行彻底地重新定义,彻底反思如何利用新技术去追求新的收入流和新的商业模式,并强调跨部门合作,使专注于业务的理念和快速的应用开发相配合,打造数字化生态链,提升竞争力。

经济体系的这种转型首先体现在以下三个基本层面上。

1.3.1 生产要素方面

与劳动、资本这些传统的生产要素一样,今天,数据、信息、知识已成为现实的、实实在在的生产要素。它们原来被人们作为副产品来看待的,现在已成为核心资产。很多机构和企业都把大数据作为核心资产看待。大数据使信息经济更加名副其实。过去信息经济更多的是靠硬件来支撑,然后软件慢慢地发展起来。但是还是更多地体现在硬件安装建设方面。现在大数据、信息、知识这样的经济,这样的要素,重要性越来越大。现在人们对资源的认识在发生变化,进入信息时代以后,人们开始慢慢接受信息也是一个重要的资源,社会资源,所谓“三大资源”的理念。现在人们的认识又在往前走了一步,认为三大资源的划分还不能反映现实,应该是“四大资源”,即要加上智力资源,其重要性正在凸显。智力资源不仅仅是指人脑子里的智力,还包括人脑外的智力资源,即人脑与外部的系统、技术、设备结合在一起形成的各种智能工具、智能体、智能系统。它们构成的智力资源将成为第四大资源。

1.3.2 基础设施方面

新的基础设施、社会基础设施,从原来的铁公机(铁公机就是沿路工艺,各种机械机器,就是我们过去从事经济活动主要的基础设施,简称为铁公机)到现在新的IT。新的信息基础设施包括:云计算、物联网、移动互联网、社交网络等。

1.3.3 新关系方面

在社会分工方面,在社会生产关系方面,也是发生了变化。从原来简单的分工,到现在强调更多的是共享、协同。强调服务化,强调消费者主导。平台经济的出现,导致新的劳动关系——自我雇佣关系,出现了所谓“第三方劳动者”。他们与平台之间的关系并不是雇佣关系,使得现有的某些法律法规的适用性成了问题。

1.4 数字经济发展概貌

数字经济有三个发展阶段,即信息数字化阶段、业务数字化阶段和数字化转型整体实现与优化阶段。对企业来说,其数字化转型也包含三个阶段:信息基础设施转型、数据利用机制建成、数字生态环境形成。信息基础设施转型是指由传统的IT架构转型升级为云计算+敏捷开发架构。数字生态环境形成是指数字化技术与业务深度融合,实现业务流程数字化、数据驱动业务和数据支持决策。

1.4.1 数字经济的主要特征

目前,数字经济的特征主要体现在以下四个方面:第一,是在生产要素方面数字化。将装备、产品、生产过程、管理、服务等信息转变为可以度量的数字、数据。可存储、可度量、可重用;第二,是生产过程方面自动化,是新一代的自动化,或者是这种超级动画。机器设备、系统或过程(生产、管理过程)在没有人或较少人的直接参与下,按照人的要求,经过自动检测、信息处理、分析判断、操纵控制,实现预期目标过程;第三,是在规模上体现了一种网络化,就是利用互联网技术来实现资源要素的互联互通、信息共享;第四,是体现在流程和操作层面上的智能化。建立在数字化、网络化基础上,具有自感知、自学习、自决策、自执行、自适应等功能,贯穿全流程、全产业链、全生命周期的系统化智能,使得效率进一步大大提高。

1.4.2 数字经济的类型

有人把这个数字经济归纳为两大方面:数字产业化和产业数字化,前者指各种数字技术设备(包括通信、计算机、软件和信息服务等)制造部门的产业化。后者指数字化技术和数据资源等“数字”要素渗透、融入其他产业部门后形成的新型经济形态。数字经济的具体类型,目前能看到的也很多,都是日常能看到,能用的。如表1所示。

1.4.3 数字经济的推动作用

数字经济的推动作用也非常明显。首先是对经济的推动作用,主要表现在三个方面:第一,它会推动消费需求加速释放;第二,它将促进新型业态的培育和壮大;第三,它能引领传统产业转型升级。

其次,更值得关注的是在更广、更高层面上的推动。在它的推动下,整个社会经济发展将呈现一些新的趋势。需要我们重点关注的方面是:第一,在资源禀赋方面,自然资源的重要性在下降,新型资源(人、知识、创新力)的地位快速上升;第二,国家重要基础设施走向虚拟化,这种所谓虚拟化,就是计算力、物联网、数据中心这些新的基础设施正在成为基础设施建设的重点;第三,经济形态呈现出融合和跨界,主要生产系统逐步实现定制化、柔性化,越来越多的标志性生产技术呈现智能化,数据分析和应用已成为新的生产力和生产方式;第四,行业和企业领域的竞争聚焦于开源生态系统构建,要构建自己的开元的生态系统。对于图书馆来说,它的生态系统是什么样?开源又是什么样?如何去构建?也是值得思考的问题;第五,在科技创新领域,开放创新和协同创新成为创新体系的主要特征;第六,在网络安全领域,形势依然很复杂、很严峻,国际竞争在虚拟世界中日趋激烈。昨天报道的北约,已经明确将网络空间视为战场;第七,就是在社会治理方面,多元共治将成为社会治理的新模式,目标是实现多元协同和透明化。

表1 数字经济的12大类型Table 1 12 main types of digital economy

2 5G技术及其应用前景

2.1 5G技术的主要性能

5G技术,现在国内外都变成了非常热的一种新技术,人们对它的期望值也很高。与目前我们普遍使用的4G技术相比,它的性能优势主要体现在6大方面:(1)体验速度(即实际上网使用的时候能体验到的速度)比4G大概要快10倍;(2)连接密度(即在一个单位面积里它能够连接的设备数或在线设备的连接数)大概是4G的50倍;(3)端到端(即从数据或信息的发出端到接收端)的时延比4G更小(被正确接收的时间也大大的减少),大概相当于4G的1/10左右;(4)流量密度(即单位时间传输的信息量)也比4G更大,达到10~100fbps/km2;(5)峰值速率更高了,大概相当于4G的20倍,10~20Gbps;(6)移动性更快,大概相当于4G的4倍。

5G的应用将推动以下三个方面发生转变和变化。一个就是由移动互联网向移动物联网拓展;第二是由消费互联网向产业互联网方向拓展,我们电脑目前还是属于消费互联网;第三就是加速行业和企业的数字化转型。我们图书情报实际上也是一个行业,也存在一个数字化转型的问题。5G技术是当代高新技术的制高点之一,它将为社会发展、民生服务提供新的动能,为数字经济发展提供强大的支撑。 但是大数据、人工智能、云计算、移动互联网、物联网,这些仍然是支撑5G应用的一个基石。这里强调了5G技术还是要和现在我们广泛使用的我们比较熟知的技术,要结合起来。

2.2 5G技术的主要应用场景

目前5G技术的应用场景主要有三类。第一类是增强移动宽带场景:连续广域覆盖场景、热点高容量场景,如超高清电视、利用虚拟现实技术的一些游戏、云端机器人等;第二类是要求低时延高可靠度的场景,如车联网、无人驾驶汽车等;第三类是低功耗大连接的场景,也称为海量物联网,如连接家庭各种家电的,环境监测用的,要连接的设备非常多。还有像森林防火方面,需要低功效而连接面积很大的,这样的场景5G的支持力更强(1)王志勤.5G与新媒体. 2019.11。

下面简单介绍一些与图书情报关系比较密切的媒体领域的应用前景。在媒体领域,5G技术的应用效果可能会更加明显。人们认为,5G技术将支持媒体实现“全维空间”的传播,促使媒体系统发生系统性的变革。因为用5G技术构建的新型基础设施,可以实现人、机、物三者的融合,真正形成一种万物互联。它的效果之一就是使得媒体的能力进一步增强或者大大的增强。包括媒体的采集能力、媒体的生产能力、传播能力,以及展现能力。效果之二就是使媒体的边界大大的扩展,使媒体和经济活动和我们日常生活更加密切的关联和交集在一起,形成一个万物皆媒的效果。第三就是“泛在媒体”,也将成为改善社会治理的一个重要工具。

2.2.1 5G+AI将支持媒体实现内容的智慧化生产

5G技术加上人工智能技术,有可能使媒体在内容生产上实现智慧化。目前,它的探索主要在以下三个方面:第一是“机器写作”,这样的功能已经初步实现了,已经应用到媒体的工作终端。像一些大的主流媒体已经开始使用这种终端来实现媒体内容的自动生产,如光明日报的“小明AI”,人民日报的“小融”“小端”等。第二是“媒体大脑”概念的出现,它是一种利用新的通信技术和智能技术构建的一种设施,如新华社的“媒体大脑”,中央电视台的“智媒体大脑”,都是借助5G技术来实现模块的远程连接,在一个平台上实现新闻线索的自动收集,对各种不同结构的媒资数据进行自动内容识别和智能转换,实现内容生产和审核的智能化、全国传播情况监测。第三是支持媒体产品生产全过程的程序化生产。生产流程设计将从围绕人的操作转变为围绕数据和算法匹配的操作。媒体的生产流程将被重塑成具有自我学习和改善能力、智慧的统一调度能力;内容生产和创意的大部分由专业程序完成。这就是所谓的程序化生产。现在有些新媒体如《今日头条》就声称实现了程序化生产。它声称其所用的算法是中性的,推送什么消息,消息怎么排序等,都不是人在做,是由软件、程序来做。然而,这实际上是商家的一种欺骗性宣称,是在推卸它的社会责任。因为,算法并不是中性的,算法是人设计的,人的立场、人的喜好会影响到算法,会嵌入到算法中。

2.2.2 5G和AI等技术的结合将全面提高媒体的传播能力

5G技术在提高媒体传播能力、效率、效果方面,将更为明显一些。首先,它将使媒体的传播业态、传播方式、内容的展现方式更多,内容分发会更精准。5G的高速传输能力可支持丰富的传播业态和内容展现方式,结合AI可实现内容的精准分发,让传播效果倍增;全程传播、全效传播和全员参与都有可能成为现实,或者说运作起来会更容易,以显著提高媒体的传播力、影响力、公信力和引导力。其次,它将使媒体选题、生产和传播等环节的时间大大缩短,让公众获得实时全维度获取信息的能力,借助AR/VR技术大大提高传播的冲击力和影响力;再其次,它将使同一平台能汇聚多种传播渠道,有助于实现新闻事件的全程报道,对受众的全程无缝覆盖,单画面多视角和多屏互动等效果,以大大扩展媒体的展现能力。

图书馆在某种意义上也是媒体,也在生产信息,在采集信息,在传播信息,图书馆也具有大众性,因为我们面向的不是小众,也是大众。不是所有图书馆都面向同样的对象,所以我们在如何借鉴参考现在媒体界对新技术、对5G技术这些技术的思考、探索和运用方面,都是可以做的。

3 数字化时代的图书馆

图书馆行业在数字化时代该是什么样的?我们自己的感受是什么?这个行业的前景是什么?我们应该思考些什么?在考虑诸如此类问题的时候,我们更应该考虑以下几个问题。第一,图书馆的使命是什么?是否改变了?第二,图书馆的资源优势是否还存在?如何发挥作用?第三,图书馆行业的专业(知识)优势是什么?如何能更好地发挥?第四,现在图书馆参与的数字人文研究也越来越多,图书馆如何开展数字人文研究和应用?数字化时代图书馆本来就是一个非常重要的人文基础设施,数字人文研究很对路。第五,馆员队伍的素质和能力如何进一步提升?

3.1 仍然具有(或潜在的)竞争力的领域

在考虑以上问题的时候,首先要客观评估一下,图书馆作为一个整体,它在哪些领域或方面还具有竞争力?或者是还具有潜在的竞争力?个人认为,从总体来讲,在下面一些领域,图书馆和图书情报机构还是具有一定的竞争力或潜在的竞争力的:

(1)文献资源的总体研究、类型(如特种文献)研究和管理;

(2)文献信息组织(信息构建)的理论方法和技术;

(3)信息存储与检索的理论方法及系统;

(4)信息服务和不同领域信息用户或读者的研究;

(5)信息计量学研究及其应用;

(6)学术交流的制度、结构及历史研究;

(7)知识图谱的研究和应用;

(8)数字化技术的应用,数字人文研究;

(9)竞争情报研究和应用;

(10)专利技术的跟踪分析;

(11)信息和公共文化政策法规和制度研究;

(12)信息资源管理其他方面的研究。

在这样一些领域或分支,图书馆作为一个整体,还是有一定的优势,或具有一定的潜在竞争力。

3.2 面临的现实挑战

图书馆面临的现实挑战也是非常之多。技术和市场的力量已经改变了图书馆与信息用户之间的关系。信息生产商和提供商直接对最终用户的营销,互联网上资源集成商和各种各样的专有的资源库的迅速发展,都对图书馆的传统角色构成了威胁。当然,各个地方各个图书馆面临的挑战可能存在一些共性,也存在一些差异、个性的东西。从整个的信息或者信息资源领域来说,我们面临的挑战大体上可以分为三大方面。

第一大方面是信息快速增长,爆炸性的增长所带来的挑战。在预算限制的范围内建立可扩展的基础设施。还有,就是可扩展的管理资源;第二大方面就是信息比以前更具有价值。在信息的价值方面,我们对它的认识,对他的重视比以前大大的提高,它带来的挑战以最优的费用去获得关键信息资产的访问和保护。这个问题怎么解决?还有,就是减少对各种规则违反的风险,各种违规的风险。第三大方面就是信息的价值随着时间的变化可能在加快,带来的挑战就是按照信息的价值来实现不同的信息管理策略。就是如何根据信息的不同时期的价值变化,进行不同的管理,使得信息的价值能够实现增值。

3.3 5G时代图书馆如何发展

5G时代,图书馆发展会受到什么样的影响?建议大家考虑一下,并尽早做一些谋划和准备。首先要做好顶层设计工作,包括理论准备,方法论和工具方面的准备。要建立数字化发展理念,调查评估自身的发展基础、实力和需求,研究和制定相应的发展规划和措施。在此基础上,侧重考虑以下几个方面的问题。

3.3.1 资源建设方面

数字革命有力地推动了信息资源的生产、传播和使用。它使出版成本降低,销售发行便捷,占用空间小,查询检索方便。在5G技术的支持下,这些优势将更加明显,图书馆需要充分地加以利用。如:智能的选书,与出版社和书商合作,实现预览式选书。先让出版商和书商把资源推送过来,在图书馆进行一段时间的预览之后确定是否订购。馆藏的概念和资源建设的基本原则更需要根据数字化的发展进程来调整。死守一些传统的理念肯定不行,需要建立新的大馆藏观念,不仅要重视电子馆藏或数字化馆藏,也要重视传统馆藏;不仅要重视馆内的馆藏,还要努力去挖掘和发现馆外一切有价值可利用的信息资源(包括机构馆藏或机构库、用户个人馆藏),建立交换利用的渠道和资源生态链。理想不等于现实。对似乎是无限丰富的电子信息资源的直接访问的美好许诺常常被夸大。数字革命发出的许多诱人的宣言并不能都兑现。“不求拥有,但求利用”的幼稚愿望,已被某些出版商和资源集成商的疯狂逐利行为和剥夺图书馆及读者权利的企图所嘲讽和击碎。

如何利用新技术去实现新的资源管理,资源的开发利用,使得我们馆藏的这些资源,不管是现代的还是历史的,能够跟读者、跟用户更好地连接在一起。对于博物馆来说,考虑的是能否实现历史和现实的对话?对于图书馆来说,要考虑的是馆藏的历史典籍的事件、人物等,和我们现在的读者,我们的用户如何实现这种对话,跨时空的对话。提供怎样的渠道,提供怎样的场景,来深度挖掘图书馆馆藏资源的价值。我们现在一方面喊资源短缺,一方面又天天受到信息的轰炸。打开手机一波一波的轰炸,但是真正有价值的信息,又感觉很难找到。图书馆原来的使命之一,就是要起到一个从众多的、各种各样的信息资源中进行价值鉴别,进行选择的作用。图书馆不是什么都收藏,不管是采购还是保存都是这种思想,图书馆的资源建设是有原则的,图书馆是要保存人类历史上有价值的信息的。所以图书馆在这方面起的作用,是可以继续发扬光大的,就是起到一个过滤器,起到一个把关,起到一个精准推送者、传播者的作用。

3.3.2 资源和知识组织方面

在资源和知识组织方面,如何利用人工智能技术,推进分类和元数据自动生成的逐步实现,是值得图书馆界重视的课题。早在20世纪八九十年代,在研究文献自动标引的过程中,我们也关注过编目自动化问题。就是探讨如何让编目工作在系统协助下自动生成编目记录。具体包括通过系统扫描编目对象(书名页等),自动识别和提取出图书的特征,然后进行一定的编辑和合成,形成编目记录。如果能实现,就可以让图书馆把人力、精力更多地放到一些更需要智能、更需要知识的服务和业务工作上。

与元数据自动生成密切相关的一项探索工作是编目规则的RDA化问题。自国际图联1998年发布FRBR(Functional Requirements of Bibliographic Records,书目记录的功能需求)研究报告,经过20余年的宣传、探索和推广,图书馆界的目录FRBR化进展缓慢。不由得人们怀疑这样做的可行性和价值。个人认为,图书馆不宜把过多的人力资源和精力放在编目工作上。编目工作应该走简化和自动化的道路。

3.3.3 服务方面

在服务方面,优良的图书馆服务植根于以用户(读者)为中心的服务价值观和态度中。学生来到图书馆,看书的占多少?看图书馆文献的占多少?利用图书馆作为一个场地写论文做作业的有多少?利用图书馆网络的有多少?还有其他的使用有多少?我觉得现在读者进馆,从他的广度、深度来说,实际利用图书馆都不如以前。往往可能被这样那样的一个新出现的信息拉走了,甚至是拉偏了。我们个人,我们成年人或者老人也有这样的时候,本来是想到这里来干什么的,结果被一个信息吸引,以后就把初心给忘了,不知道原来是来干什么的了,兴趣、注意力一下子集中到别的事情上了。对图书馆资源的利用,我觉得仅靠一般的阅读是不够的。图书馆很多的资源,一般的阅读实际上不能充分地体现它的价值。大家都很清楚,一本书在不同人的手里过一遍,个人的收获是不一样的。读者实际上也是这样,有人看了十遍,可能也没有把这本书有价值的东西很好地吸取。有人看了一遍,可能就把其中的精华学到了。所以图书馆可以做各种引导、指导服务,或者是协助。如何利用我们的经验,我们的专业知识加上新的技术,把图书馆的资源让它的价值得到更充分地发挥,这是不管处在哪个地理位置上,处在哪个地区,哪一个系统,这样的事情都是值得做的。

图书馆需要增强对社会技术变化的敏感度,从满足读者的需求出发,多想新点子,开创新服务,发展新的增长点,形成新的竞争力。资源发现服务在图书馆服务中将继续扮演重要角色。对于有大量电子资源的图书馆,集中索引式的网络级发现服务已是一种标配。开放链接环境下的定位服务,也已广泛用于解决二次文献库到原文及其相关服务的动态链接问题。还有,像自动导览,精准推送,放在服务区阅读等,有的地方已经在做这方面的试验。当5G逐渐铺开使用的时候,这些新的服务方式和服务场景,可能会越来越多,越来越完善。

3.3.4 数字图书馆方面

如何利用新的5G技术、人工智能技术等新的技术,再造一个或者多个数字图书馆?这种图书馆可以跟现有现实的图书馆,更多地体现为物理方面的图书馆结合起来。在物理图书馆的基础上,外挂一种虚拟的数字图书馆,建设一种新型的个人学习中心,适合个性化学习和发展的学习中心,这种可能还是存在的。因为未来的教育实际上是很强调个性化,在基础教育之外要强调个性化的教育,个性化的培养,就是未来教育重点强调的一个方向。为每一个人去设计他的学习场景、学习流程、学习研究等。实际上在基础教育阶段,个性化也是很重要的,因为基础教育的对象(小学生、中学生),他们的差异实际上也很大,个体差异很大。我们的教育也同样要考虑个体差异,除了把共性的东西做好之外,尽量考虑个体差异。

图书情报界对信息化应当说是比较敏感的,或者说曾经是比较敏感的,可以说醒得早,起的早。图书馆也是很早就去拥抱新的信息技术,包括计算机,所以图书馆的机器编目、MARC、自动标引、自动索引等,在上世纪50年代初就开始探索。上个世纪开始探索,但是几十年过去了,近一二十年,步伐慢下来了,这方面的敏感性变弱了。特别是信息技术发展很快,信息应用领域的发展非常快,图情界跟着技术的步伐慢下来了。特别到了数字化的阶段,我们如何跟上这样一个时代,甚至说能够起到一定的引领作用,这个任务还是相当艰巨的。

3.3.5 数据管理方面

数据管理,图书馆要不要切入到数据管理这个方面?要不要承担这方面的任务?要不要承担这样的责任?这方面也需要考虑。数据管理涉及两个重要概念。

(1)Linked Data

曾经提出过万维网架构的蒂姆·伯纳斯·李,还提出了另外一个概念,叫“Linked Data”(关联数据),实际上就是Web上结构化数据的链接和发布的最佳实践集合。其基本思想是把Web的一般架构应用于全球性的结构化数据共享的任务。这是90年代提出来这么一个概念。

“关联数据”提倡数据就像目前网络上文档共享的方式那样共享数据,可以使用户在基于关联数据规则的数据网络上创建混搭应用。其主要特点就是将不同来源的数据和信息关联起来。数据和信息可以来自某个机构的不同系统,也可以来自不同机构的不同系统;内容、存储地点和方式完全不同的也可能存在关联,如Amazon 上的图书可能与 MySpace 上的人之间可能存在着某种关联,例如某图书作者可能在 Myspace 上注册了账号。“关联数据”的一个主要优点是采用分布式,允许用户发布自己拥有的数据,并被其他用户发现和重用。

应用方面,美国联邦政府环保署2013年就把所拥有的数据发布为关联数据,内容包含了它所管理的130万个设施(从干洗设备到核电厂设备)的数据和以往25年有毒化学物质的排放报告。通过链接,这些数据可以与化学物质数据库、OpenStreetMaps、 DBpedia 等网络数据库的相关内容关联起来。美国一个医疗机构开发了“天气与健康”的Web与手机应用程序。它通过关联汇聚了国家医学图书馆、国家海洋和大气局(NOAA)、环保署和 DBpedia 的相关数据,可以为患者提供实时相关信息,有助于提高一些慢性病的医疗效果,并减少医疗保健资金的浪费。

瑞士洛桑联邦理工学院也启动了称为“Linked Books (2015-2018)”的数字人文项目。它利用引文来研究威尼斯的历史,希望能将数字档案与数字图书馆中的内容连接起来。它开发了一个自动抽取系统,目的是要从有关威尼斯历史的大量书刊中抽取出引文等数据,并要对引文与原始文献之间的关系进行分析,建立索引网络和相应的导航网页。

(2)Data Curation

“Data Curation”,不同领域的人对这个术语有不同的理解和译法。科学网发的一篇有关生物信息学的文章把它理解为“数据审编”,某新浪博客文章把它称为“数据典藏”,某图情博客文章称之为“数据监管”,也有译为“数据策管”的。北美和欧洲一些国家的图书馆比较重视它。我觉得统一称之为“数据管理”就可以了。它的基本含义主要是指为实现研究数据的长期维护所需要的各种管理活动,目的是使得数据得以妥善保存和被重用。

在科学界,它一般指从科技文献(包括研究论文、电子表格等)中提取重要信息的过程和方法,也包括对某一领域中能在一定程度上体现其现有的知识状态的可信数据集合体的维护,如数字化存档和数字化保存的过程,以及创建和管理良好的数据集合,为创造新的信息源和知识源提供增值服务。因为研究过程常常需要验证、重复、链接和共享科学数据,要从现有数据中发现“新”知识。而研究数据又是一种高投入、易损失和不可替代性宝贵资源,科研管理部门和研究基金机构认识到从数据产生伊始就需要对其进行管理和促进再利用的工作,包括进行持续性的补充和更新,以使数据符合用户要求,所以都有强烈的数据保存需求。美国伊利诺伊大学香槟校区(UIUC)认为“Data Curation”就是依据生命周期原理对有价值的数据进行动态的和“On-going”式的管理,使数据可以被发现、检索、维护、增值、随时重用,包括验证、存档、管理、保护、检索和展示。广义上说,它是指对研究过程和结果中的有价值的组成部分(元素)的创建、管理、维护和评价所要做的一系列活动和过程。

在图书馆界,Data Curation=图书馆学的专业知识和技能+某个学科领域的专业知识及其数据集合。运用图书馆的知识组织理论方法、工具和经验,为科研数据或其他专业领域的数据提供元数据和数据组织及长期保存等增值服务,使宝贵的数据资源得以妥善保管和维护,并可以被人们便利地搜索、访问和重用。这是图书馆的新角色新任务。约翰.霍普金斯大学图书馆2009年就获得美国国家科学基金会(NSF)2000万美元支持,用于研究、设计Data Curation架构,目标是实现跨学科观测数据的发布和维护。初期研究集中在天文、地球科学、生命科学和社会科学领域的数据。

(3)数据开放和管理

数据管理的必要性和意义越来越明显。首先,使用公共资金产出的数据,包括科研数据和一些社会调查等方面的数据,政府运作过程当中产生的数据,应当被视为公共产品并得到良好的管理,以供第三方评价、解释和重用,增加科研的透明度和质量,去提高政府运作的透明度和效率。其次,这种数据的开放管理有助于与其他数据跨越时空地关联或整合起来利用,通过这种关联和整合,增加对协同研究和跨学科研究的认识和实践,以推进这方面的工作。第三,可以减少数据收集的精力和相关成本,使数据可以被标引和科学组织,进而便于被发现、浏览和查询。

今天,“数据是资产”,甚至是核心资产的观念,已经广为人知,或者是渐渐地被越来越多的人接受。但是,如何管理数据资产?目前仍缺少成熟的理论和工具手段。面临着很多问题,包括什么是数据资产?怎么样去管好数据资产?都是一个很大的难题。首先,资产的确认问题,资产权属的确认问题。目前在法律上还没有明确规定。其次,这种资产在会计意义上该如何确认,更难。所谓会计意义上的确认,就是怎么能记入到资产的账上,记入到公司的收入和支出账上。它不像物理资产,也不像一些无形资产,人们已经摸索出一些可行的管理手段,包括像专利的管理,商标的管理,商誉的管理,这些无形资产现在都有一定的会计计算的一些指标和方法。但是,数据和信息目前还缺少很合适有效的理论和方法。总之,数据管理方面实际上有很多的事情值得去思考和探索。一些图书馆在这方面仅仅是起步,还有很多问题挡在我们面前,需要去思考,去解决。

3.3.6 智库服务方面

智库服务也是当前图书情报界一个热点。对图书馆来说,智库服务实际上并不是今天才有,传统的参考咨询服务,实际上可以理解为智库服务的一种形式,或者是一种组成部分。在这个基础上发展到近些年来的,目前在大学图书馆和科学图书馆推行的学科馆员制度,实际上也是传统的参考咨询服务的一个发展,是图书馆服务深入到学科,应该在更专业化、更主动、切入得更深、发挥的作用更大的一个方向上延伸。而社会上的智库服务,一些图书馆也在探索,在尝试做一部分工作。对于这个,大家怎么看待?比如在科技情报界,有一种很强的声音,说科技情报所应该就成为一个智库。当然也有不同的看法。我认为,科技情报所的一项重要功能就是情报分析、情报研究,智库服务的道路可以是其发展方向之一。但是,情报分析、情报研究并不是科学情报所业务的全部,科技情报所还是要走包括智库在内的多元化的业务发展道路。对图书馆来说,资源、基础条件比较好的图书馆有条件发展智库服务。但就总体来说,发展智库服务对图书馆来说挑战很大。因为,要成为规范的、高水平的智库,其门槛是很高的。这可以从一些智库评价指标看出其挑战性有多大。

现在中国的智库热引发了智库评价热。提出了各种各样的智库评价指标,归纳起来主要有三类指标:资源、产出和影响力。资源指标主要包括:吸引和留住领先者和分析家的能力;承担重要或重大研究项目的情况;筹资能力,财务支持力度和稳定性;与政策制定者、政策精英及媒体的关系;人员从事严谨研究、提供及时精准分析的能力;网络的质量和可靠性等。产出指标主要有:提交给立法机关和行政机关的专家证词和意见数量和质量;参与或组织各级政府规划研究和起草情况;出席各级政府的听证会、咨询会的情况;政府任命和雇用情况,所谓政府任命,认为你是智库的人,即做顾问或者做什么别的,政府的某方面的人员;论文和出版物的数量和质量;创新理念和政策建议的数量和质量;接受新闻访谈的情况;组织和参加会议或研讨会的情况等。影响力指标主要是:政策建议被采纳情况、领导批示、政府简报报道;在政党、竞选人、官员或政府运作中起到的咨询作用;对舆论的引导力、挑战传统智慧的成功率;媒体曝光率、被引量、网站点击率、公众关注度状况;国际影响力等。

当然,这些评价指标不一定都合理或合适。仁者见仁,智者见智,有不同的评判。我认为,作为图书馆,要想达到其中大部分较为合理的指标还是很不容易的。所以,开展智库服务要实事求是,把它摆在适当的位置,努力去做,但不能孤注一掷。比如“领导批示”这个指标,对智库来说可能是合适的,但是对于一般的学术评价来说,是否合适呢?现在国内的学术评价也很重视“领导批示”,特别是大领导的批示,甚至规定有大领导批示的成果效力等同于SCI论文,很值得商榷。不同领导的风格是不一样的,有人喜欢做批示,一天可能要批很多;也有人不喜欢做批示。可见,领导批示是受领导人的风格、执政的风格、管理的风格影响的,与他的个人品性、性格有密切的关系。领导批示了,不一定就说明该成果水平高有创新。也可能表明你关注的问题是对的,值得重视,你做对了。像这样一些指标,从图书馆的角度都是很难获得的。所以,图书馆在智库服务方面,还是要发挥自身的特色,利用图书馆的传统资源或者图书馆传统的优势资源,以及图书馆对新技术和信息资源的全面掌握和利用的能力,去开展有图书馆特色的智库服务。

3.3.7 数字人文研究和实践方面

数字人文研究国内外都很热。在国内,图书情报界的热度甚至超过了人文科学界。南京农业大学沈振萍、黄水清认为我国的数字人文研究处于三多三少的困境,即:追热点的论文多,有实质意义的成果少;非人文学者关注多,人文学者关注少;泛泛议论多,成功案例少。怎么去看待?怎么去做?有些问题值得思考。美国斯坦福大学英语和比较文学的讲席教授弗朗哥·莫莱蒂(Franco Moretti)的观点也值得我们重视。他致力于文学方面的计量研究或者定量研究,创立了斯坦福文学实验室(Standford Literary Lab)。他把数字人文研究界定为“数字时代针对文学和文化史的科学的、解释性的、经验性的、理性的……研究路径所采取的形式”。

人们认为,当前数字人文研究还处在这样一个阶段:数字人文研究目前仅提供了某种新的、比传统人文经典大得多的档案库和某些新的、更快的计算程序,还缺乏新的概念、理论探索和指导。并认为,只有在理论框架、阐释模式方面的变化发生转变,才能让数字人文研究发生根本的变化。否则,其价值就将始终令人怀疑。现在数字人文领域盛行的是简单的实证主义和数据驱动(data-driven)的研究方式。理想的数字人文研究应是理论驱动的、数据丰富的,不仅能够检验、证伪,挑战现存的人文研究知识,而且还能够创造出新的人文概念。这是对现在的人文研究的一个基本评价。

他山之石,可以攻玉。下面给大家介绍一个案例,历史学家的数字化探索方面的案例。让大家看一下相应的学科领域、人文学科领域的学者、专家,他们怎么开展数字人文研究,将数字化技术和自己的学科研究结合起来。2018年我们在北京组织了一个读书会,请中国社会科学院专家王旭东先生报告了他的研究团队的一项成果。这个案例就是他的研究团队开展的信息史学研究的例子。他们的研究成果2019年下半年才在《中国社会科学》上发表出来[1]。该团队在对历史学的概念和知识体系进行梳理和研究之后,试图把信息科学的概念和手段引入到历史学中,从视角上要进行转换,以信息视角看待历史,还要实现观念上的转换,以信息观念标识历史;再有认知方面的转化,以信息认知理解历史;最后实现理论上的转换或转变,以信息理论和方法论诠释、表达历史,分析史学、元史学与信息之间的抽象层次关系。图4就表现了这种历史学的转变,即信息转向。如图4所示。

Fig.4 Thinking path of History “information turn”图4 历史学“信息转向”的思维路径

然后,重构一个新的史学框架,即所谓的信息史学框架。它分为三个部分:第一个是核心部分,指的是基本理论研究方面,包括历史哲学;第二个是中间环节,指方法论的研究方面,具体指历史学与信息科学、信息化应用技术结合的方法;第三个是外延拓展方面,指史学领域各类具体理论与实践。这就是历史学领域开展和数字化结合的数字人文研究的一种模式,也可以把它称为“数字史学”。社会科学以前也常讲转向,比如哲学的语言学转向。现在历史学讲的是信息转向,重视信息学科,重视历史和信息的关系。它有很重要的借鉴意义。

读书会上很多读友对王旭东先生他们的探索非常感兴趣。我也在现场发表了一下感想。觉得我们国家历史学家在这方面的探索很好。我个人也比较早地关注了这个领域,在2003年就收集到一本国外的一个综述性文献,两卷本,它的题名就是“历史信息学”,是美国《情报学年评》的一个专题。它把近几十年间历史学领域内的利用信息技术、利用信息的研究做了一个比较全面的综合评述。我把里面的内容和王先生他们所做的工作做了一个比较,发现中国社科院的研究还是比较深入的,深入到了历史学的里面去了,而不是仅仅在手段、方法的层面,涉及到了史学的重构、重建,所以我觉得这是一个很好的很值得我们学习和借鉴的经验。

4 结束语

图书馆作为一个历史悠久的文化机构,兼有儒家、道家和杂家的文化传统。儒家历史上出身于司徒,历来以顺应自然、宣明教化、辅佐朝廷为己任,尊六经,重仁义,宗道统。思想易保守,害怕变革。道家出身于史官,以记录历史成败得失和保管典籍为己任,主张清净无为,知道秉要执本,保持谦虚低调。思想偏于虚泛,行动上喜无为而治,倾向于消极避世。杂家出身于议官,兼儒、墨,综名、法,认为治国理政需要兼听各派的主张,学问要百家贯通。此派易思想杂乱、散漫,抓不住核心。这样一种文化属性和传统,难免会影响到数字化时代的图书馆。我们需要一种扬弃的态度,发扬传统文化中积极的东西,抵制、抛弃其中消极的东西,守正创新。

最近我在安徽高校图工委办的《大学图书情报学刊》上发了一篇文章,探讨了学科发展空间问题。现在这方面的共识也越来越多了。我们学科发展空间应该是越来越大,我们要抓住这样的发展机遇。我们的专业,我们的学科在这方面有些东西做得不够深入,不够系统。特别在学科建设方面,专业话语的重建,学科概念和知识体系的重构,我们还不太重视,有点忽略了,没有做太扎实。我们好多的研究,往往因为在话语的不一致,概念理解上的不一致而陷入一些无意义的争论上。你那么理解,我这么理解,发一通议论,写一篇大文章,很多让外学科人觉得不可理解。认为你们什么都有了,博士点、一级学科等等都有了,为什么还要讨论这样的问题?我们在信息化或者是数字化建设方面,系统性方面还是欠缺比较多,话语体系、概念体系、学科体系的重建方面,我们考虑不够,做的不扎实。使得我们这个学科还处在一个徘徊,很难前进的一个境地。

作为一名馆员,自己的成长道路如何去选择?方向和机会如何去把握?都很重要。在这样的岗位上,不能蹉跎,不能放任时间流逝,努力在业务中、工作中学习,多在实践学习,多向一些有经验的老同志学习,跟图书情报界的一些老专家学习。此外,还要关注新的发展、新的动向。经过自己的努力,自己的学术发展,自己的发展机会、发展道路,都可以很好地把握。外面的机会很多,可利用的资源很多,只要你有心,只要你能够把精力放在合适的地方,你的人生境遇是可以改观的。要重视个人的学习、深造,把自己的学习,把自己的发展与整个事业紧密地联系起来。没有事业,自己的学习、自我提高的价值、动力是不一样的。人要有事业心,有明确的奋斗目标,有各种各样好的环境来支撑,一辈子不能白过。

猜你喜欢
数字化图书馆信息
家纺业亟待数字化赋能
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
图书馆
订阅信息
数字化制胜
展会信息
去图书馆
健康信息
健康信息(九则)