马光华,夏 昕,张 文,刘为琼,雒 虹
(1.西北大学 图书馆,陕西 西安 710127;2.中国人民解放军空军工程大学 图书馆,陕西 西安 710000;3.中国人民武装警察部队特种警察学院 训练部,北京 100000;4.西安职业技术学院 图书馆,陕西 西安 710077;5.西安交通大学 图书馆,陕西 西安 710000)
新制定的“图书馆法规”对图书馆工作人员的数字人文素养与图书馆“数字信息资源建设”提出了新的要求,如《中华人民共和国公共图书馆法》(以下简称《图书馆法》)第八条规定:“推动运用现代信息技术和传播技术,提高公共图书馆的服务效能”[1];第十九条规定:“政府设立的公共图书馆馆长应当具备相应的文化水平、专业知识和组织管理能力……”[1];第四十条规定:“政府设立的公共图书馆应当加强数字资源建设、配备相应的设施设备……”[1]。《普通高校图书馆规程》(以下简称《规程》)第二十七条规定:“图书馆应注重建设数字信息资源管理和服务系统,参与校园信息化建设和学校学术资源的数字化工作……”[2]。以上“法律”及“规程”均要求:图书情报人员——文化资源之一“应当具备相应的专业知识与技能”“大数据知识、数字人文素养”与图书馆应加强“数字信息资源建设”,其前提是:图书情报人员的“数字人文素养”。可见“数字资源是图书馆信息化建设的核心……”[3]“信息技术的快速发展对图书馆的技术能力提出空前挑战……”[3]
当前,全国乃至世界的“抗击新冠肺炎(英文名:Novel coronavirus pneumonia,简称NCP)之狙击战”正在进行,产生及变化着的数据,是我们增强信心取得胜利的有力武器;同时也是我们制定科学决策的重要依据!对其进行统计与分析,是一应具备的知识和素养!我们已经进入大数据时代,“我们已经看到海量数据的爆炸式景观,特别是来自云端的数据……我们已深处‘大数据’时代”[4]。
当前的“电子文献”及“数字图书馆”之出现,掌握并加强“数字信息资源”建设至关重要,其知识与技术为当代图书情报人员之“数字人文素养”之必备,甚至为“应知应会”“数字图书馆的概念:随着计算机技术的迅猛发展,特别是网络技术、数据存储与传输技术等的全面普及,使得人们对文献信息的加工、存储、查询、利用等方面有了新的要求……本质功能是利用现代信息技术和网络通信技术,将各种传统介质的文献进行处理并转化为数字信息资源”[5]。依据上述有关《法规》的要求,应对“大数据时代”的挑战,结合长期的图书馆工作实践与研究,分析认为:今天,我们无论使用ATM机取款、预定航空与高铁等票,还是查询我们即将出行到达的目的地(异地甚至异国)的天气状况,以至我们在图书馆工作中查询有关文献借阅量、文献点击率等,都离不开关系数据库……;许许多多的东西需要用数据加以表示,用数学及统计学方式进行统计分析与计算——此举会使图书情报工作及研究更加严谨化、科学化、公正化、透明化,世界著名哲学家康德早就指出:“对于任何学科都是一样,数学成分的多寡决定了它在多大程度上够得上是一门科学”。例如:“公共文化服务均等化统计数据与分析?检全率与检准率之计算?文献增长率之计算?情报信息量——‘比特’的计算?读者与公众问卷调查之‘满意度’数据分析?农家书屋覆盖率?读者到书屋数字?图书馆的人员职称构成?学历构成?读者满意度?数据库被检索利用率?论文被转引率?工作人员及学生论文发表数?核心刊数?被引用率?工作量之统计细化?读者到馆率的多少?书刊利用率的多少?SCI的检索?数字情报信息(纯情报信息)与模糊情报信息”乃图书馆、科研情报部门科学管理的一种方法,或称科学管理的方法论——数字人文!其中,也含有《文献计量学》《数学》《统计学》及《大数据》等知识内容。早在1948年,世界著名图书馆学家阮冈纳赞(S.R.Ranganathan)就已预言:“由于图书馆工作与服务涉及大量的和数有关的问题,图书馆学工作者必须得效仿生物计量学、经济计量学和心理计量学来发展图书馆学的计量技术”。
数字人文(Digital Humanities)前身为人文计算(Humanities Computing),至今已有近50年历史。当前世界已有了不少的数字人文研究机构及教学部门,例如英国的伦敦帝国学院“数字人文系”,美国的加州大学洛杉矶分校的“数字人文中心”,日本的立命馆大学也有“数字人文研究中心”,台湾大学的“数位典藏发展中心”,武汉大学新闻传播学院的“数字人文研究中心”等。我们图书馆学界之核心刊物:《数字图书馆论坛》之研究内容之一,便是“数字人文”栏目。
作为一门新兴的文理交叉学科——数字人文,它是伟大导师马克思所预言的:“自然科学的滚滚洪流正奔向社会科学”思想观点的论证与结晶!它的发展得到了各个学科学界的关注和支持及其更进一步的研究!“数字人文对传统人文学术的渗透和影响并不仅仅是因为数学、信息科学、计算机技术等所谓强学科的辐射力所致……简要来说,是由于获取知识和知识传播的体系发生了改变……当下热词‘大数据’就鲜明地表明了这个时代的特点”[6]。
图书馆学的系统学科之一《文献计量学》及当前热议的“大数据”是数字人文研究中的内容的重要组成部分:“大数据对于今天史学在内的人文研究工作者的研究在方法和手段上提出了更高的希望和要求。一是资料库使用的门槛问题……另外,就是‘数据冗余’问题:例如过量的资料如何处理,如何让大量的资料产生新的意义……”[6]邱均平教授认为:“文献计量学、科学计量学和信息计量学……它的主要内容是应用数学、统计学等定量方法来分析和处理信息过程中的种种矛盾,从定量的角度分析和研究信息的动态特征,并找出其中的内在规律”[7]。
分析认为:世界发达国家关于“数字人文素养”之研究及设立专门机构、人员之教育与培训已有50年之历史,而我国图书馆界及科研情报部门“数字人文素养”研究较少,尤其是图书情报人员其意识不够强,致使该学科始终不够充实、完善,处于“冷落”状态,迟迟不能登堂入室……但是,当代各种状况,迫使图书馆界及科研情报部门“数字人文素养”研究及图书情报人员有关知识之掌握迫在眉睫、责无旁贷!数字人文素养也应包含科学数据素养,或有相互交叉、渗透之处及当前的“大数据素养”!“对高校图书馆来说,培养师生的科学数据素养,是一项紧迫而重要的任务”[8]。
叶继元之文章所论:“……1995年-2005年全国图书总量为1 696 766种。如果从中扣除自然科学类图书……根据最保守的估计,自然科学图书占30%的话……上文提到,‘30%说’认为2005年38 573种、2006年39 079种、2007年40 000种……这些学术图书的数据是通过2005年、2006年和2007年的初版图书总量乘以30%得出来的……”[9]
下面列举西北大学图书馆(1988年与2000年)有关数据比较分析,1988年,“西北大学图书馆:工作人员89名,高级职称7名,馆舍面积6 700m2,馆藏文献140余万册,外文图书15万册……”[10]
2000年,“西北大学图书馆:馆舍面积15 131m2,工作人员72名,高级职称10名,馆藏文献1 689 892册,外文书刊235 187本……”[11]
对两组数据进行分析,馆舍面积、文献量均增长;高级职称、外文资料数量也在增长;而工作人员减少——因为实现了自动化设备,印证了马克思一百多年前预言的“技术有机构成的提高,便造成大量工人的失业……”
从上文中,既看出了图书馆学专家叶继元的“数字人文素养”,也看出了对“西北大学图书馆有关数据”统计分析之结果及其重要性,同时得出结论:当代图书情报人员(包括任何公民)均应具备应有的“数字人文知识与素养”——“统计、计算、分析”等知识与素养。
简言之,图书情报人员的数字人文素养,即:有关数学知识、统计分析知识及大数据知识与素养之培训、培养与掌握,是加强“数字信息资源建设”的前提条件,图书情报人员的“数字人文知识与素养”的培训、培养势在必行。
现仅举一“检索事例”加以说明:一位某驾校校长来图书馆查阅有关“汽车上坡时,为增大牵引力而必须减速的原因?”——驾校理论课的要求。笔者直接告诉他:一部汽车的功率是一定的,而上坡时需要增大牵引力,就必须降低速度——物理学科学的要求。
公式表示为:
即:功率(P)=力(F)×速度(V)
结论:依据上述公式之推导可知:汽车功率(P)一定,当上坡时,为增大牵引力(F),就必须减低速度(V)——此乃科学的依据与解释。
上述这一例子说明:优秀的图书馆工作人员,应具备一定的“数字人文知识与素养”。同样说明:“数字人文知识与素养”的培养与培训势在必行。
国外不少大学成立有专门的数据管理机构,近似于数字人文管理机构,如,约翰·霍普金斯大学的Sheridan图书馆的数字研究和监管中心。有鉴于此,我国各大图书馆也应设立相应的机构,并由专家担任研究及咨询任务。
编写《数字人文知识与素养》之教材,对图书馆等部门在职人员进行“继续教育培训”,对在校专业大学生及研究生作为教材进行专业学习。
《数字人文知识与素养》的基本内容应涉及数学计算知识、统计知识、计算机基础知识、数据收集与分析知识、数据处理知识、文献分布形态等。
因此,教材之内容应包括:“数学基本知识”“统计学及其分析基本知识”“计算机基本知识”“文献计量学基本知识”“布拉德富定律”“大数据知识”“检全率(又称查全率)、检准率(又称查准率)、漏检率、误检率计算知识”,模糊数学知识,构建数学动态模型。
因篇幅所限,仅简论几部分内容。
①“检全率”(又称查全率:Recall ratio,简称R)的计算公式:
②“误检率”的计算公式:
③“检准率”(又称查准率,Precision ratio,简称P)的计算公式:
④“检全率、检准率、漏检率、误检率”之间的辩证关系:
A.加大“检全率”,势必增加“误检率”——“宁可误检一千,不可漏检一个”;
B.加大“检准率”,势必增大“漏检率”——主要取决于图书管理人员的知识与素质;
“检全率、检准率、漏检率、误检率”之结果,主要取决于图书情报人员的业务水平及数字人文素养,也是图书馆及科研情报部门“个人与组织”“工作优劣”的“数据性(数字人文素养)检验”。也是该部门科学管理——“奖惩与激励”的依据。
布拉德福为一位英国化学家,而在文献计量学中又发明了一定律:“文献分散之定律”,因此认为,布拉德富还可称为文献计量学家。依据邱均平教授所著文献,对该定律简述如下:假如某一学科领域有期刊124种,共刊载相关科学论文330篇。按照“布拉德富”论述的文献分散之定律,则第一区域中的“核心”期刊只有4种,第二区域中的“相关”期刊为4×5=20种,第三区域中的“边远”期刊数为4×52=100种,而每个区均应刊载220篇文章,具体如表1。
表1 文献分散定律
从表1可看出:各区域的单种期刊的载文量逐区下降;而各区域期刊数量则是逐区上升的;核心区域情报密度高,每种期刊平均载27.5篇论文,相关区域次之,每种期刊载5.5篇论文,外围区域情报密度最低,每种期刊仅刊约登1篇相关论文。
后经过维克利的研究,式:
(n1∶n2∶n3=1∶a∶a2,其中a>1)被推广为:
n1∶n2∶n3∶…=1∶a∶a2∶…
即把分3个区域讨论的文献离散规律推广到任意多个区的情况。
分析后,将其更加通俗易懂的表示为:
n1∶n2∶n3∶…=M∶M×a∶M×a2=∶…(M为正数数字;a>1)
仅引用专家所著一段文献内容加以简单说明——邱均平教授认为:“作为网络信息计量学研究对象的网上信息,可以分为3个层次:第一层次是以‘比特’形态存在的网络最基本的信息单元……第二层次是关于网上文献的信息及其相关特征信息……在第三层次上,网络信息计量学通过对网络站点或数据库等结构单元进行研究……”[7]
因篇幅所限,仅引用马光华所著文章的一段作为论述:
人们当前多用“比特”作为信息计量单位……再如甲队与乙队进行羽毛球单打对抗赛。双方如果各上4人,首轮的对手是谁呢?如果各上8人,首轮的对手又是谁呢?由4个当中来定一个所需的信息总量是2比特,由8个当中来确定一个所需的信息总量是3比特。依次类推,我们可以用数学公式表示如下:
指数表示法:2x=a
对数表示法:log2a=x
其中:x表示比特数,a表示用来确定比特数的选择数……我们可称此为数字化信息情报,或称为信息情报的数字化[12]。
即:若8名队员上场,确定首轮对手的信息量x的算法公式为:2x=8(8名队员);换成对数式为:x=log28=3(比特)
这是体育比赛中,两队势均力敌时,所采取的选派队员的一种策略。
上述这段论述足以说明:数字化情报、比特信息量的计算,在图书馆及科研情报机构的应用及其自身的严谨性。该内容也应编入《数字人文知识与素养》之教材中。更加需要说明的是:图书情报人员应具备基本的数学知识。
文献引文的分析,可反映出一系列有“血缘关系”及“脉络关系”的学术论点及科学论证的发展演变过程,也可以反映出科学研究与学术理论的进化过程,其之间的量化关系可以勾勒出科学研究与学术发展的遗传谱系图。
图书情报人员应是一名“博学”人才,对其培训时,建议还应选用已编两本教材:①《科学技术概论》——胡显章、曾国屏著,高等教育出版社;②《人文社会科学概论》——彭新武主编,首都经济贸易大学出版社。
上述两部教材可拓宽图书情报人员的文理工科知识面,使其建立合理的三角形知识结构之“博学”内容,即:中外图书情报人员还应具备合理的三角形知识结构,见图1所示。
图1 图书情报人员知识结构
此外,还应开设《数学》《统计学》《大数据》《计算机》《中华文化》等课程。
上述这些即为分析建议的所编《数字人文知识与素养》之教材及其所包含内容,要求《数字人文素养》教材既有严谨性,又有实用性。同时说明:当代图书情报人员及专业研究生、大学生等应具备数学及统计分析学、大数据及文理公管法等多学科基础知识。
简言之,培训培养的方式可采取:大学生、研究生在校的上述课程及内容培养和在职人员的继续教育培训。
继续教育培训是对培训人员进行回炉、充电的一种新知识培训方式,现已列入评定职称的“硬件”要求之一就是开设大课堂讲座。
数字人文素养之培训与教育,是一项系统的工作,人员队伍和组织机构建设是开展培养教育的前提条件,业界人们思想的重视也是前提条件之一,此项培训与教育是以图书馆及科研情报部门等为中心,以图书馆学界为教学及科研指导部门,以图书情报人员的科研成果及工作经验及读者的需求为内容之一,以广大读者为参与者,培训机构为执行者,以数学及统计学为支柱性学科。我国图书馆界“数字人文素养及教育”还存在以下改进之处:①“数字人文素养”的概念之理论层面还处在初期阶段,未形成完整的理论框架;②对数字人文素养的教育培训之重要性还不够重视;③数字人文有关知识及问题之调研还不能“主动出击”,只有被动应对;④数字人文研究与培训内容还不够完善。
大数据背景下,数字人文素养接近于数据素养,是当代人们,尤其是图书情报工作者及研究者——文化资源之一与在校教师、学生应具备的素养之一——“数据爆炸性增长,数据分析能力也在快速进步”[13]。数字人文,是数学、计算科学、统计学等与人文学科之间相互交叉、渗透的一门创新学科。对于以数据、信息、知识等为载体及存储、传播对象的图书馆等部门来说,有着重要的意义。因此,现今的图书情报人才培养及在职人员的继续教育与研究,更应该注重数字人文方面的内容及知识。数字人文素养,已成为当代图书情报工作者、图书情报专业在校学生、图书情报专业教学与研究者必备的素养之一,即:有关数学知识、统计分析知识及大数据知识与素养之培训与掌握,也是加强“数字信息资源建设”的前提条件。中外图书情报人员还应具备“高尖的图书情报专业知识及广博的文理公管法各学科知识”之合理的三角形知识结构。
关于新型图书情报人员的培养与培训,其探讨与研究始终“在路上”!“2017年12月国务院办公厅发布的《关于深化产教融合的若干意见》中明确将‘产教融合、校企合作’列为高校改革发展的重要任务。教育部也明确指出普通高校尤其是地方普通本科高校,应以培养应用型技能型人才为主要目标”[14]。