周 琼 胡礼忠 (上海外国语大学图书馆 上海 200083)
2011年6月17—22日,在美国斯坦福大学成功举办了“2011数字人文国际大会”(以下简称大会),本次大会的主题是“包容的数字人文”(Big Tent Digital Humanities)。对于“包容”一词,斯坦福大学的Matt Jockers和Glen Worthey①在大会主题发言前解释到:一方面是希望它能承载此次大会的不同意见和看法、各种实验和结果;另一方面,是因为这几年学术届对“数字人文”有所质疑,希望通过大家的不断努力,让“数字人文”在各领域都有所作为。
大会高效、严谨,所有与会人员对“数字人文”时代的到来都很乐观。这种氛围感染了笔者,也促使笔者深思:在信息时代,图书馆员如何才能让数字技术更好地为人文学科研究服务?笔者围绕这个课题在斯坦福大学访学期间进行了深入的研究,现将所思记录下来,与同行共享。
目前学界尚没有一个权威、可以让人信服的“数字人文”的定义,它的创始人布萨神父也只是在其著作中展望了它的将来,而没有做出具体的界定[1],但是我们从诸多关于“数字人文”的研究中可以清楚地感知到“数字人文”是什么。Unsworth教授在《什么是数字人文,什么又不是》一文中对“数字人文”给出了较明确的定义,他认为,“‘数字人文’是一种代表性的实践、一种建模的方式,或者说就是一种拟态、一种推理、一个本体论约定。这种代表性的实践可一分为二,一端是高效的计算,另一端是人文沟通。”[2]我们可以从以下几方面来理解这段话:
(1)“数字人文”是一门跨专业的学科 “数字人文”的研究范围广泛,包罗万象。斯坦福大学人文实验室的研究结果表明,“数字人文”是“研究文化与自然交叉的问题,超越了固有的关于艺术、科学、人文的分界,跨越学术、工业和大众层面”[3]。“数字人文”对从事相关研究的个人或团队提出了很高的要求,要求他们不仅懂得数字技术,还必须懂得人文知识。
(2)“数字人文”关注的是本体 “数字人文”带有浓厚的信息科学色彩。本体论约定原是从哲学家奎因那里借用而来的,计算机学和信息学将它转变成一种结构。本体论使研究者从自己感兴趣的领域出发,搜集一切材料,建立某种概念框架或模型,将所有的知识重新组织,呈现出新的作品。而本体论约定则是以一个概念为前提,从它出发继续探讨是否还有别的东西存在。由此可以看出,这是对“数字人文”的信息科学要求,即对人文学科知识进行搜集、整理并按照一定的标准建立一个框架,继而透过已知寻求未知。
(3)“数字人文”的每个项目都是一个具体成果的体现“数字人文”将每个思想碎片、每点思考的火花连接起来,形成一种知识表达。“数字人文”研究不能单靠人文学科本身完成,它需要数字技术参与研究过程,并得出有计算机色彩的(或者说数字色彩的)人文结论。“2011数字人文国际大会”开幕式的主题演讲者David Rumsey终生从事着利用GIS(Geographic Information System,地理信息系统)处理历史地图、在虚拟世界里还原严肃的学术资料的工作,他把自己多年收藏的150 000张历史地图捐赠给斯坦福大学,还将自己的研究成果全部公布在“David Drumsey历史地图藏品网”(http://www.davidrumsey.com/)上。闭幕式的主题演讲者Michel Jean-Baptiste 和Aiden Erez Lieberman演示了题为“利用数字化图书研究1800—2000年间的语言和文化变迁”的“数字人文”研究的精髓,他们建立了一个纸本图书数字化的语料库②,通过对这个语料库的文化趋势定量分析,侧重研究1800—2000这200 年间的语言和文化变迁情况,并从中观察词的演变、语法的变迁、集体记忆的变化以及对技术的采纳、对名利的追求、审查制度的变化、历史的流变等[4]。
可以看出,“数字人文”这个新兴的学术领域给人文研究注入了新的活力,它的出现并不是为了让人文研究者加快研究速度、提升工作效率,而是给人文学者提供了新的研究方法和范式。那么,作为参与者之一的图书馆员可以为“数字人文”做些什么呢?
“数字人文”研究对文献资源有很高的要求。图书馆员恰恰可以抓住这个机遇,在“数字人文”环境下充分发挥资源建设与整理的专长,在资源建设、数据库建设及技术应用方面有所作为。
高校图书馆的主要功能是支持和保障全校师生的教学、科研,而资源采购质量直接关系到馆藏能否满足师生的需求,因此有必要系统地开展馆藏资源建设。
2.1.1 采访政策考虑馆藏延续性
馆藏积累并非一日之功,它需要图书馆人的不断努力,而稳定的采访政策有利于馆藏集中、持续的增长。可以说,使采购人员工作的随机性更多地服从于理性的思考,是馆藏建设从经验管理走向科学管理的标志[5]。只有依据合理的采访政策建设馆藏,才能丰富馆藏。因此,馆藏采访政策应当随着学校的学科调整而做相应调整,从而为重点学科发展提供强有力的资料保障。
2.1.2 采访目标条理化
采访工作涉及多方参与,如何避免采访人员的主观性,将直接影响到馆藏质量。图书馆需要借助书商、教师、科研人员及采购主管的采访优势,鼓励多方参与,进行统一协调。
(1) 提高书商服务质量 目前国内高校图书馆的采访渠道主要是书商招标,由于以往在招标过程中对于书商提供的服务要求不够严格,缺少对图书质量的监控,因而处于被动的弱势状态。近年来,各高校图书馆均根据本馆的采访政策提高了对书商的要求。例如,复旦大学图书馆在每次招标前都会对书商进行评估,客观评价各书商的优缺点并将意见反馈给合作书商,这其实是对合作书商提出了隐性约束;上海外国语大学图书馆要求合作书商保证重点出版社的图书种类和到书率。同时,为获得竞争优势,各大书商积极行动,纷纷采取了有效的改善措施。例如,目前辽宁北方出版物配送有限公司推出《学科新品选目》(每10日发布1期)供图书馆参考,并为图书馆提供馆藏数据分析报告和专题推荐目录定制服务。可见,图书馆的积极举措使书商站在图书馆的角度提供馆配服务,提高了书商的服务质量。
(2)发动教师及科研人员的参与 “数字人文”时代,跨学科的研究越来越多,对馆藏的要求也越来越高,因此图书馆研究文献资源的采访工作需要广大教师与科研人员的参与。例如,上海外国语大学图书馆除了24个语言类专业外,还有12个复合型专业,随着复合型专业的增多,馆藏建设面临巨大挑战。教师的参与有助于图书馆从课程角度调整馆藏结构,不仅能使馆藏建设有效地支持教学,而且能增强图书馆员与教师的良性互动。同时,科研人员的参与有助于建设研究性馆藏,其专业的眼光能够保证资源的学术价值和前沿性,保证研究资料的完整性。Carole Palmer曾这样描述“数字人文”时代资源建设的图景:“学术性馆藏的建设者将是一类新的学者或者是团队,他至少要在3个方面都很擅长,即专题学术辅以学科评判与分析、计算机技术处理、内容的挑选与组织。”[6]可见,具有专业知识的研究者进入资源建设领域是多么的重要。同样,如果图书馆能协助研究人员收集并整理各类型资料,那么将形成非常有体系、有学术价值的馆藏,这也是十分让人期待的。
(3)采购主管 “数字人文”环境下的资源采购中,采购主管的责任就是用对每一分钱,保证本校教学和科研拥有充分的可用资源。这就要求采购主管应将注意力放在资金调度与采访政策的执行上,利用有限的资金购买更多的资源,审慎对待资源购买,协调各种资源的配置;对每份采购订单进行仔细审核,保证采购质量,并且定期进行馆藏评估,检查采访工作是否过度偏离采访政策。
“数字人文”较传统人文学科研究的一个最显著的区别是,“数字人文”的研究手段和研究对象需要数字技术的介入。但需要强调的是,“数字人文”并不是 “数字图书馆”。“数字人文”相较“数字图书馆”而言,更具备主题性。“数字人文”的研究资料可以部分来源于数字图书馆,但前提是要确定一个主题,并且在这个主题的要求下重新组织资源。目前国内很多高校图书馆正在建立特色数据库、开设教学参考平台服务,这在某种程度上亦是“数字人文”的体现。
2.2.1 加强特色文献数据库建设
特色文献数据库最能体现学校的重点学科,因此特色文献数据库立项时往往会充分考虑学科的师资力量、科研水平及多方的支持力度。例如,上海外国语大学图书馆于2010年开始建设俄罗斯文学特色文献数据平台,这个项目将来可以为俄罗斯文学研究者进行文本挖掘统计、语义分析研究等“数字人文”研究提供帮助。目前该平台已初步建成,上海外国语大学图书馆拟申请二期项目,设立关于俄罗斯文学的子专题,并围绕这些专题深入收集、挖掘资源,使其具备知识仓储功能、更加学术化,以便俄罗斯文学研究者利用。
2.2.2 开设教学参考平台服务
美国各大高校图书馆均建有“教学参考书架”,以电子平台的形式体现纸本图书的分类、馆藏。哈佛大学图书馆对此项服务进行了改进,由专业教师组织助教、研究生和图书馆员进行课程资料的收集,并将这些资料电子化后按照一定的框架组织发布到教学参考平台上,供学生学习参考。在这个过程中,参与者不仅贡献了自己的学识,也在团队的合作中提高了自己的学术水平。而且教学参考平台经过不断的更新,数字资源建设日臻完善,它既能反映课程的历史,又能体现课程的前沿理念。笔者曾观看到哈佛大学图书馆员马小鹤老师关于《胡笳十八拍》的资料收集、整理和加工过程,这是为该校东亚系一门关于古罗马和古中国文化比较的课程所整理的参考资料,其理念创新、成效显著,充分体现了图书馆服务的价值。
“数字人文”研究离不开计算机技术与信息技术的应用,尤其是信息检索技术,已成为“数字人文”研究的重要支撑。目前基于文本的检索技术已在“数字人文”研究中得到广泛的应用,但“数字人文”的研究目标并不局限于文本文件,还包括声音、图像等音视频文件。如何在众多类型的数字文献中实现统一检索,将是“数字人文”时代图书馆的技术研究重点[7]。除此之外,信息可视化、内容分析、机器学习、数据/文本/Web挖掘等技术也对“数字人文”的研究具有重大意义。图书馆技术人员可以在这些方面多加钻研,以迎合“数字人文”研究的需要。
“数字人文”研究在国外已有60余年的研究历史[8],虽然国内对它的关注时间不长,但是“数字人文”研究将以其实践性、包容性等特点赢得国内研究者的注意。图书馆员应把握机遇,找到适合自身发展的位置,在合作中发挥资源与服务优势,共同推进人文学科研究朝着更深、更广的领域发展。
注 释:
① Matt Jockers是斯坦福大学英语学院的讲师,主攻“数字人文”和爱尔兰文学,Glen Worthey是斯坦福大学数字人文中心的主任。
② 语料库通常指为语言研究收集的、用电子形式保存的语言材料,一般由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。
③ 机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,从而获取新的知识或技能、重新组织已有的知识结构使之不断改善自身的性能。
[1]林穗芳.罗伯托·布萨和世界最早用计算机辅助编辑的巨著《托马斯著作索引》 [J].河南大学学报:社会科学版,2007(4):167-174.
[2]Unsworth J. What Is Humanities Computing and What Is Not? [EB/OL].[2011-08-17]. http://computerphilologie.uni-muenchen.de/jg02/unsworth.html.
[3]Stanford Humanities Center[EB/OL].[2011-08-17]. http://shc.stanford.edu/research-lab/.
[4]Michel J B, Shen Yuan Kui, Aiden E L, et al. Quantitative Analysis of Culture Using Millions of Digitized Books[EB/OL]. [2011-08-17].http://www.sciencemag.org/content/331/6014/176.full.
[5]郑心清.试论图书馆文献评价[J].国家图书馆学刊,2005(4):36-41.
[6]Carole L P.Thematic Research Collections[G]// Schreibman S,Siemens R, Unsworth J. A Companion to Digital Humanities. Oxford:Blackwell,2004:348-365.
[7]张文秀,朱庆华,黄 奇.数字图书馆的未来[J].现代图书情报技术,2006(5):1-5.
[8]Hockey S. The History of Humanities Computing[G]// SchreibmanS,Siemens R, Unsworth J. A Companion to Digital Humanities. Oxford:Blackwell,2004:3-19.