肖超
(作者单位:陕西师范大学)
数字人文(Digital Humanities)起源于1949年的人文计算(Humanities Computing)概念。随着数字技术(Digital Technology)的发展及其应用,人文学科引入大数据、文本挖掘、虚拟现实等技术来进行研究,因此形成了一个将计算机技术应用于人文学科的新兴的跨学科研究领域——数字人文,它为人文学科研究提供了新的研究视角。[1]
数字人文研究在世界范围内发展迅速,英国伦敦国王学院等高校设置了数字人文研究中心,国际数字人文组织联盟(ADHO)每年召开一次“数字人文国际会议”。在我国,数字人文研究方兴未艾,数字人文实践项目也在如火如荼开展。北京大学等高校主持了“中国历代典籍总目”等数字人文项目,武汉大学等高校相继成立数字人文研究中心,北京大学图书馆多次举办“数字人文论坛”。经文献调研发现,国内外学界对数字人文的研究集中于图书情报学、历史学、计算机科学等学科领域,主要着眼于图书馆数字人文服务以及数字人文在历史学领域的应用。目前,国内外学术出版机构已开展数字人文服务,而学界针对出版社数字人文服务的研究却很少。
大学出版社的学术出版资源和数字出版技术,为大学出版社数字人文实践提供了内容和技术基础。在出版社由出版向知识服务转型的新形势下,大学出版社占据得天独厚的学术资源,开展数字人文服务有很大优势。本文在对剑桥大学出版社进行调研的基础上,探析剑桥大学出版社的数字人文服务,以便为我国大学出版社数字人文服务提供借鉴。
剑桥大学出版社是隶属于剑桥大学的非营利机构,成立于1534年,是世界上历史最悠久、规模最大的大学出版社之一,致力于提供最好的学习与研究解决方案,以帮助人们释放潜能,推动全球学习与研究的发展。
剑桥大学出版社长期致力于提供数字人文服务,本文将探析其10种主要数字人文产品:莎士比亚纵览在线(Shakespeare Survey),剑桥版本·琼森作品集在线(Cambridge Edition of the Works of Ben Jonson Online),剑桥档案编研系列在线版(Cambridge Archive Editions Online),剑桥历史在线(Cambridge Histories),奥兰多(Orlando),非洲书目在线(Africa Bibliography),剑桥指南(Cambridge Companions),剑桥手册(Cambridge Handbooks),爱尔兰传记词典(Dictionary of Irish Biography),美国历史统计在线(Historical Statistics of the United States)。
莎士比亚纵览在线于2006年上线,是有关莎士比亚研究和创作的在线年鉴。莎士比亚纵览在线收录了1948年以来全部年鉴的数字版。年鉴每卷专注于一个主题、一部戏剧或一个剧本,还附有学术批评以及表演的综述。莎士比亚纵览在线以服务学术研究为宗旨,收录的许多作品成为莎士比亚研究领域的经典之作。在内容上,纵览编辑部每年拟定一个固定主题,面向学界征文,作者须向编辑部提交英文文章。在技术上,纵览在线具备检索、创建阅读列表和书签等功能。
莎士比亚纵览在线主要面向莎士比亚研究者,这种专业性极强的数字人文产品紧密围绕用户需求,将传统出版资源与数字技术相结合,在数字人文类知识服务中做出了成功尝试。
剑桥版本·琼森作品集在线包括本·琼森作品、生活档案、文学档案、旅行档案、音乐、随笔、参考书目、年表、博客等内容,是一个可检索的数据库,为研究者提供先进的数字人文服务。
剑桥版本·琼森作品集在线收录了文艺复兴时期剧作家本·琼森的所有作品,作品文本数据由印刷本和手稿数字化而来。除了印刷本和手稿数字化数据,剑桥版本·琼森作品集在线还收录了一系列纪录片和档案材料,以及相关的研究分析文本。据统计,完整的在线数据库包含大约100篇作品文本、500篇补充材料、80多篇分析文本、数百张高清图片、500部演出影片、220个音频以及交叉链接的参考书目。
剑桥版本·琼森作品集在线的突破性成就在于为未来的学术出版物开发了可重复使用的数字基础设施,这套设施可用于处理数据、生成最终产品等一系列数字出版流程。在剑桥版本·琼森作品集在线的构建中,先前的数字学术出版技术得到了增强。作为一个结构复杂的数据库,剑桥版本·琼森作品集在线提供了强大的检索功能。用户可查询整个语料库或其任何子集,可按照字符、位置、人物、日期或主题元素来浏览文本。其中,题内关键词检索(KWIC)功能将实时自动显示与关键词上下文匹配相结合,实现了智能检索。
剑桥档案编研系列在线版可回溯到1827年,是一个经英国国家档案馆授权,纵贯19世纪到20世纪文献档案的数据库。剑桥档案编研系列在线版提供130余套、超过1 000册、近700 000页的原始文献资料,具备全面的检索功能,可在线完整呈现印刷版本的全部内容。
剑桥档案编研系列在线版与东方视讯信息服务(East View Information Services)合作,所有原始资料,包括地图等,均通过East View电子书平台进行数字化处理。通过定制的数字平台,研究人员可即时访问数据,检索所需的研究材料。剑桥档案编研系列在线版提供800余张高分辨率地图,具备按特定标题或主题浏览、放大尺寸阅览、创建个人典藏等功能,还支持机器音译检索和虚拟键盘。
作为档案文献数据库,剑桥档案编研系列在线版不仅将档案资料进行数字化后形成数据库,还提供了检索和导航功能。除收录历史档案外,剑桥档案编研系列在线版内容涉及地图等领域,为用户提供档案知识服务,是一种新型的档案类数字人文产品。
数字历史一直是数字人文的重要领域。剑桥大学出版社利用该社历史类品牌学术图书资源,在剑桥史学丛书数字化的基础上,开发了剑桥历史在线项目。1902年首次出版的剑桥史学丛书,是在全球范围内备受推崇的学术丛书,涵盖15个主题领域,300多册,研究主题集中于政治和文化史、文学、哲学、宗教研究、音乐、艺术等人文科学领域。剑桥史学丛书为历史学分支学科领域提供了学科全景图,成为学习和研究历史的必备图书。
剑桥大学出版社将剑桥史学丛书数字化,形成剑桥史学数字典藏,为历史学者提供了无与伦比的学术资源。剑桥历史在线中的电子书提供作者、标题和主题等检索字段。用户可通过元数据和全文检索,导航到章节内容。单独的章节能够以PDF格式下载。此外,剑桥历史在线将参考文献数字化,支持OpenURL兼容,并可通过CrossRef在线链接。
奥兰多是一个专注女性写作的数据库,为女性写作研究者提供了知识导航。用户可通过数据库了解作家的生活和写作、大事记和相关参考书目。数据库提供姓名、关键词等多种检索方式。以姓名为例,用户不仅可以根据作家的职业、流派、地区等进行简单检索,还能以多个检索字段进行组合检索。
非洲书目在线是关于非洲研究的权威性指南,汇集了自1984年以来每年在国际非洲研究所主持下发表的有关非洲研究的成果。非洲在线综合版本为所有对非洲研究感兴趣的学者汇集了印刷版中的每一条记录。非洲书目在线提供哲学、宗教学、人类学、考古学等学科领域内容,可以根据作者或编者姓氏、标题、关键词、期刊名、地区、国家、主题、文献类型、出版时间等字段进行检索。
剑桥指南是由一流专家撰写的一系列权威性指南,对主要作家、艺术家、哲学家提供生动有趣的介绍。剑桥指南包含剑桥文学与经典指南,剑桥音乐指南,以及剑桥哲学、宗教和文化指南等三种类型。
剑桥文学与经典指南共计375种,收录了多种文学流派作家的数千篇文章。剑桥大学出版社聘请专家将作品以章节或主题进行分组,并对后期作者的影响进行评估。剑桥音乐指南收录72种图书,内容主要是作曲家、乐器等信息,由学生、表演者和音乐爱好者共同编写。剑桥哲学、宗教和文化指南收录218种图书,为跨学科学生和非专业读者提供了参考文集。论题范围从柏拉图、康德到哈贝马斯,涉及苏格兰启蒙运动等哲学思潮。
剑桥手册为语言研究等人文学科领域提供了学科导航。以语言学领域为例,剑桥语言学手册囊括了剑桥认知语言学手册、剑桥地区语言学手册、剑桥历史语法手册等语言学主题领域。剑桥大学出版社将手册按照章节进行数字化,为读者提供细粒度[2]的数字出版物。读者可按照知识元检索,根据学科、主题、出版社、出版时间等浏览剑桥手册在线数据库。
爱尔兰传记词典是目前出版的关于爱尔兰的最全面、最权威的在线传记辞典。它包含超过9 000篇传记文章,主题包括宗教、文学、新闻、绘画、音乐等人文学科。作为一部权威的在线工具书,爱尔兰传记词典为爱尔兰文学和历史研究者提供数字人文服务,支持用户根据姓名、性别、出生日期、地区、职业等字段进行检索。
美国历史统计在线是一种数字历史研究类产品,从学术文献中搜集历史统计数据知识元,通过数字技术进行数据处理和数据知识组织,为人文学者提供历史统计数据分析与可视化服务。
“美国历史统计”长期以来一直是美国历史量化指标的标准来源。美国人口普查局在1949年、1960年和1975年分别出版了第一版、第二版和第三版。在美国人口普查局的许可下,剑桥大学出版社以在线数据库形式提供美国历史统计的第四版,也被称为千禧年版。美国历史统计在线数据库内容完全由作者和出版社编辑负责采集,其中的数据可用于制图和统计分析。
经过对剑桥大学出版社数字人文产品的具体使用与考察,笔者认为剑桥大学出版社数字人文产品的成功经验主要在于:多种知识组织方式并用,学者型的编辑团队,与图书馆、研究机构和学会合作,技术和研究人员保障。
英国图书馆学家布利斯(H.E.Bliss)在1929年提出了“知识组织”概念。知识组织是对知识因子和知识关联进行重新组织,以便形成新的更有意义的知识。知识组织的具体方法有知识表示、知识重组、知识聚类、知识存检、知识编辑、知识布局、知识监控七种。[3]3剑桥大学出版社数字人文项目采用知识聚类、知识重组等多种知识组织方式。
剑桥大学出版社莎士比亚纵览在线和剑桥版本·琼森作品集在线采用知识聚类组织法,将莎士比亚和本·琼森的作品采用人物聚类的方式加以类集和序化,以在线数据库的方式满足研究者的查阅需求。
知识重组是对相关知识客体中的知识因子和知识关联进行结构上的重新组合,形成另一种形式的知识产品的过程。[3]4非洲书目在线即采用知识因子重组的方法,对非洲研究相关知识因子进行序化,形成有关非洲研究的在线书目系统。在书目编撰过程中,并没有产生新知识。剑桥大学出版社将非洲研究相关文献经过整序、压缩和数字化,形成在线书目系统,为研究者提供文献检索和内容服务。剑桥大学出版社开发的剑桥指南则是知识关联的重组。在剑桥指南这一数字人文产品内容生产过程中,编辑团队聘请专家对原有文学艺术作品进行学术评价。例如,剑桥文学与经典指南由文学研究者将主要作品根据主题进行分组,并撰写对作者文学作品和流派的评价。这样,文学作品、艺术作品等知识因子被专家进行了分析和综合,生产出剑桥指南这一更高层次的在线知识产品。
剑桥大学出版社建立了学者型的编辑团队,聘请相关研究领域中的知名学者担任项目编辑,保证了数字人文服务的顺利开展。
莎士比亚纵览在线设置了由莎士比亚研究领域学者组成的编辑团队和顾问委员会。纵览上的每篇文章由编辑和顾问委员会的至少一名成员进行同行评审,保证了文章的质量。纵览实行主编负责制,每一卷都有固定的主题。例如,第71卷的主题是“重新创作莎士比亚”,第72卷的主题是“莎士比亚与战争”,第73卷的主题是“莎士比亚与城市”。在确定主题后,剑桥大学出版社面向学者征文,所有征文均发送给主编,由主编来审稿并分配同行评审。可见,数字人文编辑必须是相关学科领域的权威学者,否则无法胜任具体的学术编辑工作。
项目编辑制是剑桥大学出版社数字人文项目的一大特色。奥兰多数据库最初由三位项目编辑负责构思。项目编辑不仅与团队合作开发奥兰多数字人文数据库,还承担了其他研究和管理责任。奥兰多三位项目编辑均是著名学者,项目编辑之一的苏珊·布朗(Susan Brown)是加拿大写作研究合作实验室主任,另外两名项目编辑是阿尔伯塔大学教授。同样,美国历史统计在线也聘请三位学者担任项目编辑。作为学者,项目编辑认同量化方法对于历史学研究的重要性,确保了数据准确性和文件清晰度,进而成功运作了美国历史统计在线项目。
在数字人文研究方面,针对文本与数据挖掘(TDM)研究,剑桥大学出版社与剑桥大学图书馆、剑桥大学数字人文中心合作了文本与数据挖掘测试(TDM Test Kitchen)项目。
文本与数据挖掘测试项目旨在探索文本和数据挖掘方法在剑桥大学出版社和图书馆馆藏中的应用,为剑桥大学出版社、数字人文中心研究人员和图书馆馆员学习和分享创造交流环境。项目研究涉及知识产权、数据访问、语料库创建、高性能计算(HPC)设施访问、数据可视化方法和软件可持续性等问题。
就具体数字人文项目而言,剑桥大学出版社的数字人文项目奥兰多不仅得到了阿尔伯塔大学图书馆等大学图书馆的支持,而且聘请伊利诺伊大学和伦敦大学学院图书馆与信息科学教授担任顾问,听取图书情报学界关于数字人文的建议。美国历史统计在线与斯坦福大学图书馆合作,图书馆为编辑团队提供了参考咨询服务。
剑桥大学出版社数字人文项目还积极与研究机构合作。爱尔兰传记词典就是剑桥大学出版社和爱尔兰皇家科学院之间的一项数字人文合作项目。在数字人文项目美国历史统计在线制作过程中,80多位来自高校和研究机构的学者参与了数据收集、文章撰写等工作。
与学术组织合作也是剑桥大学出版社数字人文服务的一项特色。数字人文项目美国历史统计在线与经济史协会、气候学协会和社会科学史协会三个学术组织进行了学术合作。学会会员在美国历史统计在线的数据采集、产品开发、版权转让等方面做出了重大贡献。
数字人文产品的成功研发离不开数字技术和数字人文研究。先进的技术团队和研究人员为剑桥大学数字人文产品提供了保障。剑桥大学出版社数字人文项目奥兰多编辑团队与技术人员密切合作。编辑团队提出项目需求,技术人员在此基础上开发了项目数据结构、项目管理工具和交付系统。奥兰多的技术人员不仅完成了核心技术、界面设计、技术设备购置工作,还为编辑团队提供了很好的建议。
数字人文项目也聘请研究助理,保障项目研究。奥兰多项目聘请了项目研究助理和博士后研究员。研究人员将数字人文、计算社会科学等方面的最新研究提供给项目,协助编辑进行数据采集、数据库架构、项目评估等工作。同样,研究人员也为美国历史统计在线这一数字人文产品的建构提供了极大帮助。美国历史统计在线聘请了65名研究助理,编辑团队举办了项目规划会议,邀请历史学、统计学、计算机科学等学科领域的研究助理参加。研究助理撰写项目研究论文,在社会科学史学术会议上发表,从学术层面提供了反馈建议,帮助改进了美国历史统计在线最终产品。
结合剑桥大学出版社数字人文产品开发思路,笔者总结了其对我国大学出版社数字人文实践的启示。我国大学出版社应注重培育数字人文编辑,建立多方合作的机制,让大学出版社成为数字人文研究枢纽。
数字人文是典型的跨学科领域。文学、历史、艺术、计算机科学、图书馆学、信息科学等研究领域学者参与数字人文研究和实践,均可被称为数字人文学者。在数字人文领域,数据与计算科学被大量运用,出版业务与数据之间的联系更加紧密,“数据出版”成为建立在学术出版基础上的一种新型出版模式[4]。出版社编辑不仅要处理选题策划、组稿、审稿、同行评议等业务,通过高质量的编校工作和同行评审为出版物增值,也要面对海量数据,处理数据库和在线出版业务。满足数字人文学者的出版需求对传统出版物编辑来说具有挑战性。在数字人文环境下,出版社编辑要做一个“数据管理者”,熟悉数据管理理论,能够娴熟处理科研过程中产生的海量数据,尤其是掌握数据监管、文本挖掘、地理信息系统(GIS)、数据可视化等关键技术对数据进行处理。
大学出版社应在现有编辑团队中培养复合型的学术编辑,加强编辑的数据管理能力。数字人文产品编辑不仅要有较为深厚的人文学科的知识沉淀,还要熟悉现代数字技术,掌握科研软件操作、数据库构建、特定程序语言编写等相关知识。在数据密集型科学模式下,大学出版社也可以通过招聘计算机科学、信息科学领域的数据科学家来充实编辑队伍。
数字人文产品建设是一项庞大的工程。大学出版社应与图书馆、基金会、学会等机构以及学者合作,协调各方利益,建立共赢机制,保证数字人文项目的顺利开展。
首先,大学出版社应与图书馆合作。在数字出版环境下,大学出版社与图书馆在开放获取、数据管理、机构知识库[5]建设等方面开展了深入合作。大学出版社为图书馆提供了电子书、数字期刊等数字资源,在开放获取、同行评审、数字知识构建等领域为图书馆提供了保障。然而,图书馆在数字人文实践领域走在前列,在创建元数据、建立目录、开发和优化索引以及信息组织和维护数字馆藏等方面具有丰富的经验,建成了多项重大的数字人文项目。许多大学图书馆在数字人文实践领域走在前列。我国大学出版社应利用高校的优势资源,与高校图书馆深入合作,吸收图书情报领域数字人文服务的经验,共建数字人文项目。
其次,大学出版社应与学者合作。高校学者本身就是大学出版社的作者资源。作为高校的学术出版机构,大学出版社在与高校学者合作上具有先天优势。大学出版社可召集高校文学、历史、哲学等人文学科以及计算机科学、图书馆学、情报学等相关学科的学者开座谈会,为学者提供数字人文工作坊或培训课程,向人文学者普及数据库等数字技术,向计算机学科学者普及人文学科的知识和需求,促使人文学者、计算机科学学者、图书情报领域学者的深度合作,推广基于数字人文的学术研究,使得大学出版社成为人文学科学者和计算机学科学者沟通的桥梁。同时,大学出版社也应听取人文学科、计算机学科、图书情报学科学者的建议,进而建立满足学者知识需求的数字人文产品,更好地为学者服务。
再次,与基金会合作。大学出版社应学习国外数字人文项目与基金会合作的经验,建立起大学出版社数字人文项目资助体系。就我国而言,大学出版社可与学者合作,申请国家出版基金、科技部重大研发计划、国家自然科学基金、国家社会科学基金等项目,为大学出版社数字人文项目提供资助。同时,大学出版社也应在基金会资助下,支持数字人文研究。
跨学科合作是数字人文项目共同的组织特征,不同学科由于在学科文化、研究范式上存在差异,因而容易造成学术沟通困境和技术沟通困境。作为学术出版社,大学出版社掌握人文科学、社会科学、自然科学、技术科学等不同学科的作者和读者资源,可成为不同学科学者在数字人文研究和实践中交流互动的重要枢纽。大学出版社学术编辑与学者有着密切交流,在学者学术职业建立和发展过程中起着重要作用。编辑可以联系不同学科学者,加强数字人文学者之间的对话,促使大学出版社成为数字人文研究和实践的中心。我国大学出版社应建构以大学出版社为中心来开展数字人文项目的模式,加强在数字人文实践领域的探索,开展面向数字人文研究的知识服务。