牵手CBDB,中文在线踏上数字人文征程

2018-07-09 08:36邢明旭
出版人 2018年4期
关键词:人文数据库数字

邢明旭

中文在线将与CBDB项目组共同打造中国古籍数据的数字人文资源平台,重构古文献研究服务新脉络。

不少重要时刻的诞生都缘自不经意的邂逅。正如2017年的深秋,大洋彼岸的美国哈佛大学校园内,一位中国访学者与美国教授的一次偶然相遇,不仅让两人成为志同道合的好友,更让CBDB(中國历代人物传记资料库)走进了中文在线董事长兼总裁童之磊的视野,并帮助这一由海外学者牵头、历时30余年打造的中国历史人文宝库得以漂洋过海,普惠更广泛的用户。

刚刚过去的3月,这一愿景在初春的上海迎来了它抽枝发芽的一刻。中文在线数字出版集团股份有限公司董事长兼总裁童之磊、哈佛大学费正清中国研究中心包弼德教授、北京大学中国古代史研究中心史睿博士齐聚沪上,共同签署了CBDB(中国历代人物传记资料库)项目合作协议。在不久的将来,中文在线将与CBDB项目组共同打造中国古籍数据的数字人文资源平台,重构古文献研究服务新脉络,并运用人工智能技术,提高处理历史资料的效率和准确度,聚合更多主题并不断优化用户体验。

“CBDB是现今数字人文(Digital Humanities)技术发展过程中的前沿成果,这与从诞生之初便以数字传承文明为使命的中文在线的愿景不谋而合。过去,中文在线主要在大众出版、教育出版两个领域谋篇布局。与CBDB的合作,则象征着中文在线在专业出版迈出的第一步。”童之磊指出,“中文在线有使命去推动CBDB的发展和传播,与更多有志于传承中华文明的同伴共建数字人文的新未来。”

缘起哈佛

在童之磊看来,人类文明和文化产品的发展经历过三个阶段。在经历了上世纪90年代从传统纸媒向数字化内容的转换后,如今人类文明的存续已经进入了全新的阶段——数字人文时代。

相较于单纯的纸本数字化,数字人文时代有何独特之处?“数字人文是用数字化的方式将人文资料进行重构,利用大数据、神经网络分析等数字技术,构建新的人文体系,这是未来非常重要的趋势。”童之磊告诉《出版人》。“其次,数字人文时代充分发挥信息技术的优点,跨越时空,对过去的人文资料进行高效的处理。这样的重构还创造了很多新的可能性,比如过去鲜有人考虑到的人文资料和地理信息的结合。所有这些,都让我们得以看到全新的人文浪潮席卷而来。”

从2000年创办以来,中文在线在过去的18年间成为了大量中国经典作品的传播平台,这其中包括巴金、莫言等文学巨匠的作品,也包括季羡林、启功等人文社科领域的大家之作。而在童之磊看来,未来中文在线很重要的一步便是在数字人文方面持续推进。

“在这个过程中,我特别荣幸地在过去一年的哈佛大学访学期间认识了包弼德教授,并深深地为他和CBDB项目组多年来的努力所折服。”童之磊告诉《出版人》。

在包弼德教授的介绍下,童之磊对于CBDB有了深入的了解。据悉,CBDB是由哈佛大学费正清中国研究中心、北京大学中国古代史研究中心、中研院历史语言研究所共同主持的学术数据库,该项目旨在将计算机技术与人文社会科学相结合,系统性地对中国历史上所有重要的传记资料进行数字化处理,以便采用社会科学方法研究中国历史。研究人员可以通过检索人物ID或人名(汉字或拼音),返回丰富的结构化人物传记资料(生卒、别名、地理信息,任官、亲属关系、社会关系等),即在以传统感性为主的人文学科研究基础上引入理性技术手段,将定量分析与定性分析融为一体,输出可视化的成果。截至目前,该数据库共收录超过41万人的传记资料。

“CBDB体量之庞大、内容之深入让我印象深刻,客观来讲,之前在国内鲜有类似的以人物传记构建的中国历史文化数据库。”童之磊告诉《出版人》,而更加令他感到震撼的则是包弼德接手CBDB背后的原因。“包弼德教授告诉我,在他学习世界历史时,中国是19世纪才出现的,该过程似乎就像人们发现了一个世界文明的旁支。这令包弼德教授非常震动,中国这样一个几千年没有中断的文明,却在西方的世界史研究架构当中出现如此之晚,且份量如此之轻。正是基于此,包弼德教授决定接受并延续CBDB的生命,让更多的人了解中国的历史和文化。”

“中文在线诞生以来的愿景,就是数字传承文明。很快我便认定,中文在线有使命来推动CBDB这项对中华文明意义重大的工程的发展和传播。”

助推CBDB普惠大众

牵手后,中文在线将为CBDB注入怎样全新的活力?在采访中,童之磊和中文在线研发中心常务副总经理朱厚权向记者做了详细的介绍。

“首先很重要的一点,便是CBDB的大众化。”童之磊说。“当前CBDB项目成果的使用对象主要是非常专业的科研人员,在易用性、合理化、友好性等方面还存在相当大的升级空间,这也是中文在线承接这个项目后首先要改进和升级的地方。”

“很重要的一个工作,便是增加简体版和拼音版。”朱厚权补充道。“另外,去年清华附小四年级学生利用大数据研究苏轼并写出一系列论文的事件受到社会的关注,中文在线也和该校老师进行了交流,设想如果在当时有CBDB这样的数据库可以提供给学生,类似的研究便会非常方便。”朱厚权说。“另一方面,数字人文研究人员需要大量基于B/S的定量和定性分析工具,以解决网络资源和本地资源的组合利用困境,因此为研究人员提供丰富、多样、易操作的分析工具、接口和方法也是重点。”

其次,便是多方关注的商业化。“CBDB过去更多地以非商业化的方式发展。这有其优点,却也使其面临如何持续、稳定发展的挑战。”童之磊指出,今天人类文明的发展很大程度上是和商业文明的发展并行的,没有商业文明的发展,不可能出现像苹果手机这样集合高科技和人性化于一体的优秀产品,正是因为商业的推动,很多科学技术才得以广泛地被使用,并产生巨大和持久的生命力。“中文在线要做的,就是把CBDB进行增值开发,为用户带来更大的价值,相信用户也愿意因此付费。”包弼德教授也对此次CBDB牵手中文在线提出了自己的想法。“学者没有能力进行商业运作,但‘中文在线可以。他们把学者打造的数据库,变成所有人都可以利用的工具,这点非常重要。这样学者就可以专注于学术,让商业和学术各自去完成擅长的部分。”

最后的落脚点则是创新。童之磊指出,中文在线希望在CBDB数据库中,重构古文献研究服务新脉络,创造研究历史人文的全新坐标体系。“通过时间、地点、人物三个维度,打造史学的三维研究空间,当我们确定三个坐标,便可以聚焦到每个事件,这是非常有意义的新型研究模式。”

而在具体落地方面,“我们一方面将努力扩大CBDB在国内的应用范围,并引入更多图书馆领域的合作方,充实CBDB数据库内容资源;二是提供一定的科研支持,吸引更多高端学术人才加入CBDB项目组;三是将CBDB的成果分用户层级地展示给不同的用户,如可以单独制作中小学传统文化教育中涉及的重要历史人物库,以方便中小学生用好、学好相关知识。”朱厚权告诉《出版人》。

对于CBDB的商业化引入,同时身为共建方和使用者的北京大学相关负责人也在接受《出版人》采访时谈及了自身的理解。“在传统的史学研究领域中,‘数字人文还没有得到广泛应用;而与中文在线合作后,除了希望把以前的工作做得更深入之外,也期待CBDB加入更标准化、更通用的工具,建成完善的‘网络基础设施,使数据库除了在学术上应用以外,也能推向公众,让普通人也更方便地了解中国历史人物的事迹、著作、生平等。”北京大学中国古代史研究中心副所长史睿如是说。

北大图书馆副馆长聂华表示,CBDB数据库在图书馆界久负盛名,是中国历史资料数据库的鼻祖,从各个方面来讲本次引入都很有意义,国内高校图书馆及公共图书馆对其的需求也毋庸置疑。而作为用户代表,面对数据库的商业化,聂华认为“从理智的角度看,商业化是正确的选择。多年来,各方专家学者团队,包括中文在线接手以来,都在该项目上投入了大量的人力和财力资源。商业化能够更好地维持CBDB继续健康地发展下去”。但聂华同时也指出,就最终的目的而言,希望能够让CBDB开发者、企业、使用者三方共赢,“只有共赢才是真正可持续的模式。”

在童之磊未来的愿景中,未来重新构建后的CBDB不仅面向国人,更要面向世界。“让全球无数有寻根诉求的华人以及对中华历史文明感兴趣的人们受惠,一起拥抱数字人文的新未来。”童之磊说。

猜你喜欢
人文数据库数字
人文绍兴
人文社科
让人文光辉照耀未来
数字变变变