探索国学走向世界的数字化途径

2017-04-06 07:13张楚乔张立华
现代交际 2016年15期
关键词:走向世界国学数字化

张楚乔+张立华

摘要:本文对如何运用数字化手段实现国学走向世界的新途径进行了积极的探索,论述了国学古为今用是中为洋用的前提——要想“走出去”,先要“走过来”,提出了以类书学和辞典学为理论基础,以主题词和关键词为索引条目,以足资借鉴、堪为引用的语段为核心内容,以多语译释、中外比较、智慧人类为终极目的的国学辞鉴语料库编纂创想,总结了二十多年的编纂探索经验,给出了以高性能现代化搜索引擎ElasticSerach(ES)为基础的数字化平台实施方案,列举了多个优于传统搜索的特性。既有宏观的理论意义,又有微观实践价值;既有广泛的实用性,又有切实的可操作性。

关键词:国学 数字化 走向世界 引用 按需索引 多语译释

中图分类号:G649.2 文献标识码:A 文章编号:1009-5349(2016)15-0211-03

国学是中华文化的主干,历史悠久,5000多年;典籍品种,20多万。[1]然而当今世界文化主流中,中华国学所占的比重实在太少。因而我们应该认真分析原因,找到问题的症结,研究解决的办法,使这些宝贵的文化遗产真正走向全世界。要想使国学真正走向全世界,首先必须让国学走进当今的中国社会,国人如若不能真正深刻地意识到国学对我们的重要性,那么国学走向世界则是空谈。笔者拟从内容上论述国学如何走过来;从方法层面阐述国学数字化是其走向世界的新途径。

中华国学典籍庞大,限于时间和精力,我们只能汲取和借鉴其中很少的一部分。这就给我们带来了一个问题,那就是什么样的国学典籍内容应该走过来,必须走过来,如何走过来。这需要我们按照一定的标准将国学典籍进行系统的鉴定整理,对系统筛选整理过的国学典籍进行今译今释。

一、国学典籍内容的甄选

(一)粹选语段 致用为本

国学“包括上下三四千年的过去文化”,既有国粹,也有“国渣”。 [2]要想使国学为今人所喜爱,就必须突显和发挥其使用价值,也就是说要对今人有用。因此,国学精华的粹选也要以致用为本。

任何历史悠久的伟大民族,都有其宗奉敬畏的规范德行的经典,它是民族凝聚力的核心,堪称民族文化的基因。国学中具有这种意义的经典称为经学,经就是由古圣先贤探索发明,被后世哲人广泛认可的宇宙人生之道。正所谓:“经禀圣裁,垂型万世。” [3]粹选这类内容的主要目的是揭橥大道,规范德行。中华国学的经书不可偻指,仅《四库全书》经部就收录了经学著作1773部,20427卷,内容极为丰富。

致用的另一个目的是学习知识,借鉴经验。前人积累的知识经验,可以使后人避免重复探索,少走弯路,这是人类得以飞速进步的根本原因。前人积累的这些知识经验,主要依靠文字传承下来。随着造纸术和印刷术的发展,特别是数字化出版的来临,文字作品数量激增。一方面受阅读能力和水平的限制,大量的国学书籍被束之高阁。这是人类最大的浪费——经验智慧的浪费。另一方面,由于写作出版的便利和国学素养的江河日下,许多新出版的国学书籍质量一落千丈,甚至产生了大量的国学垃圾,从而导致了人们对前人经验智慧学习借鉴的低效、无效甚至负效。应建立国学辞鉴语料库,收录国学中的经验智慧信息,做到内容广博,数量庞大,而且效度经典精当,凡不具有借鉴引用价值的普泛知识信息,概不阑入,力求做到应有皆有。

致用的第三个目的是研训启智,培养能力。人类进步虽然得益于对前人知识经验的学习和借鉴,但这并非终极目的,终极目的是启迪智慧,培养能力。而能力主要是指理性认知能力(即逻辑思辨能力)、说写表达能力和阅读鉴赏能力。国学辞鉴语料库内容的收录标准就是按照是否有利于培养这些能力来甄选的。

习近平主席指出:要“科学对待文化传统”,“不忘历史才能开辟未来,善于继承才能善于创新。优秀传统文化是一个国家、一个民族传承和发展的根本,如果丢掉了,就割断了精神命脉。我们要善于把弘扬优秀传统文化和发展现实文化有机统一起来,紧密结合起来,在继承中发展,在发展中继承。” [4]而建立国学辞鉴语料库的目的正是为了对优秀传统文化的科学继承。

(二)索引链接 开放平台

粹选出致用的丰富内容只是国学数字化的基础,接下来就是对这些海量信息进行科学的索引,读者可以按其所需,一检即得。早在1933年,胡适先生就提出对国学要进行“索引式的整理”。1946年6月,王云五先生在“中央大学”发表演讲时也曾指出:研究国学,“莫如编制和利用”索引。“各项资料之索引,按照字体和笔画排列,一旦有所应用,则过去若干年读书所得之资料均荟萃于一处,比诸专靠记忆,易致模糊,或临时检书,茫无头绪者,其功效不是大有增进吗?”王氏把这种工作比之于“贯珠成串” [5]。英国作家、文学评论家、诗人塞缪尔·约翰逊(Samuel Johnson)说:“为了写一本书会折腾半个图书馆。” [6]这是因为需要借鉴引用的材料不集中、不便检索的缘故。如果有了《辞鉴》这个数字化网络平台,问题就迎刃而解了。

国学辞鉴语料库建立的独创性主要表现在它所收录的条目的体例编排上,而体例上的关键则是条目的排列与索引的编排。“索引之法,以一定之顺序,部勒紊乱之资料,其为事近于机械,而其为用可补上智才士之所难能。”[7]就查找的便捷来说,“只有按照字形或字音检索,才便于应用。” [8]但这种检索的前提是要有科学的拟目,如果只是像类书那样分类拟目,那只能是类目的查找比较迅速,与具体内容信息的查找无关。如果是对内容的所有字词进行“字形或字音检索”,目前数字化搜索引擎毫无问题,但这种检索远远不能满足查阅者的需求。首先,查阅者必须知道自己所要查找的字形字音,否则就无法进行。其次,即使查阅者知道自己所要查找的字形字音,也很难便捷地查到自己所需要的信息。譬如你键入一个词语,结果会出现一大堆带有该词语的信息,仍然是大海捞针。再者,通过搜索引擎查找的资料基本上仅限于带有查找字节的信息,不带查找字节的信息就不容易查到。加之国学的典籍材料多是文言,查阅者很难知道自己在文言中应该查找哪個词语,如果只是用现代的词语去查找,那十有八九是查不到的。这对条目的拟定是一个巨大的挑战:收入索引的词语条目少了,查的人就可能与目标信息失之交臂;收入索引的词语条目多了,一个条目下许多信息无用,徒然浪费很多查阅的时间。

国学辞鉴语料库要收录的条目是以语段中的主题词和关键词作为索引的条目,主题词是揭示语段核心意思和中心思想的词语,关键词则是语段中主题词以外最重要的词语。拟目分主条目和辅条目,主条目是指从所选语段中提炼概括出来作为词条的主题词或关键词等,主条目的词语一般来说在普通辞典中都是作为条目出现的。辅条目是由主条目分化衍生出来的二、三、四级条目,是在主条目的基础上增加若干修饰限制等词语而成的,是主条目的细化。它既可以使条目的内容更加清晰具体,更有条理,更便于检阅,又可以节省篇幅,减少查阅的时间。有的语段中没有出现主题词,如果只把它列在关键词下,那么使用时在相关的主题类词目下就查阅不到,所以要为它另行提炼概括主题词语等作为条目。这样,抓住了主题词和关键词,就可以做到既不遗漏信息,又能节度篇幅,从而真正提高查阅的效率。

条目的索引编排,是借鉴了类书学、辞典学、文章学、写作学、分类学等理论经验编纂而成的经纬纵横的综合科学索引:既有音序索引,又有字形索引;既有主题词索引,又有关键词索引;既有时代索引,又有作者索引;既有类别索引,又有相关条目的提示索引等,它较好地解决了上述问题,基本可以做到按需查找,一检即得。

二、国学内容的诠解与多语译释

国学要想“走出去”,先要“走过来”,就是让国学从古代走到现代来,使今天的国人能够读得懂、用得上。因此,我们必须首先做好国学的今译今释。

学术界对于国学经典的今译今释重视不够,矻矻数年译释的一部古书分量往往不及论文的发表来得重要。其实,国学的诠解殊非易事。古代儒家经典都是经师硕儒终生研究,师徒薪火代传,故其学说能够世尊罔替。由于国学的博大精深,国学辞鉴语料库对所要收录的语段的诠释不是一般性的今译今释,而是综合译释,荟萃历代各家的精校正义和指瑕辨误等研究成果。经过这样的整理,读者自可辨识真伪,了悟真谛。

多语译释只是国学语料库的理想目标,目前还只限于英译。国学英译当以“信达”为本,“信”而不“达”,则不懂汉语的人读了就不知所云,“虽译犹不译也” [9];“达”而不“信”,则传达了错误的信息,不如不译。国学英译“信达”的前提条件是国学今释的“信达”,即是说,译者自己首先要对所译的国学内容清楚明白。目前国学典籍的英译,真正“信达”者可谓凤毛麟角。即便是最著名、最常用的儒家经典《论语》的英译,“以其昏昏使人昭昭”者亦复不少。即便是“两脚跨东西文化”的辜鸿铭、林语堂等大家英译的《论语》,仍然存在着一些问题。

例如《论语·述而篇第七》中的第十七章:

子曰:“加我数年,五十以学《易》,可以无大过矣。” [10]

辜鸿铭《论语译英文》(分在第16章)译为:

Confucius once remarked, after he had begun the study of the I-king, ‘If I could hope to live some years more, long enough to complete my study of the I-king, I should then hope to be without any great shortcomings in my life.[11]

辜氏的英文译成现代汉语就是:“在孔子开始研究《易经》之后,他曾经就此说过:‘如果我能够再多活几年,活到让我足以完成我对《易经》的研究,那么我这一生就不会有任何大的遗憾了。”《论语》原文明明白白地写着“五十”,可是辜译却没有体现出这个数字,这是为什么呢?

乍看原文字面,“五十”就是五十岁。也就是说,孔子是在五十岁之前说这番话的。如果是五十岁之后,就不该说“加我数年”了。古代注家大多如是解,现当代名家的《论语》译注,亦多持此说。如杨伯峻先生《论语译注》:“孔子说:‘让我多活几年,到五十岁时候去学习《易经》,便可以没有大过错了。” [12]汉英对照中华大文库《论语》(THE ANALECTS)的汉语今译[13],用的就是杨伯峻先生的译文。

其实,清人龚元玠在《十三经客难》中说,只缘“先儒句读未明,当‘五一读,‘十一读,言或五或十,以所加年言。” [14]“五”后“一读”,诸惑冰泮,可谓“一读”千金!但“五”与“十”之间虽应“一读”,却不是简单地加个逗号或顿号就可以的,而应加连接符号。本章当标点为:

子曰:“加我数年,五—十以学《易》,可以无大过矣。”

译成现代汉语就是:

孔子说:“假如上天加给我数年闲暇的时间,用五至十年来研究《易经》,就可以没什么大问题了。”

译成英语就是:

Confucius stated,“If I were given several more years, say five to ten years, to study I-king at leisure, then my understanding of it would be no great deficiencies. ”

三、国学数字化走向世界的新途径

数字化网络平台的空间是无限的。然而如果把国学经典全部或大部译成外文并将其数字化,不仅耗时费力,而且作用不大。因为这样“走出去”的国学只能供人阅读,无法发挥国学的使用价值。因此我们将国学数字化走向世界的实践途径具体分为两个阶段来实施:

第一,将所选内容按照前文提出多级索引编排形式存储到数据库中。这部分的完成只需人力物力的积极配合即可实现。

第二,建立适合的索引链接和动态编纂的搜索引擎。由于国学典籍数量浩瀚,国学辞鉴语料库的编纂将永远处于进行时,而且国学辞鉴语料库储存的索引信息又比较复杂,所以必须要有能够满足国学辞鉴语料库各种索引要求的搜索引擎。目前的ElasticSearch (ES)是一款较为理想的搜索引擎,支持分布式擴展搜索、近似实时搜索、多租户全文搜索、多索引、条目搜索、高扩展全文搜索、结构化搜索和分析搜索等,而且可以在随时增加条目、编辑条目的过程中毫不影响用户的搜索速度。这是传统静态编撰的搜索引擎无法达到的。

ElasticSearch有许多成功的实用案例:

(1)纽约时报用ES提供搜索164年所有发表的文章;

(2)维基百科使用ElasticSearch来进行全文搜索并高亮显示关键词,以及提供search-as-you-type、did-you-mean等搜索建议功能;

(3)易贝(eBay)使用ElasticSearch支持对八亿条目进行快速(亚秒级)搜索;

(4)英国卫报使用ElasticSearch来处理访客日志,以便能将公众对不同文章的反应实时地反馈给各位编辑;

(5)StackOverflow将全文搜索与地理位置和相关信息进行结合,以提供more-like-this相关问题的展现;

(6)GitHub使用ElasticSearch来检索超过1300亿行代码;

(7)每天,高盛使用ElasticSearch 进行追踪和分析5TB的股票交易数据,用来分析股票市场的变动。

使用传统的搜索引擎的主要弊端是搜索精确度较差。我们利用Elasticsearch搜索引擎来搜索我们上文提到的不同级别的索引编排内容,能在很大程度上提高信息搜索的精准度。利用ElasticSearch对我们按照不同级别进行编排的索引内容进行搜索时可以实现以下传统搜索引擎无法实现的搜索功能:

(1)多字段搜索。只有一个简单的match子句的查询是很少用到的。我们经常需要在一个或者多个字段中查询相同的或者不同的字符串,这意味著我们需要能够组合多个查询子句以及使他们的相关性程度有意义。这样在搜索时,就可以自动按照权重、级别实现相对准确的搜索。

(2)实现同段分析。当我们希望搜索的词条只出现在同一条目、同一段落,抑或同一级别时,利用ElasticSearch进行搜索可以顺利达到目的。

(3)实现多段落分析。当我们希望搜索的信息词语可以在不同条目、不同段落,或者不同级别出现时,ElasticSearch也完全可以实现此功能。

(4)同级别索引分析、多级别索引分析的实现。当我们希望搜索的词条出现在同一级别目录时,我们可以利用此搜索引擎达到精搜索的目的;多级别的索引分析亦可实现。

ElasticSearch 进行搜索时的基本规则是:首先找寻完全匹配,其次是同义匹配,再者是近义匹配,最后则是单字匹配。这样使得我们既能精准查找,又能全面查找。

四、结语

本文提出了具体的四个步骤来运用数字化手段实现国学走向世界。第一步,国学典籍内容的甄选。基于粹选语段,致用为本的原则来筛选出最有用的精华。本着索引链接,开放平台的方案,来保证信息可以快速有效地被查找。第二步,国学典籍的今译今释来精校知识的正确性。第三步,国学英译,达为本使得国学在世界上可以更好地被理解,学习。第四步,提出国学数字化走向世界的具体途径来证明本文方案的实用性和切实可操作性。

参考文献:

[1]杨牧之.中国古籍总数普查工作的重大成果——兼谈《中国古籍总目》的特点[N].中国新闻出版报,2013-1-21.

[2]胡适.胡适文存二集(一) [M]. 上海:上海亚东图书馆,1924:11,7.

[3]影印文渊阁四库全书(第1册)[M].中国台北:中国台湾商务印书馆股份有限公司,1986: 53.

[4]习近平.在纪念孔子诞辰2565周年国际学术研讨会开幕会上的讲话[M].北京:人民出版社,2014:6.

[5]王云五.旧学新探[M].上海:学林出版社,1997:271.

[6]James Boswell. The Life of Samuel Johnson [M] London: Penguin Classics,2008: 241.

[7]胡适.胡适文存二集[M].上海:上海亚东图书馆,1929:279.

[8]吕叔湘. 吕叔湘全集(第十二卷)[M].沈阳:辽宁教育出版社,2002:353.

[9]严复.天演论(译例言)[M].北京:商务印书馆,1981:Ⅶ.

[10]张立华,张楚乔.唐碑论语译释[M].北京:中国政法大学出版社,2016:97.

[11]Ku Hungming. The Discourses and Sayings of Confucius [M] 上海: Kelly and Walsh, Limited.1898: 52.

[12]杨伯峻.论语译注[M].北京:中华书局,1980:71.

[13]韦利英.中华大文库论语[M].长沙:湖南人民出版社,北京:外文出版社,1999:68-69.

[14]程树德.论语集释(卷十四)[M].北京:国立华北编译馆,1943:407.

责任编辑:孙 瑶

猜你喜欢
走向世界国学数字化
“垂”改成“掉”,好不好?
揭示数字化转型的内在逻辑
数字化起舞
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
李明淑:助力中国原创童书走向世界
【大照片】越过海角的雪中天使
【大照片】上帝视角看枣庄
从课本例题走向世界名题