提 要 建设世界一流的语言学学科是“双一流”建设的重要组成部分。世界一流学科建设的前提是让世界知道。本文基于国际主流的引文数据库,统计分析了中国语言学研究成果国际化的现状与问题。数据表明,中国大陆目前的语言研究成果的国际发表无论是数量还是质量均与世界一流高校仍有很大的差距。学科建设与学科的定位有关,如果语言学是科学,那么我们就需要采用科学的方法来研究语言。作者团队十几年来的实践表明,语言研究是可以科学化的,其成果也可以得到科学家的关注,但前提是我们需要采用科学共同体认可的方法来研究语言。科学的研究方法也有助于成果的国际化。
关键词 中国语言学;国际化;科学化;科学研究范式
中图分类号 H002 文献标识码 A 文章编号 2096-1014(2018)01-0037-14
Two Critical Priorities for Linguistic Studies in China:
International Visibility and Scientific Approaches
Liu Haitao
Abstract Constructing world first-class linguistics discipline is an important mission for the ‘Double First-class Initiative, and the precondition for accomplishing this mission is to make it internationally known. Based on the data drawn from the major Databases of International Science Citation, this paper analyzes the current scenario and difficulties in internationalizing the output of Chinese linguistic research. The analysis shows that when it comes to international publications, there exists a huge disparity between Chinese Mainland and the rest of the world in terms of both quantity and quality, signifying that there is a long way to go in order for the best Chinese universities to catch up with their counterparts in the world. The success of discipline construction depends on disciplinary orientation. If linguistics is a science, then language should be studied through the means of scientific approaches. My own practical experience of leading a research team shows that it is feasible to apply scientific methods in conducting linguistic research, and our accomplishments have drawn a lot of attention from researchers in areas of natural sciences. This leads to an argument that Chinese linguists should strive to carry their studies in a scientific way that is widely accepted by the international academia. As a conclusion, the paper argues that in terms of research topic, we should choose the issues that are specific to China but with international significance; that is, the findings should have wider implications contributing to the international research literature. I believe that this is the only way to enable our research to reach out to the world and stand tall on the world platform, thus to achieve the goal of building world-class universities.
Key words linguistics in China; internationalization; scientization; scientific research paradigm
2015年10月24日,國务院颁发了题为《统筹推进世界一流大学和一流学科建设总体方案》的文件。文件为中国高校在未来一段时间制定了具体的努力目标:“到2020年,若干所大学和一批学科进入世界一流行列,若干学科进入世界一流学科前列……到本世纪中叶,一流大学和一流学科的数量和实力进入世界前列,基本建成高等教育强国。”
2017年9月21日,教育部、财政部、国家发展与改革委员会公布了“世界一流大学和一流学科建设高校及建设学科名单”。42所大学被列为一流大学建设高校,一流学科建设高校为95所。按照教育部学科分类含有语言学的一级学科有两个学科:中国语言文学与外国语言文学,其中北京大学、北京师范大学、复旦大学、南京大学、华中师范大学、陕西师范大学为中国语言文学一流学科建设高校,北京大学、南京大学、北京外国语大学、上海外国语大学、湖南师范大学、延边大学为外国语言文学一流学科建设高校。值得一提的是,名单中还有两个与语言学有关的学科,即“语言学”與“现代语言学”,前者的入选高校为北京大学和北京师范大学,后者为北京大学、复旦大学、清华大学。如果按照数量来说,与语言有关的学科可能是本次“双一流”建设入选最多的学科了。
由此可见,语言学的学科建设问题,特别是如何建立世界一流语言学学科的问题,已经被提到相当的高度。这可能也是本期以“中国语言学学科建设与发展”作为主题的原因之一。正如读者在本期其他文章中所看到的那样,一个学科的建设与发展涉及许多问题,我在这里主要围绕“中国语言学成果的国际化”与“语言研究方法的科学化”谈一点自己的看法。
一、中国语言学成果的国际化
语言学为什么要国际化?过去这么多年,我们不提倡国际化,不也挺好吗?我们可以从很多方面来回答这个问题,例如,知识的传播、学科的发展、国际学术话语权等。但在“双一流”建设的背景下,可能只要一句话就够了:世界一流首先得让世界知道。国际化的实质就是让世界知道我们在做什么,让国外的语言学家知道中国也有语言学家。因为,世界上很难找到不参加世界大赛的世界冠军,同样,也很难有世人所不知的世界一流。评价世界一流或学科国际化的指标有很多,这些指标的细节与优劣不是本文讨论的范围。徐烈炯《中国语言学在十字路口》一书,在回答“中国国内的语言学研究如何才能真正地和国际接轨?”这个问题时说“本学科世界一流刊物中,中国人发表文章的比例”,“如果在国际一流刊物上发不了一篇文章,那么这个学校(者)就不是国际水平”“是否接轨了,有多大差距,这条标准简单、比较可靠”“对年青一代的希望,就是大家把到国际一流刊物上发表文章当作目标,逐步缩小差距”。(徐烈炯 2008: 251—252)徐先生提到的这条指标虽然简单,但几乎是国际学界通常采用的一个标准,不但易于查考,也便于我们自检与世界一流的差距。
如果按照这个指标,我们先得确定什么是世界一流刊物。文献(科学)计量学领域的进展(蒋颖 2013;邱均平等 2016),使得我们比以前更容易获得这方面的可靠信息。目前,最常用的收录高水平学术论文的引文数据库是艾斯维尔的Scopus与科睿唯安的Web of Science(WOS),二者几乎收录了全球的主要学术期刊,上亿篇学术文献。尽管被这些数据库收录的期刊不一定全是本领域的一流刊物,发表在这些刊物的文章质量也不可能篇篇都是一流。但从统计的角度看,这些刊物大多是本领域的一流刊物,发在这些刊物上的高质量论文也更多一些。引文数据库目前已经成为研究人类知识产生与传播的重要信息源,例如,2002年以来,基于科睿唯安的WOS数据库,人们已经成功预测了46位诺贝尔奖得主。
如果,引文数据库可以作为研究学科国际化发表的资源。那么,我们首先感兴趣的是在一段时间里一个学科中按照国家或地区发表论文的数量情况。表1为1996—2016年间,Scopus数据库收录的“语言及语言学”类中论文数量最多的20个国家及地区。
表1中的“篇均引用数”与“H指数”均反映了论文的质量,前者为数据库中所收录文章的被引数,后者为一个混合量化指标,一般用来评估研究人员或研究机构的学术产出数量与学术产出水平(叶鹰等 2011)。例如,一个学者(或机构)的H指数为10,则表明该学者(或机构)至少发表了10篇论文,而且每篇论文至少被引用了10次。由表1可知,美国、英国、加拿大、德国、荷兰、以色列等国,不仅产出的语言学论文多,而且质量也高。而西班牙、波兰、伊朗、巴西、中国大陆、中国台湾等国家与地区,虽然产出了一定数量的语言学论文,但质量方面则逊色不少。值得一提的是,就“语言与语言学”所属的“艺术与人文”大类来看,中国语言学家发表的国际论文是最多的,远远多于该大类中的其他小类,如考古、历史、博物馆学、音乐、哲学、宗教等,也高于“文学与文学理论”。这说明,在人文学科内部,相比其他领域,中国语言学的国际化程度还是不错的。
在对中国语言学国际化的总体情况有所了解后,我们可能想了解这些国际高水平论文都是谁写的?是哪些大学的人写的?主要发表在哪些期刊?所发表论文属于哪些研究领域?
为了回答这些问题,我们选择了科睿唯安的WOS中的SSCI(社会科学引文索引)以及A&HCI(艺术与人文引文索引)过去10年(2008—2017)的相关数据进行了详细的统计分析。改用WOS的原因有二:一是这个数据库的检索工具更易于得到我们需要的数据,二是WOS的期刊收录原则比Scopus更严格,在学术评估中,也更常用。
SSCI中含有“语言学”类,A&HCI中含有“语言及语言学”类,目前二者在两个小类收录的期刊有200种左右。因为Scopus数据库不收书评,所以,我们在这一部分的检索,也只考虑了“论文”(ARTICLE)这种文献类型。为了更全面地反映中国语言学的国际化情况,除中国大陆外,以下数据也包括了中国香港、台湾及澳门地区。
高水平的研究者是一流学科建设的核心,因此,我们先来看一下过去10年被两个引文数据库收录语言学相关论文最多的是哪些学者。
在过去10年里,中国(含港澳台地区)被SSCI收录的“语言学”类论文有2845篇,被A&HCI收录的“语言及语言学”类论文有2229篇。对比表2中SSCI与A&HCI的研究者,我们可以发现,有些学者在两个数据库中的位次保持稳定,这是由于他们所刊发的期刊同时被两个数据库收录。我们也可以看出,SSCI“语言学”类的期刊,收录了一些非传统意义的语言学期刊,这导致我们一般认为不是语言学家的语言研究者也进入了榜单,这些学者以心理学家与教育学研究者为多。而A&HCI那一列的学者,则大多可以归为传统意义上的语言学家。就A&HCI里研究者的地区分布来看,除刘海涛与吴义诚目前工作在中国大陆高校(浙江大学)外,表2中的其他研究者均工作在中国港台地区的学术机构。由此可以看出,中国香港与台湾地区的语言学研究者在学术成果的国际化方面,要优于大陆学者。
SSCI与A&HCI均含有“语言学”类,这也为我们粗略比较社会科学与人文学科的国际化提供了可能的信息。我们首先从WOS中获得了过去10年中国(含港澳台地区)研究者被这两个系统收录的论文总数,分别是128 960(SSCI)与12 221(A&HCI)。从这两个数字,已经不难看出社会科学的国际化要远远高于人文学科。这一点,也可以从两个领域发文最多的学者排序看出,SSCI中过去10年至少发文94篇才能进入中国(含港澳台地区)Top 500的名单,而同期A&HCI中国(含港澳台地区)发文最多的学者(劉海涛)只不过发了43篇。
数量不等于质量,衡量论文质量的各种文献计量学指标的基础大多是论文的被引数量。目前全球主要大学排行榜以及本次教育部一流学科的遴选均参考了科睿唯安的ESI(基本科学指标数据库)。科睿唯安定期对WOS中的相关文献进行统计,分别排出居世界前1%的高被引论文和前0.1%的热点论文,并以此来评价相关机构的学科实力。我们来看一下最近一个统计周期(2017年11月初发布)的相关情况。在SSCI数据库中,大中华区共有1071篇高被引论文和37篇热点论文,其中属于语言研究的高被引论文有3篇,作者分别为中国台湾地区学者、中国香港地区学者及中国大陆刘海涛团队,语言研究热点论文2篇,均为刘海涛团队的成果。而A&HCI库中,大中华区只有14篇高被引论文与3篇热点论文,其中属于语言研究类的高被引论文1篇(台湾地区学者),热点论文2篇(刘海涛团队)。由此可以看出,与其他学科相比,语言研究很难产出符合现代文献计量学指标的高质量(高影响)论文,但也不是不可能的。
大规模引文数据库的出现,也使得对中国研究者在世界范围内的影响力进行客观、系统的分析成为可能。基于全球最大的同行评议学术论文数据库Scopus,爱思唯尔连续3年(2014,2015,2016)发布了中国高被引学者(Most Cited Chinese Researchers)榜单,旨在将最具世界影响力的中国学者呈现给学术界和公众。榜单中列出了1700多名各学科的高被引学者,其中包括3位语言(文学)领域相关的学者,他们是申丹(北京大学,人文学科,140,6),刘梅华(清华大学,社会科学,221,4),刘海涛(浙江大学,社会科学,411,12)。该榜单在制定时,已经考虑了学科差异。尽管如此,语言学研究者入选的人数还是少得可怜。这一方面反映了学科的国际化程度不高、有影响力的成果不多,另一方面也对学科的科学性提出了挑战。
尽管一流学科的建设离不开人,但只靠一两个人是不行的,因为一个学术机构只有一个能人是不行的,当然如果连一个行的人都没有的机构就更不行了。下面我们来看一下按照机构排名的相关统计与分析。
从表3来看,无论是SSCI还是A&HCI,就语言学成果的国际化而言,大陆高校与港台高校还是有一定差距的。除了表3列出的那些大陆高校外,在前25名中还有复旦大学、南京大学、上海外国语大学和中山大学。有趣的是,广东外语外贸大学、浙江大学和中山大学外,这些高校大多在教育部的一流学科名单之中。这说明,论文这项指标还是可以说明问题的。
如果世界一流的前提是让世界知道,那么引言中提及的有些高校可能需要加大国际发表的力度,否则世界一流学科的建设就会仅仅成为一个口号。因为,我们很难想象,一个在相关领域论文国际发表数量进不了中国(含港澳台地区)前25的高校,能成为该学科的世界一流。说到这里,我们可能需要说一下为什么本文引言中提及的一流学科名单里面会有两个令中国语言学家激动不已的、教育部学科目录之外的学科“语言学”与“现代语言学”。激动的原因是,当全国语言学界都在上下呼吁教育部将“语言学”设为一级学科未果的时候,这个名单一下子增加了两个语言学的学科,怎么能不让人热血沸腾。但现实往往是残酷的。据悉,本次一流学科的遴选,也参考了QS学科排名结果。这一做法是可以理解的,如果学科的建设目标是世界一流,那么,拿一个世界性的学科排名作为参考是顺理成章的。具体而言,如果有国内高校出现在QS学科排名的前50,而且该学科又不宜合并进入已有的教育部学科目录,那么就可能出现一些2012年教育部学科评估中不存在的学科。于是,“语言学”(Linguistics)与“现代语言学”(Modern Language)就这样产生了。按照QS学科排名,北京大学的语言学排名世界第10,北师大的排名世界第47;北大的现代语言学排名世界第7,复旦排名第27,清华排名第33。这些高校均满足世界前50的一流学科入选标准。对照表3,我们看到有些入选高校在语言学的国际发表方面并不都是那么突出的,那他们为什么会进入世界前50呢?原因是QS对这两个学科的排名,基本都是按照主观打分来进行的。“现代语言学”是百分之百的主观分,而“语言学”的主观分也占了百分之九十。
如果我们关心的是学术成果的国际化,那么被WOS等国际知名检索系统收录只是第一步。因为,不少被收录的期刊是区域性的,这种区域性不仅体现在研究对象上,也体现在作者与读者分布以及刊物所刊登文章的语种上。表4为过去10年中国(含港澳台地区)被A&HCI收录论文最多的15个期刊。
由表4可以看出,《语言暨语言学》《台湾“中研院”历史语言研究所集刊》《中国语言学报》3本期刊上发表的文章占到了过去10年中国(含港澳台地区)A&HCI论文的21%。这3本期刊不但都接受汉语与英语投稿,而且无论是从收文范围还是其他方面来看,均可以认为是一种区域性期刊。例如,《语言暨语言学》过去10年发表论文的作者,有48%来自台湾地区,23%来自中国大陆;《中国语言学报》的作者则有53%来自中国大陆,16%来自台湾地区。当然,我们无意否认这些期刊在推进中国语言学研究国际化方面所起到的巨大作用。这些区域性的期刊,也在一定程度上说明“本土”与“国际”并不是一对不可调和的矛盾。但如果考虑到语言学更关注的是人类语言的普遍规律的话,也许我们需要将目光或努力的方向放到更广阔的世界。这一点,我们也可以从这两本期刊的过去10年的篇均引用看出,《语言暨语言学》为1.54,最高引论文18次; 《中国语言学报》为0.67,最高引论文29次。
除了以研究汉语为主的区域性期刊之外,表4中所列较多的还有这样一些领域:翻译、英语、语言教学,以及一些普通语言学的期刊(Lingua与Language Sciences)。考察SSCI论文的Top 25的期刊列表,我们发现了这样几个新面孔:SYSTEM、JOURNAL OF NEUROLINGUISTICS、BRAIN AND LANGUAGE、JOURNAL OF PSYCHOLINGUISTIC RESEARCH、TESOL QUARTERLY等。一般认为,与A&HCI相比,SSCI期刊论文的科学性可能会更高一些,由此可见一斑。除此之外,SSCI表单中的心理学、神经科学等领域的期刊,不仅为语言学带来了科学的方法,也为提高语言学期刊的低影响因子做出了贡献。在科睿唯安每年发布的JCR(期刊引用报告)中,语言学类的期刊平均影响因子基本在0.5上下波动,但心理语言学及应用语言学类的期刊的影响因子多年来均处于榜单前列。由此可以看出,研究方向可能也是一个需要考虑的点。具体而言,过去10年中国(含港澳台地区)被这两个数据库收录的论文,大多与哪些领域或研究方向有关呢?因为,从大的方面来看,本文讨论的论文均属于SSCI的“语言学”类和A&HCI的“语言与语言学”类。但是,一篇文章,依发表期刊、研究主题的不同,有的时候,会被归入多个类。例如,你用传统语言学的方法来研究句法,你的文章发表在“语言学”类的期刊,那么你的文章就被认为是“语言学”文章;但是如果你采用心理语言学的方法来研究句法,你的文章也可能同时被认为是一篇“心理学”的文章;如果你研究的是句法的教学,那么文章可能又被赋予“教育学”的标签。通过对“语言学”类文章的研究方向的考察,可能有助于发现目前有哪些领域与语言研究有关,也有利于我们从多(跨)学科的角度来理解语言研究现状。
从表5可知,教育学、心理学、神经科学、语言病理学、计算机科学等领域是与语言学关系最密切的几个研究领域。 “亚洲研究”方向出现较多的原因,体现了中国(含港澳台地区)学者研究对象的特点。比如,笔者团队2014年发表于《中国语言学报》上采用复杂网络研究人类语言层级的文章,不仅是《中国语言学报》近10年来被引最多的文章,也是过去10年全球“亚洲研究”类文章被引数第二的文章(Liu & Cong 2014)。当然,我们不排除还有其他领域的期刊也发表过语言研究的论文,但表5中所列的学科方向,可能是本地区语言研究者最常进行的跨学科或交叉研究方向。A&HCI收录的论文,涉及的学科要比SSCI的少,但没有任何新的方向出现。这说明如果就传统语言学领域而言,可与语言学交叉的学科还是比较固定的。在这里我们并没有见到以探索自然界发展规律为目标的基础学科,如物理、数学、化学与生物学等。
世界一流学科建设的前提是让世界知道。但就目前中国大陆语言研究成果的国际发表来看,我们与港台地区主要高校还是有一定差距的,更不要说与世界一流高校的差距了。然而,我们也应该看到,已经有一些大陆高校中的研究者在国际论文发表的数量与质量方面,取得了一定的成绩。下一步,我们要做的是,在引进的同时,要更多的关注那些立足国内做出不错成绩的研究者,总结经验,以点带面,让国内学者的成果在世界上更广为人知。这一点很重要,因为完全照搬国外的方法可能难以行得通。除此之外,研究问题的选取以及角度的切入,如何使得自己的研究更具普遍的学术意义与价值,可能也是一个需要面对的问题。正如王士元先生所说的那样:“中国语言学比较吃亏的一点是,我们的眼里只有汉语。几千年来,出现了很多很多种的语言,有些跟汉语很近,有些很远。如果我们要了解语言的差异和共性,就不能只顾研究自己的语言。”(黄春宇 2017)
从这一部分基于引文数据库的分析中,我们可以看到,在中国大陆理工科的研究成果已基本国际化的大背景下,社会科学领域的国际化也已经走在了人文学科前面。按照目前的学科分类,语言学既可以算在社会科学里,也可属于人文学科。中国语言学的国际化程度,在社会科学里面处于落后地位,但与人文学科的其他领域相比,则要好一些。这是否意味着,科学含量高的学科或成果更容易国际化呢?这是下一小节的主题。
二、语言研究方法的科学化
语言学家一般认为语言学是一门科学。下面是我随手在语言学的书刊中摘录的几种说法:“语言学被当代许多学者公认为一门领先科学。”(伍铁平 1991:116)“语言学是一门领先的科学,这早已成为国际语言学界和教育界的共识。”“语言学作为一门独立的学科,并且是一门在人文学科中居于领先地位的科学,已经得到社会的普遍认同。”(尹洪波 2010)然而,环顾四周,我们发现老百姓并不认为语言学家是什么科学家,而老百姓眼里真正的科学家也难以认同语言学家是自己的同行,更谈不上什么“领先科学”了。为什么会这样呢?乔晓春(2017)有理有据地解答了我们所关心的相关问题:为什么老百姓瞧不起社会科学学者?为什么未受过专業训练的人也可以成为专家?为什么社会科学研究做得很容易,文章很高产?为什么社会科学更容易做得不科学?为什么中国社会科学不设院士?为什么将社会科学与人文学科归为同类学科?我们认为,造成这些问题的一个根本原因,是对“科学”一词的滥用。应该指出的是,我们从来也不认为,其他不带“科学”标签的学科,就比“科学”要低一等。只是想从逻辑上把这个问题理顺一些,既然我们认为自己的学科是一门科学,那么毫无疑问就应该采用科学共同体一般认同的研究范式。换言之,如果语言学是科学,却又不遵循科学的方法开展研究,在逻辑上恐怕难以成立。爱丁顿(Eddington 2009)认为:如果要对真实的语言现象做出有效的解释,必须采用科学的方法。从某种程度上说,语言学的进步取决于研究者在多大程度上采用了科学家所公认的、标准的科学研究方法,即:观察现象、提出假设、收集数据、验证假设、得出结论。我们同意他的说法。但也清楚地知道,不是每一位语言学研究者,都同意他的说法。从语言学文献中随处可见的“科学”与“理论”不难看出,语言学家心里的“科学”很大程度上并不是科学共同体所说的“科学”,语言学家的“理论”也与科学家的“理论”不一样。现代计量语言学的奠基人阿尔特曼在为《计量语言学导论》写的序里面说:人们经常不假思索地使用“理论”这个词,只是因为他们没有与科学哲学家聊过这个话题(刘海涛 2017:2)。为什么我们要与哲学家聊天?因为,对于什么是科学、什么是理论、什么是科学研究范式等问题,科学哲学有专门的阐释(Bunge 2016)。限于篇幅,我们在这里无意展开科学方法的讨论。相比中国语言学的国际化而言,语言研究的科学化是一个世界性的普遍问题。因为,这不只是中国语言学家的事情,也是全世界语言学家追求的目标。
此前,我们将“国际化”简化为在国际高水平期刊发表论文。沿着这一思路,“科学化”可能比国际化更简单,即,尽可能在科学家认可的高水平期刊上发表研究语言的学术论文。如果一个学科在科学期刊上几乎发表不了文章,那么它如何成为科学?为什么发不了?一个很重要的原因是我们没有采用科学共同体认可的科学方法。因此,以科学方法开展研究是语言学走向科学殿堂的必经之路。当然,语言研究应该采用科学方法的理由,不仅仅是我们想让语言学更科学,还因为“学语言是给个人增加新知识,研究语言学是给全人类增加新知识”(徐烈炯 1988),“语言学的目标就是阐明人类与生俱来、但又说不清楚的有关语言的知识”(Plungyan 2011:102)。发现新知,是科学的基本目标。从这一点看,语言学就是科学。如果考虑到,没有语言可能也没有科学家,更没有现在谈论的科学,那么说它是一个领先科学又有何不可呢?但遗憾的是,真正意义的新知发现是与前引爱丁顿所说的科学方法(实证方法)密切相关的。目标明确,对象重要,但由于采用的不是一般意义的科学方法,所得到的结果很难得到认可,也难以起到一个基础学科应有的作用。长此以往,被人瞧不起,是在所难免的。就语言学家而言,“不能把语言的人文性混同于语言学的人文性,语言学作为科学,甚至作为文科,值得强调的只有科学性” (朱晓农,即出)。总之,如果语言学想从传统的人文学科转向生命或认知科学,那么,其研究方法也必须从内省法转为实证方法(Rickheit & Sichelschmidt 2007)。在语言研究中采用实证(或科学)方法的主要原因在于语言学是一种经验科学,这一点,朱晓农(即出)说得很到位,“语言学不是形式科学,他是经验科学!我从没见过哪门经验科学胆大到自称或萎缩到自认和数学、逻辑学、电脑程序一样是形式科学。”通俗地讲,如果我们几乎看不到其他领域的科学家在研究蚂蚁的时候变成蚂蚁,那么语言科学家为什么就非得变成蚂蚁呢?退一步讲,在语言学的众多分支里面,至少不应该都采用研究蚂蚁就得变成蚂蚁的方法吧?
学科建设也与学科的定位有关,如果语言学是科学,那么我们就需要在课程设置等方面引入相关的内容。当然,在引入课程之前,我们得有一些真正意义的语言科学研究成果。语言研究的科学化,说起来不容易,做起来更难。下面,我们结合自己的研究谈一点体会。
在进入科学世界之前,除了要对此前提到的科学方法有所了解之外,也需要读一些最新的发表在科学期刊上面研究语言的文章,以便发现适宜的切入点。这样一来,就难免会涉及当今很流行的词语“跨学科”或“交叉学科”,对于语言学跨学科的必要性,我们非常赞同王士元的如下说法:“如果我们的目的是要真正理解语言是什么,那么我们就不能把自己的视野限制得太狭窄,就不能因已有的学科界限而墨守成规。不同学科之间的边界犹如画在沙滩的线条,随着每一次先进知识的波涛到来,这边界就会发生变化,甚至完全消失。人类的知识,特别是研究语言的知识,应该是彼此相连的,并且最终是相互贯通的(王士元 2002:1)。”我们认为,对于现阶段的语言学跨学科研究,应该是借用别的学科的方法来研究语言学问题(刘海涛,林燕妮 2018)。这不仅有可能解决本学科现有方法难以研究的问题,也有助于提升语言研究的科学化水平。
我们在这方面的第一个尝试是采用复杂网络方法研究人类语言。从大的背景来看,人类处于一个充满复杂网络的世界之中。近年来,复杂网络研究不但在数理学科、生命学科和工程学科中起着越来越重要的作用,而且也开始渗透到人文和社会科学领域。对于语言学而言,尽管从索绪尔开始,就不断有学者提出语言是一个系统、一种网络的观点,但却一直没有找到适宜的方法对此进行科学的研究(刘海涛 2011)。复杂网络分析技术的盛行,使得我们可以很容易地获得研究所需的资源与软件工具。因此,我们在10年前,开始进入语言复杂网络研究领域,今天我们团队已成为世界上最好的语言复杂网络研究小组之一。十几年来,我们做过的主要研究有:
(1)提出了复杂网络对语言学家是手段而不是目标的观点,构造并研究了两种语体的句法复杂网络,首创了用复杂网络方法研究语体与语言类型的方法(Liu 2008a);(2)构造了两个随机生成网络与一个句法网络,并研究了它们的网络特征,结果表明,虽然句法对于语言网络的特征有一定的影响,但用现有指标难以区分句法网络与随机网络,为了采用句法复杂网络研究更微观的语言结构,还需要寻求其他的指标(Liu & Hu 2008);(3)首次构建并研究了语义角色复杂网络,发现语义网络虽然是小世界和无尺度网络,但语义网络与句法网络在层级结构和节点度相关性方面存在明显不同(刘海涛 2009);(4)构造了15种语言的句法复杂网络,并首次采用复杂网络研究了语言类型(分类)问题,结果显示,通过复杂网络的主要参数,可以对人类语言进行分类,其准确性与利用现代语序类型学主要指标进行的语言分类准确性相当。通过对15种语言的词形网与词目网的比较,发现句法复杂网络可以反映語言的形态变化程度,为采用复杂网络进行语序相对自由语言的分类提供了理论依据。该方法弥补了语序类型学在处理语序相对灵活语言时的不足,有助于解决语序灵活语言的分类问题(Liu & Xu 2011);(5)研究了作为多层级系统的人类语言结构特征,发现各个层级的网络模型反映了各层级系统的共性与联系,并表明语言的多种特征与人类认知之间存在着密切联系(Liu & Cong 2014);(6)构建了12种斯拉夫语族语言和2种非斯拉夫语言的平行词同现网络,并对这些网络的主要参数进行了分析研究,获得了一个精细的斯拉夫语族语言分类,同时也发现,文字形式难以影响语言的结构与分类(刘海涛,丛进 2013)。以上研究大多发表于国内外重要的自然科学刊物,其中,有关语义复杂网络、汉语句法网络中心节点的研究被EurekAlert!与PhysORG等世界知名科学新闻网报道。其中有两项成果,分别获得了教育部高等学校科学研究优秀成果奖(人文社会科学)和浙江省第十八届哲学社会科学优秀成果奖二等奖。鉴于我们在此领域所做的大量高水平研究,国际著名的自然科学期刊《生命物理学评论》(Physics of Life Reviews,2014年影响因子9.478)主编邀请我们2014年为该刊撰写了题为《用复杂网络研究人类语言》的文章。这是世界上第一篇刊登于高水平学术期刊的有关语言复杂网络的长篇文章,刊出不久后,便成为2015年ESI高被引论文和热点论文,目前已是语言复杂网络研究领域的重要参考文献(Cong & Liu 2014)。世界知名语言复杂网络学者Ferrer-i-Cancho(2014)在谈及我们的这篇文章时说:“基于网络方法,丛与刘正在定义未来的语言学,这种方法正充实、更新并统一理论语言学。”
我们有关语言复杂网络的研究得到了科学家的认可,说明语言学研究也可以很科学,语言学家也是科学家。这些研究成果不但拓展了复杂网络在人文、社会与生命科学等领域的应用,而且将语言研究与自然科学中的研究热点联系在了一起,有助于从更广阔的视域理解人类及其语言,丰富了语言研究的科学手段与方法,对语言学的科学化具有重要的推动意义。然而,尽管我们研究的也是与人类语言相关的问题,但对于传统的语言学家而言,由于方法上的差异,我们的研究似乎与他们眼中语言学有一些不一样,甚至有些难于理解。为此,我们也在思考如何在语言研究中逐步加入科学的成分,即:从传统的语言学问题出发,经过基于数据的实证方法,最终的成果不仅可以解决语言学家关心的问题,也能得到科学家的认可。这方面的代表性案例是我们十多年来对依存距离的研究。
依存距离指的是两个有句法(依存)联系的词在句子中的线性距离。根据心理学家的研究,依存距离与人的认知机制,特别是工作记忆有关。如此一来,我们可以通过依存距离这种文本计量指标和句法标注的语料库来研究认知与语言的关系(梁君英,刘海涛 2016)。10年来,我们在这方面发表的主要研究成果有:(1)研究了自然语言与随机生成语言的依存距离分布,发现自然语言的依存距离符合分布规律,而随机语言则没有这样的特点,自然语言的依存距离具有最小化的特点(Liu 2007);(2)采用了20种语言的语料,首次验证了依存距离最小化是人类语言的一个普遍规律。同时也发现,一种语言的依存距离可能也与语言类型有关,加深了我们对Sapir-Whorf假说的理解(Liu 2008b);(3)研究了句长等因素对依存距离的影响。结果发现:依存距离的概率分布不受句子长度的影响,汉语的平均依存距离总是高于英语;依存方向是一种比依存距离更可靠的语言分类指标(Jiang & Liu 2015);(4)采用了20种语言的真实语料,发现语序类型是一个连续统,开辟了用大数据进行语言类型研究的新路子。这种方法解决了语序相对固定语言的分类问题(Liu 2010)。(5)近年来,我们常常会听到下面这样一种说法“语言是一种复杂适应系统”(王士元 2006),但在大多数语言学书刊里,这种说法只是一种隐喻。因为,对于任何系统来说,如果没有设定的目标,系统很难运转起来。语言如果是一种系统,也应该如此。为此,我们以依存距离最小化作为语言系统的目标之一,通过计算机模拟与真实语料库对比,结果发现,在处理长句的过程中,语言系统会启动一种自适应机制,并产生一种动态的语言单位(即组块),从而实现了依存距离最小化这一人类语言系统的运作目标(Lu et al. 2016)。这篇文章发表在国际复杂适应系统的权威期刊上,得到了该领域专家的认可,成为为数不多得到系统科学家认可的语言研究论文,由此,我们也进一步精确了我们对语言作为系统的看法,即:语言是一种人驱复杂适应系统(Liu 2014;刘海涛,林燕妮 2018)。
这些研究大多发表在语言学或认知科学期刊上,解决了语言学家关心的一些问题,因此也得到了较广泛的关注。例如,发表在Journal of Cognitive Science与Glottometrics上的论文,均为这两个期刊近10年来所刊文章被引最高的文章。我们有关依存距离的这些研究,不但为探索语言与认知、语言与思维的关系提供了更加坚实的实证基础,也对从语言行为中发现人类的认知规律以及从人类认知的角度解释语言行为具有启示意义。尽管我们的这些研究大多发表在语言学刊物上,但由于采用了一般意义的科学方法,因此也得到了科学界认可。Physics of Life Reviews的主编破例又邀请我们为该刊撰写了相关文章(Liu et al. 2017)。这篇文章将复杂系统理论、认知科学理论、大规模真实语料统计分析以及心理语言实验行为结合起来,揭示了依存距离在自然语言句法模式形成与演化过程中的作用,指出依存距离最小化是自然语言的一个普遍特征。主编为什么会破例邀请我们呢?因为,我们2014年发表在这本期刊上的文章的引用率不错,对提升该刊的影响因子做了贡献。而这篇文章同样也在出版不久后,成为本轮(2017年11初)ESI高被引论文和热点论文。同期,我们发表在Complexity上关于语言适应机制的研究(Lu et al. 2016)也成为ESI热点论文(数学学科)。
我们十几年来的实践表明,语言研究是可以科学化的,其成果也可以得到科学家的关注,但前提是我们需要采用科学共同体认可的方法来研究语言。
三、结 语
世界一流学科的建设需要我们与世界高手同场竞技。因此,语言学研究成果的国际发表是中国语言学走向世界的必由之路。我们在构拟学科建设方案时,应该将这个问题放在重要的位置,否则世界一流就是一句空话。在研究问题的选择上,需要仔细考虑如何从汉语中的特殊问题引向更具有普遍意义的语言学问题。在研究方法上,尽可能采用一般意义的科学方法。长此以往,我们才能更好地把自己的研究推向世界,让世界知道中国人也可以做出好的语言研究成果,逐步实现建设世界一流学科的目标。
参考文献
蒋 颖 2013 《人文社会科学领域文献计量学研究》,北京:社会科学文献出版社。
黄春宇 2017 《语言学家王士元:我们应当让语言自然的演化》,《文汇报》,12月8日。
梁君英,刘海涛 2016 《語言学的交叉学科研究:语言普遍性、人类认知、大数据》,《浙江大学学报》(人文社会科学版)第1期。
刘 莉 2009 《我国社会科学研究国际化探究——SSCI论文的视角》,北京:中国社会出版社。
刘海涛 2017 《计量语言学导论》,北京:商务印书馆。
刘海涛 2011 《语言网络:隐喻,还是利器?》,《浙江大学学报》(人文社会科学版)第2期。
刘海涛 2009 《汉语语义网络的统计特性》, 《科学通报》第14期。
劉海涛,丛 进 2013 《基于平行词同现网络的语言聚类》,《科学通报》第5、6期。
刘海涛,林燕妮 2018 《大数据时代语言研究的方法与趋向》,《新疆师范大学学报》(哲学社会科学版)第1期。
乔晓春 2017 《中国社会科学离科学还有多远?》,北京:北京大学出版社。
邱均平,赵蓉英,董 克等 2016 《科学计量学》,北京:科学出版社。
吴 文,唐玉凤 2017 《生物语言学》,北京:中国社会科学出版社。
伍铁平 1991 《三论语言学是一门领先的科学》,《语言教学与研究》第3期。
王士元 2002 《王士元语言学论文集》,北京:商务印书馆。
王士元 2006 《语言是一个复杂适应系统》,《清华大学学报》(哲学社会科学版)第6期。
徐烈炯 1988 《生成语法理论》,上海:上海外语教育出版社。
徐烈炯 2008 《中国语言学在十字路口》,上海:上海教育出版社。
叶 鹰,唐健辉,赵 星等 2011 《h指数与h型指数研究》,北京:科学出版社。
尹洪波 2010 《赋予语言学一级学科地位》,《中国社会科学报》,6月15日第8版。
朱晓农 即出 《语音答问·结语》,上海:学林出版社。
Bunge, Mario. 2016. Doing Science: In the Light of Philosophy. New Jersey: World Scientific.
Jin, Cong and Haitao Liu. 2014. Approaching human language with complex networks. Physics of Life Reviews 11 (4), 598-618.
Dyer, William Edward. 2017. Minimizing Integration Cost: A General Theory of Constituent Order. PhD thesis, University of California, Davis.
Eddington, David. 2009. Linguistics and the Scientific Method. In D. Eddington (ed.), Quantitative and Experimental Linguistics. Muenchen: Lincom GmbH.
Ferrer-i-Cancho, R. 2014. Beyond description. comment on “Approaching human language with complex networks” by Cong & Liu. Physics of Life Reviews 11 (4), 621-623.
Futrell, Richard. 2017. Memory and locality in natural language. PhD thesis, Massachusetts Institute of Technology.
Gordin, Michael. 2015. Scientific Babel: The Language of Science from the Fall of Latin to the Rise of English. Chicago and London: University of Chicago Press.
Jiang, Jingyang and Haitao Liu. 2015. The effects of sentence length on dependency distance, dependency direction and the implications. Language Sciences 50, 93-104.
Liu, Haitao. 2007. Probability distribution of dependency distance. Glottometrics 15, 1-12.
Liu, Haitao. 2008a. The complexity of Chinese dependency syntactic networks. Physica A: Statistical Mechanics & Its Applications 387 (12), 3048-3058.
Liu, Haitao. 2008b. Dependency distance as a metric of language comprehension difficulty. Journal of Cognitive Science 9 (2), 159-191.
Liu, Haitao. 2010. Dependency direction as a means of word-order typology: a method based on dependency treebanks. Lingua 120 (6), 1567-1578.
Liu, Haitao. 2014. Language is more a human-driven system than a semiotic system. comment on modelling language evolution: examples and predictions. Physics of Life Reviews 11 (2), 309-310.
Liu, Haitao and Fengguo Hu. 2008. What role does syntax play in a language network? EPL, 83, 18002.
Liu, Haitao and Chunshan Xu. 2011. Can syntactic network indicate morphological complexity of a language? EPL, 93, 28005.
Liu, Haitao and Jin Cong. 2014. Empirical characterization of modern Chinese as a multi-level system from the complex network approach. Journal of Chinese Linguistics 42 (1), 1-38.
Liu, Haitao, Chunshan Xu, and Junying Liang. 2017. Dependency distance: a new perspective on syntactic patterns in natural languages. Physics of Life Reviews 21, 171-193.
Lu, Qian, Chunshan Xu, and Haitao Liu. 2016. Can chunking reduce syntactic complexity of natural languages? Complexity 21 (S1), 33-41.
Plungyan, V. A. 2011. Modern linguistic typology. Herald of the Russian Academy of Sciences 81 (2), 101-113.
Rickheit, Gert and Lorenz Sichelschmidt. 2007. Valency and cognition-a notion in transition. In Thomas Herbst, Katrin G?tz-
Votteler (eds.), Valency: Theoretical, Descriptive and Cognitive Issues. Berlin and New York: Mouton de Gruyter.