李 慧
(北京师范大学人文和社会科学高等研究院,珠海 519000)
人类语言是以发声解剖结构和神经认知为基础构件,可实现声音与意义相互映射的一整套机能。因此,我们对语言的理解,不仅应借鉴语言学的数据和理论,更应来源于生物学研究。调控广泛物种发育的基因集合、蛋白质序列和细胞机制在进化过程中具有广泛的保守性,这激发了人们使用模式生物来研究更复杂的系统。而识别种间差异对于探索人类的特性以及生物多样性的产生至关重要。近二十年来,许多模式生物的基因组计划相继完成,大量的基因组数据被存入数据库,涉及的物种种类不断增加,其中包括两种灭绝的古人类——尼安德特人和丹尼索瓦人,为比较生物语言学的实证研究提供了重要机遇。
目前,将比较生物学方法运用于语言研究已形成共识,即利用动物模型、古人类研究的数据来帮助分析人类关键特征的机制和进化基础。例如叉头框P(forkhead box P,FOXP)转录因子是一个古老的蛋白质亚家族,在脊椎动物体内协调多个器官系统的发育。研究发现FOXP 基因与神经发育障碍相关联,人们开始特别关注该基因在脑中的表达模式和功能。研究FOXP 在人脑中的表达以及在脊椎动物脑发育中的作用,为了解认知行为背后的分子路径和脑回路提供了重要的参考。通过靶向不同脑回路来挽救动物模型中的行为缺陷是未来该领域研究的一个重要方向[1]。
人类独特的语言能力是通过对古老的神经、生理和解剖系统以新型配置的方式组合在一起而产生的,这一观点已得到比较生物语言学研究的支持。例如Lieberman[2]提出,产生言语的基本节奏频率模式的解剖学器官——肺和喉有着深刻的进化史。连接皮层、基底神经节和其他皮层下结构的神经回路组织可执行运动和认知行为,从而产生言语、吟唱的节奏。本文将从现代人群中语言的比较遗传学、现代人类与古人类的比较遗传学和发声学习的动物模型这三个方面讨论语言的比较生物学研究进展,为理解语言等复杂、高级的认知行为可能涉及的神经机制、遗传变异和进化历程提供见解。
研究人类个体发育、特异性和进化起源等问题的核心是了解其遗传机制。研究人类如何获得复杂的言语和语言能力对遗传学家构成了挑战,因为发现其中的关键遗传机制必须依赖于对“我们”的研究,即把人群视为一种自然实验对象来寻找基因型和表型之间的联系。长期以来,语言学家把语言视为在“现代人类”中恒定的特征,专注于对语言“普遍性”的研究。尽管语言研究中包含了研究病理语言学的观点,但并未大力开发人群中差异化的语言资源,因此,目前并没有得到相关表型变异程度的完全图示。然而,比较分析已成为在多种水平上揭示生物学机制的强有力的实证工具。目前,我们对语言分子遗传水平的“保守”与“变异”有了更多的认识。
现代人群中包含一系列的基因组变异,如大规模的染色体重排、基因拷贝数变化和DNA 单个碱基变化。变异范围从非常常见的“多态性”到特定家庭或个人的极为罕见的突变。基因组中许多突变属于沉默突变,对基因功能及表型影响不明显。然而,如果变异发生在基因的编码区序列,这可能改变编码蛋白的氨基酸序列,从而影响蛋白功能。如果变异位于调控区,也能改变蛋白质编码基因表达的方式。在发育或成熟的生物体中,蛋白质何时何地表达以及表达的数量多少,可对神经元增殖、迁移、连接和可塑性等过程产生影响,从而导致发育和功能的改变。这些原则、方法和技术也适用于研究包括言语和语言在内的人类认知和行为特征。如研究者已发现一些罕见的基因突变有巨大的效应,如FOXP2突变导致儿童言语失用。
此外,对特异性语言损伤(specific language impairment,SLI)病例的研究揭示了语言损伤与常见基因变异之间复杂的联系。如当SLI儿童中ATP酶2C2(ATP2C2) 和/或c-Maf 诱 导 蛋 白(C-Maf inducing protein,CMIP)(16 号染色体上的两个相邻基因)发生常见基因变异时,在重复无义单词等语言能力测试中显示出成绩偏低[3]。有时同一基因的不同变体会促成不同类型的障碍。如接触蛋白相关蛋白样2(contactin-associated protein-like 2,CNTNAP2) 的 常见基因变体是SLI的风险因子,而其罕见的编码区突变可与脑皮质发育不全伴病灶性癫痫综合征(cortical dysplasia-focal epilepsy syndrome,CDFES)、智力障碍(intellectual disability,ID)等神经发育障碍相关[4]。
随着分子生物学的发展,人们对基因和基因组之间的差异有了比较全面的了解。但是如何寻找言语和语言相关机能的潜在遗传学基础,还需要不断探索。
首先从发育性交流障碍着手。有5%~10%的儿童存在永久性获得的严重的口语和书面语障碍[5],足以影响其教育与社交发展。其中一些病例是在认知功能相对保留以及有充分语言输入的背景下,其感知和产生语言的能力受限,例如耳聋和腭裂。另有一些病例是在更广泛的认知缺陷的背景下出现言语和语言问题,如脑创伤、ID 或者是自闭症谱系障碍(autistic spectrum disorder,ASD)。还有相当一部分儿童在没有任何明显的解释性原因的情况下存在言语和语言问题。以上问题统一称为“发育性交流障碍”[6]。在行为水平上,不同的言语和语言障碍之间,“语言特异(language specific)”障碍与影响更广泛的认知功能的障碍之间,以及“障碍”与“偏低的正常能力”之间,都鲜有清晰的界限,其部分原因是障碍的诊断基于心理测量和对交流能力的临床观察,在正常与异常表现之间没有绝对的分界线。此外,每一儿童有独特的缺陷谱系,随着儿童发育而变化,大多数障碍都存在高水平的“共病”现象。其固有原因是:言语、语言和阅读大致依赖于共同的认知过程,同时也与其他认知系统密不可分。因此,每种发育性交流障碍都是一个笼统的术语,它不仅涵盖了许多表型变异,也有巨大的基因型差异。例如罕见的言语和语言障碍是由单一基因促成。但常见形式的障碍都是非孟德尔遗传形式,来源于大量常见变体的累加效应。也许最典型的场景是:多种罕见和常见变体组合起来决定了风险的水平,后者又受到环境影响以及神经发育中随机过程的调控[6]。
再者从正常的语言变异以及非凡的语言能力着手。在非语言损伤人群中鉴定语言能力的个体间变异,最近在语言学研究中得到了重视。过去倾向于集中鉴定语言获得和处理过程中“普遍性”的方面。其中一些变异是由于环境因素以及神经发育中的随机效应。但双生子研究和双生子收养研究显示,很大比例的语言变异是可遗传的,例如在口语和书面语获得的发育轨迹、词汇量等参数的最终成就水平,以及儿童期过后的语言学习能力等方面[7]。因此,语言能力的正常变异也是言语和语言遗传基础研究的新型资源,目前正使用全基因组关联(genome-wide association studies,GWAS)进行研究。未来,人们通过探索语言能力谱系的最高端(在口语和书面语获得以及有优异语言能力的成年人中该研究尤其成功),将会对语言的遗传基础有更深入的了解。还有一些经常发生在ASD背景下,且伴随其他认知区域损伤的异常卓越的语言能力(如阅读早慧与通晓数种语言)[6]的病例,也是亟待发掘的语言遗传研究资源。
鉴定语言遗传基础可为实证研究人类语言的演化提供重要线索。把语言相关基因的DNA和蛋白质序列与不同动物物种的相应序列进行比对,有可能重构该基因的进化史,从而判断其出现的时间段、在不同世系中如何改变,以及在人类最近的祖先中是否表现出独特的变化特征。另外,在发育人群以及成年人群脑的不同组织结构中,确定该基因产物何时何地具有活性,并把它的神经表达模式与其他物种进行比较。如果在目标基因中探测到潜在的进化差异,可用模型系统评估其功能影响。例如比较研究发现[8],FOXP2远非人类独有,其有深远的进化史,且在远缘脊椎动物物种中以同源的形式存在。该基因不仅在DNA/蛋白质序列水平,而且在神经表达模式上都相对保守。在鸣禽中其同源基因(FoxP2)似乎通过影响特定脑区(如X区)参与鸣曲学习和可塑性,而小鼠Foxp2影响运动协调、学习、超声发声(ultrasonic vocalizations)以及脑发育,显示该基因在包括皮层、基底核和小脑某些回路的发育和功能中有着古老的作用,也与感觉运动整合和运动技能学习有关;当把关键的进化氨基酸变化序列插入到小鼠中时,小鼠在皮层基底回路中显示出更高水平的突触可塑性;相反,持KE家族Foxp2基因突变的鼠在皮层基底回路中显示出更低水平的突触可塑性。这些研究结果提示FOXP2 具有重要的进化意义。
ASD 是一种神经发育障碍,其特征是社交障碍以及受限和重复的行为模式。虽然语言和社会交际方面的缺陷是自闭症谱系障碍的一个显著特征,但结构语言能力,尤其是语义和句法,存在显著的个体差异[9]。使用动物模型来分析分子通路,并将其与认知障碍的行为内表型联系起来,已被证明是开发和测试疾病相关疗法的有效方法。最近开发出与ASD 相关的脆性X 智力低下蛋白1(fragile X mental retardation1,Fmr1)、神经配蛋白3(neuroligin-3,Nlgn3)和神经突触黏附分子1-α(neurexin1-α,Nrxn1-α)的基因敲除大鼠模型。虽然Fmr1 或Nlgn3 敲除大鼠表现出与ASD 相关的一些行为改变,但在幼鼠社交互动中的超声发声没有显著差异。相比之下,Fmr1 KO 大鼠表现出对听觉刺激的反应减弱,与在脆性X 综合征患者中听觉皮层反应异常相一致[10]。此外,比较常见的非遗传动物模型是产前或产后早期给药的丙戊酸钠(valproic acid,VPA)诱导的大鼠和小鼠ASD模型[11]。虽然在人类ASD 病例中,只有少数与产前暴露于VPA相关,但VPA 动物模型仍然是探讨ASD 病因学中基因-环境相互作用的有价值的研究工具,尤其是在表观基因组修饰的背景下[12]。目前的动物模型对进一步了解与ASD 相关的行为缺陷、基因突变和生理学方面非常有价值,为开发出新的治疗策略提供了条件。但ASD 核心症状的动物模型仍面临着缺乏生物标志物、症状严重程度的异质性和适当的评价终点等问题。尽管如此,来自动物模型的研究数据已经促使几种药物进入临床试验[13]。
语言障碍是精神分裂症临床诊断的重要方面,但它或许是语言功能的特定缺陷,例如句法理解准确性损伤,而并非整体性认知缺陷,或作为普遍思维障碍的指征,而非言语或语言上的特定缺陷。除了少数基因之外,精神分裂症领域一直缺乏研究与这种疾病有关的生物学和大脑回路的遗传模型[10]。然而,最近一项大规模的全基因组关联研究已经确认,精神分裂症相关108 个基因位点集中于大约90 个基因。一些诱发大鼠精神分裂症样症状的药理学模型已被用于研究发声效果。例如甲基氧化偶氮甲醇(methyl azoxy methanol,MAM)会使DNA 甲基化,明显增加足底电击诱发的超声发声等应激反应,从而使啮齿动物的超声发声及其他行为和神经解剖学特征发生类似于精神分裂症的改变[10]。
两种灭绝的古人类基因组高质量测序结果,已经并继续革新着人们对人类进化的理解。现代人类、人类祖先、尼安德特人、丹尼索瓦人和类人猿的完整基因组序列的获得对描述人类特征的起源发挥了巨大价值。在古DNA证据出现之前,通常认为人类语言是相对新近的特征,出现于大约5~10 万年前;语言的出现是单个、骤然的突变导致形成的完整的“现代装备”。尼安德特人缺乏特异的言语装备、更高水平的语言适应以及有效利用语言的整体认知灵活性。例如Pinker等[14]曾提出,语言是为了实现交流的自然选择压力下进化的复杂适应系统,语言演化的时间段是在过去5 万年间。Chomsky[15]认为,大约在10 万年前,第一个问题(为什么会有语言?)并没有出现,因为没有语言,而脑的重构仅仅发生在“我们”这个物种中的某一个体中,生成了无限合并的操作,运用于具有错综复杂(而鲜少了解的)属性的概念中。而认为“尼安德特人缺乏语言,而使用某种形式的原语言”的证据包括:首先,尼安德特人与现代人类的整体解剖结构差异提示,他们之间有相当大的进化距离,尼安德特人的强健身形被认为是力量对受限的智力的补偿;其二,早期对古DNA 的提取和分析专注于线粒体DNA,从而认为现代人与尼安德特人的基因组有显著区别,所以他们是不同的物种;其三,复原的部分声道和听力系统的化石也显示两者之间在言语能力上存在重要差异;第四,两者之间的文化产品存在差距,这似乎也可从语言是否有缺陷中得到解释[16]。
遗传学的最新进步使人们能够从古人类化石上提取和分析DNA。如前所述,对复原的尼安德特人线粒体DNA进行分析,结果似乎支持了它们对现代人类基因多样性没有贡献的观点;可能原因包括,他们与现代人类完全没有杂交,或仅是最初有低水平的杂交,而后来消失了。然而随着下一代测序技术的进步,完整的尼安德特人和丹尼索瓦人的基因组序列得以发布,揭示了3种古人类支系之间的复杂交错的遗传史。Dan等[16]总结了3种古人类基因组的比较数据,并进行了详尽的分析,认为:
(1)“我们”的进化史远非单一世系的简单而持续的进程,而是反映了一个网状的历史,包含至少3 种紧密相关的支系之间(反复)互换基因的可能。随着古人类化石的进一步发现,这一网络也许会变得更复杂。由于在不同的现代人类个体中发现了不同的尼安德特人基因,说明了两者之间基因组混合的机会并不是非常少。也许一些尼安德特人和丹尼索瓦人的基因在“走出非洲”后被赋予了强大的选择优势,尤其是在免疫系统方面,从而对现代人群有了高频率的基因贡献,其中包括在人类白细胞抗原(human leukocyte antigen,HLA)系统中的免疫系统基因、STAT2 基因和OAS 基因簇。尼安德特人和丹尼索瓦人有现代人言语和语言的基本遗传基础,可能现代人在一些参数上会更胜一筹(也许是言语声音或言语的快速,句法的复杂度、词汇量大小等)。
(2)语言是把声音映射于意义的全套能力,包含了支持它的基础设施(如声道结构、神经认知、交流行为学和心智理论等)。这些先决条件发生在深度时间内。因此,言语和语言是古老的,存在于50多万年前尼安德特人和现代人的共同祖先中,即从直立人进化而来的海德堡古人类。现代语言的时间深度应该是在语言科学文献中经常提到时间深度(典型的是5~10万年)的约10倍,而这样一个错综复杂的系统不可能仅仅在几千代内进化出来。在海德堡人之后,生物和文化进化在每一人类支系中继续着,一个在非洲,一个在非洲外,从而导致文化的累积。当然还有支持言语和语言的一些微小的生物差异。因此,简化的突变论不再成立。人们必须从语言认知能力累积的进化轨迹来思考,语言演化在今天仍然在延续。
(3)言语和语言两者之间大致是协同进化的机能。研究言语的生成与理解应以研究呼吸、舌、腭帆和声带的皮层控制为核心,而非过度强调句法,因为前者给予了更多了解语言进化的线索和实证理据。例如,镜像神经元的发现使“人类语言最初经历了一个手势语言的阶段”的观点再度流行起来;这是因为发现类人猿缺乏皮层和喉之间直接联系的侧皮层系统,从而判断类人猿的手势与意向性交流相关,而其发声更多的是本能反应。
(4)人类基因和语言多样性之间有着充分的相互影响。某些参与脑生长和发育的基因如异常纺锤体样小头畸形相关蛋白基因(abnormal spindle microtubule assembly,ASPM)和小脑症基因(microcephalin)的频率与声调语言的流行有相关性,说明人群基因中微小的差异可充当文化的“引子”,使某种语言类型更可能散布,称为“遗传偏向性”。随着对它们功能以及它们在人群中变体功能的了解不断加深,可推测它们在语言的文化进化中发挥着特定作用。
广义上讲,发声学习是在经验基础上改变发声输出的能力。区分发声能力的一种依据是:一些发声是天生的,不需依赖经验;另一些发声不仅依赖天生技能,也依赖经验。前者为大多数动物所常见,例如哭和笑。后者相对不广泛,大致包含3 种亚型:(1)将声音与行为反应联系起来的能力,如犬对人的命令的回应;(2)学习“发声语境”的能力,例如长尾猴对捕食者的发声回应;(3)根据经验修改发声的能力,可以与发声模型偏离或趋同,例如鸟鸣,该能力称为声音产生学习(vocal production learning),简称为发声学习(vocal learning)[17]。发声学习并非人类所独有,其存在于多种远缘物种中。到目前为止,已经无可争议地确认了鲸目动物、鳍足类动物、大象、某些蝙蝠物种、三目鸟类(鸣禽、鹦鹉和蜂鸟)和人类一样均具有发声学习能力[18]。
发声学习的研究有助于阐明感觉运动通路、发声运动控制和听觉运动整合机制。Tyack等[19]对不同的发声动物模型进行了分类,认为人类和一些鸣禽通过聆听声音来学习语言或鸣唱,形成听觉模板,然后产生与模板匹配的声音。这些类群已经进化出专门的端脑通路来完成这种复杂的发声学习形式。还有许多哺乳动物和鸣禽,可以通过倾听同类的声音或噪音来调整遗传的声音运动模式的声学特征。这些有限形式的发声学习可能涉及不同于复杂声乐学习的神经机制,如脑干、中脑和/或端脑网络。相比之下,大多数动物发声的声学结构是由特定物种脑干中的发声运动程序产生的,不需要听觉反馈,不属于发声学习的范畴。要理解人类语言的基础——复杂的发声学习,需要仔细分析哪些物种具备哪些形式的发声学习能力。选择多种动物模型来比较产生这些不同学习形式的神经通路,将为了解复杂发声学习的进化和其神经机制提供更丰富的观点。在研究人类语言神经机制时成功采用的非侵入性方法应广泛应用于发声学习的其他分类群。另外,许多有发声学习能力的物种都濒临灭绝,或受到威胁或列于保护范围内,因此发声学习的研究不应对野生种群产生负面影响。
发声学习物种也用于研究人类言语的进化。Martins 等[20]认为,语言进化应为镶嵌式,不同的语言组分有各自的进化模式。最近他们在发声学习“连续体(continuum)”的概念之上提出了发声学习“联合体(contiguum)”的概念。“联合体”是“连续体”的延伸,在这一形态空间内,有不同的力让一个物种接近某种行为或远离它。“连续体”可视为“联合体”的向量。该模型主张从多维视角研究发声学习,使对发声学习特征的描述更加复杂,也更加准确,并能促进进一步的比较生物学研究。
驯化和发声学习物种可作为研究人类世系中应激性攻击减少和语言出现的模型生物。越来越多的证据表明,驯化可以改变不同物种的发声技能。在人类和鸣禽中,发声学习似乎依赖于共享的神经生物学基质,这也许是趋同进化的结果。白腰文鸟和驯化的孟加拉雀之间的鸣曲对比研究可为人类物种的自我驯化和发声学习演化机制提供线索[18]。最近O'Rourke等[18]把研究重点放在驯化的孟加拉雀上,孟加拉雀的鸣曲比野生的白腰文鸟更复杂。O'Rourke 等[18]对这种效应的解释围绕谷氨酸神经递质系统展开,认为谷氨酸信号与鸣曲学习有关,它控制对发声学习至关重要的神经回路中的多巴胺活动,调节应激反应和驯化后攻击行为的减弱,而应激相关神经回路的兴奋减弱可通过多巴胺能信号的改变来增强发声学习能力。
比较生物语言学强调了认知系统的保守性和语言发育的可塑性,而只有足够了解其他物种的认知体系以及人类非语言认知区域的特征才能对现代语言机能的构建作出合理的推断。通过比较现代人群语言中的罕见变异与常见变异,研究人类交流障碍,将对教育、科学、经济和社会进步都有重要意义,而对其潜在风险因子的了解有利于早鉴定、早干预和早治疗。在ASD、ID、癫痫失语谱系障碍(epileptic-aphasia spectrum,EAS)病例中,遗传学研究已经革新了人们对这些障碍病因的理解,而且开启了从“表型为先”到“基因型为先”的诊断转型。分子生物学技术进步正在加速研究语言障碍中基因型-表型之间联系的步伐,其中一个关键进步是高通量基因分型DNA芯片的生产。通过DNA芯片,每人只需几百美元,就可在基因组中同时筛查百万个不同的遗传标记,靶向到每一基因内所有已知的变异位点[21]。因此研究者可以开展全基因组关联的大规模筛查,从而揭示特定基因与目标表型之间的新型关联。然而这种研究需要成百甚至成千的人群才能取得充分的数据效能。全基因组关联筛查已经使用于常见语言相关障碍研究,但由于较之人类基因学其他领域来说样本规模太小,因此需招募大量的受试者以及描述其语言机能,而且不同领域的国际合作才能获得成功。此外还需要实验研究来确定基因变体对蛋白质功能的影响,这些实验包括分子和细胞生物学实验、动物模型实验和脑成像实验等。脑成像遗传学实验是一项用非侵入性神经成像技术评估基因组变体与脑结构和功能之间关联的新兴技术。例如ProcessGeneLists(PGL)通过使用与疾病相关的基因并计算这些基因在每个大脑区域的标准化mRNA 表达平均值,将遗传学和人类大脑成像联系起来。这些基因表达最多的共同脑区域成为感兴趣区域,用于在有或没有疾病的受试者中进行脑成像,从而减少了多重比较[22]。
基因组大数据的涌入也为语言进化研究者提供了独特的新希望。许多现存物种以及不断增加的灭绝动物(包括古人类)的丰富的遗传数据都可在网上自由取用。这些数据之间相互参考对于在语言进化的多因子背景下确定哪些候选基因显示出人类祖先中有趣的变化模式很有价值。古人类遗传学研究类似时光机器,可重构人类交流的起点,从而使语言起源研究从“推测”和“假说”过渡到实证科学。发声学习是人类语言的一个重要特征,显示发声学习能力的物种是有关人类语言本质和进化的重要信息来源,尤其是关于语音方面。
同时参与语言进化研究的有认知神经科学、考古学、行为学、计算机科学、人类学和理论语言学等。这种跨学科的讨论对于语言学家来说可能是一个警钟,因为语言学界长期从事内部专业化的理论研究,这可能成为一道阻碍跨学科合作的防火墙。然而大数据的涌入以及学科的异质性对研究也造成了挑战。例如,需要在极为异质的实证证据中找到一个趋同点,能集中多学科知识,妥协一些对立的立场,排除仅仅在单一学科内适用的解决办法,从而实现对语言进化的全面了解。而且不同学科领域的交流需要一个共同的基础,即一个可以在多样性学科中构建联系的共享概念空间。共享概念空间的建立需通过每种学科各自的不断发展以及构建,能够对不同数据提供统一视角的动态开放解释性模型。比较生物语言学着力在人类语言与其他生物的认知构件中寻找普遍性和变异性,已成为生物语言学繁荣的动因。这可能为语言研究提供一个共享的概念区,用以处理异质的数据,实现语言跨学科研究的深入发展。
[利益声明Declaration of Interest]
作者声明本文不存在利益冲突。