回顾与展望：书面语句长研究

2021-12-13 09:26南京师范大学马江涛马广惠

外语教学理论与实践 2021年4期

南京师范大学马江涛马广惠

提要：本研究按照时间脉络和研究领域梳理了现有书面语句长研究，并对未来研究进行了展望。现有书面语句长研究主要领域包括文体风格研究、文本分类研究、语言属性研究和可读性研究。现有研究尚存一定局限性。未来研究应扩大研究领域，避免单一研究模式所具有的内在缺陷。根据三角验证法原则，从不同的理论视角，协调不同学科领域研究者收集的数据，以不同的研究方法系统揭示与二语学习者相关的书面语句长这一语言现象的全貌。

1. 引言

2. 研究回顾

现有书面语句长研究主要涵盖四个研究领域：文体风格、语言属性、文本分类和可读性。

1) 文体风格

文体风格研究可分为三类。

第一类是作者文体风格研究及基于此的作者身份考辨研究。根据某阶段研究所采用的主要测量量度，作者文体风格及其作者身份考辨研究先后经历了无分布句长统计量阶段、句长分布阶段和句长分布建模三个阶段。无分布句长指的是以简化数据(例如均值、标准差等)所表征的句长；句长分布是指将全部句长(或者句长对数)进行分组后，各句长组(或者句长对数组)由小到大排列时所呈现出来的各个句长组(或者句长对数组)的频数特征；句长分布建模是指用数学函数对句长分布的规律进行表征。

无分布句长统计量阶段研究所采用的句长量度包括均值、中位数、四分位数(quartiles)和十分位数(deciles)等。该阶段研究通常所采用的研究方法为：首先，比较某一位作者作品之间的无分布句长统计量，如果其结果一致，则表明无分布句长统计量可用作该作者风格指标；之后，比较不同作者之间作品的无分布句长统计量，如果结果有差异，则表明无分布句长统计量可用于表征不同作者文体风格。该阶段研究结果一致认为，无分布句长统计量可用作作者文体风格指标。在此基础之上，一些学者对作者身份存疑的作品进行了作者身份考辨，将作者身份存疑的作品与被怀疑为其作者的作品的句长量度进行比较，如果二者结果一致，则作者身份相同；反之，作者身份不同。Scudder(1923)通过比较10位作者英语作品的句长均值，发现不同作者其作品的句长均值不同，从而开始思考句长与作者文体风格之间的关系。Yule(1939)是第一位正式将句长用作作者文体风格指标的学者(Barr， 2001： 375； Sichel， 1974： 25； Tayade， 2009： 34)。他所研究的语料为Bacon、Coleridge和Lamb的英文作品。其研究结果证实了无分布句长统计量(均值、中位数、四分位数和十分位数等)是作者文体风格的指标。基于此，该研究考辨了法语散文Imitatio和英语散文ObservationsupontheBillsofMortality的作者身份，其结果表明：Imitatio的作者为ThomasKempis而非Gerson；ObservationsupontheBillsofMortality的作者并非Sir Williams Petty。Morton(1965)的研究语料为两位散文家(Herodotus和Thucydides)和三位口述作者(Lysias、Isocrates和Demosthenes)的希腊语书面语作品，其研究结果也表明无分布句长统计量(均值、中位数、四分位数和十分位数等)能够确定并比较不同作者的文体风格。该研究以此为基础考辨了希腊语《新约全书》中被认为Apostle Paul为其作者的14封信。其研究结果表明，Romans、1stCorinthians、2ndCorinthians、Catatians这四封信的无分布句长统计量总体一致，并且这四封信的无分布句长统计量与其余十封信的无分布句长统计量之间具有显著差异。也就是说，这四封信的作者相同。如果这四封信的作者为Apostle Paul的话，其余十封信至少分别为六位作者所写。

句长分布阶段所采用的量度为句长频数分布或句长对数频数分布。该阶段研究得出相同结论：句长分布可用以表征作者写作风格；句长对数频数分布为正态分布，而句长频数分布为偏态分布，且该阶段的某些学者可据此通过句长分布来考辨作者身份。Williams(1940)研究发现Chesterton、Wells和Bernard Shaw三位作者英语作品的句长对数频数分布为正态分布，且三位作者的句长对数频数分布曲线形态不同，可以籍此区分三位作者。与Williams(1940)所持观点不同，Wake(1957： 333)认为尽管句长对数频数分布为正态分布或者接近正态分布，但其极端分布(极长句一端的句长分布)不具有区分性；而句长频数分布虽为偏态分布，但其极端分布具有显著特征，可以籍此来区分作者。基于对Xenophon、Aristotle和Plato三位作者作品的研究，Wake(1957)认为句长频数分布(偏态分布)是作者文体风格的客观评判标准。基于此，该研究考辨了希腊语作品Cynegeticus、HistoriaAnimalium、NicomacheanEthics、EudemianEthics和SeventhLetter的作者。其研究结果表明，Cynegeticus的作者不是Xenophon；HistoriaAnimalium的作者不是Aristotle；NicomacheanEthics和EudemianEthics两个作品的共同部分作者为Aristotle，其余部分分别为不同作者所书写；Plato是SeventhLetter的作者等。类似Wake(1957)的研究结论，Barr(2001)认为同一作者作品中不同类型句子的句长频数分布具有区别性特征。Mannion & Dixon(2004)也以Goldsmith及其同时期的9位作者作品证实了句长频数分布对于不同作者文体风格所具有的区分作用。基于此，该研究考辨了作者身份存疑的十个英语作品的作者是否为Oliver Goldsmith。其所采用的两种研究方法为x2拟合优度检验(x2goodness-of-fit test)和相关图分析(correspondence analysis)。其研究结果表明，10篇作者身份存疑的英语作品中有四篇(TheRevolutioninLowLife，ATrueHistoryfortheLadies，SomeThoughtsPreliminarytoaGeneralPeace和OnPublicRejoicingsforVictory)的作者确定无疑为Goldsmith。

句长分布建模阶段以数学模型来表征作者文体风格。该阶段研究结果并不一致，不同学者所得出的句长分布模型各异，在该阶段中仅有个别学者依据其研究结果考辨了作者身份，Sichel(1974)提出以数学模型来表征句长分布具有重大意义。基于Yule(1939)、Williams(1940)、Wake(1957)和Morton(1965)研究中的数据，Sichel(1974)发现复合泊松分布(compound Poisson distribution)可以表征不同作者文体风格，其数学函数如公式1所示。该研究同时以其所构建的数学模型考辨了Imitatio的作者身份，并得出与Yule(1939)相同的研究结论，即Gerson不是该作品作者。Tayade & Prabhuajgaonkar(2009)研究结果表明Pandit Jawaharlal Nehru的英语作品句长分布为Pearsonian Type-I概率分布(Pearsonian Type-I probability distribution)，其数学函数如公式2所示。Furuhashi & Hayakawa(2012)研究结果表明日本作者的句长分布为对数正态分布(lognormal distribution)(见公式3)或对数正态分布与正态分布的叠加(见公式4)。Pande & Dhami(2015)研究表明Rabindranath Tagore、Pandey Bechan Sharma、Premchand和Mohan Rakesh四位作者的印地语作品句长分布为单位移型EPNB分布(one-displaced form of EPNB distribution)，其数学函数如公式5所示。

公式1：

公式2：

公式3：

公式4：

公式5：

第二类是体裁文体风格研究。现有书面语句长研究较少涉及体裁分析，该领域所采用的句长量度也包括无分布句长统计量、句长分布和句长分布数学模型三类。Gani(2013)研究发现英语散文句长均值小于小说的句长均值。Clayman(1981)研究发现，基于单词的希腊六步格诗句长分布类似于希腊散文句长分布，其只有一个峰值；而基于音位的希腊六步格诗句长分布有多个峰值，并且能够灵敏反映出风格和主题内容的变化。Yasumoto(1965，1966)和Sasaki(1976)的研究结果表明日语小说句长分布或为对数正态分布(lognormal distribution)或为γ分布(gamma distribution)，而Ishida & Ishida(2007)研究结果表明日语散文和短篇小说句长分布为超帕斯卡分布(Hyperpascal distribution)，其数学模型如公式6所示。Sigurd et al.(2004)研究结果表明英语句长和其频数之间关系符合γ分布(见公式7)，且该公式可用于体裁区分。

公式6：

公式7：

fexp=a*Lb*cL

第三类是文体风格演变研究。句长是文体风格(Barr， 2001； Furuhashi & Hayakawa， 2012； Mannion & Dixon， 2004； Morton， 1965； Pande & Dhami， 2015； Sichel， 1974； Wake， 1957； Williams， 1940； Yule， 1939)，句长的改变即为文体风格的演变。文体风格演变研究所采用的句长量度主要为句长均值。该领域研究结果一致认为，句长随着时间的发展而变短。Scudder(1923)研究发现，十九世纪作者英语作品句长大于二十世纪作者英语作品句长。Fan(2007)研究结果表明，二十世纪50—60年代LOB语料库(Lancaster-Oslo /Bergen Corpus)的句长均值大于二十世纪80—90年代BNC语料库(British National Corpus)的句长均值。也就是说，标准英式英语书面语句长在30年间变短了。Savoy(2017)研究结果发现，从Washington到Trump共45位美国总统在200年间的英语演讲辞句长均值呈现出下降趋势。

2) 语言属性

语言共性与特性研究较少。从句长视角对其进行探索的代表人物为Jiang & Liu(2015)。Jiang & Liu(2015)研究发现英汉两种语言具有共性，英语和汉语的不同句长的依存距离(dependency distance)分布模型具有极大的相似性。该研究同时发现英汉两种语言各自具有其特性，汉语的相邻依存(adjacent dependencies)百分比随着句长的增加在一定范围内波动，英语的相邻依存百分比随着句长的增长具有下降趋势，21组汉语句长的依存距离均值全部高于相应的21组英语句长的依存距离均值。

3) 文本分类

文本分类研究由通用文本分类研究转向具体学科领域文本分类研究。该领域常用的研究方法包括句长比较、句长均值比较、多元判别分析和聚类分析等。

通用文本分类研究结果一致表明，句长可用于文本类型分类。Kelih et al.(2006)以斯罗维尼亚语文本为语料证实，仅仅基于句长的文本分类是有可能成立的。该研究以多元判别分析(multivariate discriminant analysis)得出基于句长的新文本分类，即口语语篇、技术语篇、日常叙述、科学语篇、新闻语篇和私人信件。新文本分类既不同于功能类型分类也有别于交际—情景文本分类。Grzybek et al.(2007)研究结果表明句长能够很好地区分小说、短篇小说、私人信件、戏剧、评论和科学文本六类俄语文本。Hou et al.(2014)对文本句长进行聚类分析和句长分布比较，结果表明句长能够清晰地区分书面语文本、口语文本和对话文本。

具体学科领域文本分类研究所采用的研究方法主要为句长比较和 /或句长均值比较，其研究结果并不一致。Dhar et al.(2016)研究结果表明，句长不能被用作将孟加拉语医学文本与另外4个领域文本(商业文本、运动文本、法律文本和政治文本)区分开来的参数。Zorita & Sandoval(2016)研究结果表明句长可以用于文本分类研究，句长可以区分西班牙语书面语媒体文本(报纸媒体文本和医学媒体文本)和书面语医学学术文本。

4) 可读性

根据测量书面语文本可读性所采用的量度发现，可读性研究经历了从依托简单量度阶段到依托可读性测评公式阶段的转变。

依托简单量度研究阶段所采用的可读性量度为句长、句长均值、句长中位数等简单句长量度，所针对的目标受众为大众读者，通常由权威机构、出版商或研究者来评判书面语文本可读性等级。该阶段的研究结果一致表明句长与可读性之间成反比。Kearney(1945)分析比较了三类英语一级读物的句长：学龄前儿童读物、启蒙书和初级读物。该研究发现英语读物句长的增加可能代表着阅读难度的增加，学龄前儿童读物中短句数量多于启蒙书，启蒙书中短句数量多于初级读物，三类读物中长句比例极少。Huxtable(1977)研究发现，以句长来测评英语作品的可读性具有客观性，且句长和可读性成反比。其中： a) Faulkner的早期著作LightinAugust句长均值为19个单词；Fitzgerald的著作TenderistheNight句长均值为33个单词；James的著作TheGoldenBowl句长均值为37个单词；Dickens的著作MartinChuzzlewit句长均值为39个单词；Eliot的著作Middlemarch句长均值为42个单词；Boswell的著作LifeofJohnson句长均值为64个单词；Sterne的著作TristramShandy句长均值为68个单词；Faulkner的晚年著作RequiemforaNun句长均值为116个单词。b)英语作品句长均值越高，其可读性越低。c)与LightinAugust(1932)相比，Faulkner的老年作品RequiemforaNun(1951)的可读性急剧下降。Stapler(1985)研究发现，12家美国都市报新闻报道中导语段落阅读难度远大于其2—4段部分的阅读难度，12家英语都市报导语段落的句长均值(26.1个单词)和句长中位数(28.1个单词)大于随后的2—4段的句长均值(21.7个单词)和句长中位数(23.1个单词)，导语段落为独句段的百分比(83.6%)大约是2—4段独句段百分比(45.9%)的2倍。根据Gunning(1952)和Flesch(1962)所建议的可读性标准等级来看，导语段落归属于“难以阅读”等级，随后的2—4段归类于“较难阅读”等级。

依托可读性测评公式研究阶段所采用的可读性量度为各类内含句长的可读性测评公式，其研究受众为特定领域读者(以医学领域读者为主)，其文本可读性等级主要由权威机构或研究者评判，极少数研究根据读者所感受到的难易度对可读性进行分析。该阶段主要关注两类研究。第一类研究描述书面语文本的可读性等级。该类研究的语料涉及外科杂志中的英语文章(Hall， 2006)、足踝患者在线医患英语阅读材料(Sheppard et al.， 2014)、乳房X光照相术在线病患英语阅读材料(AlKhalili et al.， 2015)、在线髋关节内镜检查相关信息英语文本(Mehta et al.， 2018)和临床试验在线描述英语文本、在线健康主题英语文章和在线临床医生英语笔记(Wu et al.， 2015)等。该类研究结果一致表明医学领域的英语文本难以阅读，其阅读难度显著高于美国权威机构所规定的可读性等级(6—7级)。通常阅读难度源自于长句(Hall， 2006； Wu et al.， 2015)，可采取将长句拆分成短句等措施来促进可读性(Sheppard et al.， 2014； Wu et al.， 2015)。第二类研究侧重于可读性测评工具比较或新测评工具的研发。该类研究并未取得一致的研究结果。Holster et al.(2017)建议根据Yomiyasusa可读性级别来选择英语读物，该研究结果发现Lexile句长均值对于日本大学生所感知到的英语读物可读性等级仅具有中等水平的预测力(40%的方差)，而Yomiyasusa可读性级别可预测68%的方差。Cunningham et al.(2018)研究发现Lexile测评系统(Lexile Framework)和Flesch-Kincaid分级公式(Flesch-Kincaid Grade-Level formula)这两个可读性测试工具在教育背景中使用的效度不足。Eika & Sandnes(2016)尝试依托计算机技术实现自动测量网络英语文本可读性级别的可能性。他们提出三个新的可读性量度：语言问题特征(language problem signature)、词性特征(part-of-speech signature)和词性熵(part of speech entropy)。其研究结果表明这三个量度的可读性测评精确度低于传统可读性测评工具(依托句长的可读性测评公式)。

层次分析法主要是将复杂的问题分解后简单化，并将对量化指标构造成递阶层次结构。将量化指标进行两两对比分析，确定指标相对重要性，由相关专家进行判断，从而对要决策的方案进行排序。应用AHP方法分析问题时，主要分为4个关键的步骤[8-9]：

3. 反思与展望

现有书面语句长研究涵盖众多语言(英语、希腊语、俄语、西班牙语、日语、拉丁语、汉语、斯罗维尼亚语、孟加拉语、德语和印地语等)，涉及广泛体裁(散文、小说、戏剧、诗歌、新闻媒体文本、书信、评论和演讲辞等)，取得了丰硕成果，为未来研究奠定了坚实的理论根基和方法论基础。然而，纵观书面语句长现有研究，其尚存在两方面的不足。其一，研究对象涵盖面不足。现有书面语句长分布研究所采用的研究语料绝大部分为专业写作者的书面语文本，极少涉及二语学习者所产出二语书面语文本；现有可读性研究多基于权威机构或者研究者所判定的可读性级别，甚少有研究依据二语学习者所感受到的书面语进行可读性探索。其二，研究模式单一。现有研究往往依靠单一数据类型(定量数据)来取得研究结果；其研究方法侧重定量研究而忽视定性研究(例如，各类句长的搭配规律)。现有研究往往从单一理论视角探讨书面语句长这一语言现象，且绝大多数研究的共同研究者源自于单一学科领域。单一研究模式具有内在缺陷性，其导致研究信度和效度不足，也同时导致众多研究无法取得一致研究结果。未来研究可以以二语学习者为研究对象，同时打破单一研究模式，采用三角验证法来研究与二语学习者相关的书面语句长。

1) 与二语学习者相关的书面语句长现象研究

写作和阅读是二语学习者所必须掌握的两项语言技能。二语学习者所产出的书面语文本和其所阅读的书面语文本和二语学习者紧密相关。研究二语学习者所产出书面语的句长和依据二语学习者所感受到的难度研究可读性，能够为促进二语学习者语言能力的发展提供启示。

写作文本是二语学习者语言能力的重要产出成果。句长是二语学习者所产出书面语文本的外在显性特征。籍由句长可对二语学习者书面语文本进行两方面的探查。一方面，二语学习者书面语的文体风格和体裁差异可据句长而知。语言是思维和文化的双重载体，思维差异和文化差异终将导致语言表达方式的差异。与此同时，语言学习也会导致学习者思维和文化人格的形成。二语学习者母语和二语之间的差异致使其形成新的思维方式和文化人格，其二语写作也因此而具有其独特的文体风格。而体裁的理论基础决定语篇的图式结构，影响限定该语篇对内容和风格所做的选择(Swales， 1990： 58)。句长和其分布是作者写作风格的指标(e.g. Morton， 1965； Wake， 1957； Williams， 1940； Yule， 1939)，并可被用以体裁区分(Gani， 2013)。二语学习者书面语总的文体风格和体裁差异可以籍由句长和句长分布而得以分析。另一方面，学习者的二语发展水平可据其书面语的句长分布而得以探知。二语写作是二语学习者对于二语进行综合运用能力的体现。写作能力是判断学习者水平的最重要因素(严明，2014： 10)，二语学习者书面语句长量度可映射出其二语发展状态。

阅读文本是二语学习者提升语言能力的重要输入资料。阅读文本的可读性是由输入转化为吸收的一个有力影响因素。依据二语学习者所感受到的难度，可探索三个方面的供二语学习者阅读学习所用的书面语文本的可读性：二语学习者所用教材的可读性、二语学习者所用课外纸质读物的可读性和二语学习者所用网络文本的可读性。首先，二语学习者所用教材的可读性研究。教材是二语教学和二语学习者学习赖以存在的基本工具和重要元素。良好可读性是高质量教材所必备的重要条件。一纲多本的现象给二语教学和学习带来困惑。依据二语学习者所感受到的难度，对教材可读性进行基于句长的多元探索和三角验证，通过比较分析而选取真正难度适宜的教材，更加有利于为二语学习者系统学习并掌握二语语言知识技能打下良好基础。其次，二语学习者所用课外纸质读物的可读性研究。扎实的二语语言功底不仅仅依赖于二语课堂教学，也依赖于学习者课外广泛阅读。选择在二语学习者可读性最近发展区内的纸质课外读物对于促进学习者二语水平的提高具有重要意义。因此，基于二语学习者所感受到的难度，着手探索二语学习者所用课外读物的基于句长的可读性工具的开发，或对该类课外读物进行可读性分析，能够帮助二语学习者选择具有适读性的读物以助其快速提升。最后，二语学习者所用网络文本的可读性研究。在当今信息化时代背景之下，泛在学习和移动学习成为主流学习方式之一。丰富多样的网络书面语文本成为学习者触手可及的学习资源。网络语言具有多样性、混合性和动态性特征(张颖炜，2015)，其可读性不一。探测二语学习者所用网络书面语文本的可读性(尤其是二语学习者所感触到的可读性)，可为二语学习和教学选择难度水平适宜的在线资料提供借鉴,以助其选择丰富且有针对性的阅读资料，促进二语教学和学习效果。

2) 三角验证法的实施

坚实的研究需要三角验证。采用三角验证法可以增强研究的信度和效度，产生更为客观的研究结果。三角验证法指的是“在某一现象研究中综合采用两种及以上理论、数据源、方法或研究者”(Denzin, 1989： 25)。据其定义可知，未来研究可以采用三角验证法对与二语学习者相关的书面语文本进行四个方面的三角验证：理论三角验证、数据三角验证、研究方法三角验证和研究者三角验证。

理论三角验证有助于全面诠释与二语学习者相关的书面语文本的句长研究结果。理论三角验证是指根据不同的理论或观点对同一现象进行探讨分析。采用理论三角验证，从不同的理论角度或观点视角(语言学、文体风格统计学和认知语言学视角等)着手，对与二语学习者相关的书面语句长进行研究，可以避免单一理论或视角所带来的局限性。研究者籍此能够从多个角度证明一个观点，从而对研究结果进行全面而又真实的诠释。

数据三角验证能够增强与二语学习者相关的书面语句长研究的效度。数据三角验证是指从研究语料中汇聚多种数据。对于与二语学习者相关的书面语句长研究而言，任何单独统计分析都不足以构建科学合理的效度，因为研究需要源自于多方面证据的多组数据(Tong, 2019： 246)。聚集两种及以上数据(数字或非数字)，让多种数据之间进行交叉验证和对话，使其相互佐证和相互补充，并以不同方式对数据进行诠释解读，可以使与二语学习者相关的书面语句长现象更加清晰，以增强研究的说服力。

研究方法三角验证有利于揭示与二语学习者相关的书面语句长这一现象的全貌。研究方法三角验证指利用不同研究方法来研究某一现象。对与二语学习者相关的书面语句长研究来说，研究方法三角验证可以在两个层面上进行：方法内三角验证和方法间三角验证。首先，方法内三角验证。在同一研究范式内部，可采用两种或以上具体研究方法来研究二语学习者书面语句长这一语言现象。其次，方法间三角验证。研究者可结合不同研究范式(定性研究和定量研究)来探索与二语学习者相关的书面语句长。通过归属于不同研究范式的研究方法三角验证，透过多个角度进行数据分析处理，可以勾画出研究对象的完整图画(张侨平等，2015： 34)，能够窥得与二语学习者相关的书面语句长现象的全貌。

研究者三角验证有益于增强与二语学习者相关的书面语句长研究结果的可靠洞见。研究者三角验证指由不同研究者对同一研究问题进行研究。不同研究者既可来自相同的学科领域，也可源自不同的学科领域。尤其是不同学科领域的学者可对与二语学习者相关的书面语句长这一语言现象进行多学科领域合作探讨，各自运用其最擅长的研究方法和研究工具，各自做出其贡献。最终，通过不同学科领域视角所提供的证据，协调来自不同学科领域的研究结果，从而增强与二语学习者相关的书面语句长现象这一领域研究的可靠洞见。

4. 结语

现有书面语句长研究主要集中在四个领域：文体风格研究、文本分类研究、语言属性研究和可读性研究。现有研究为未来研究打下坚实基础，但其尚存研究对象涵盖面不足和研究模式单一的局限。未来研究应扩大研究领域，避免单一研究模式所具有的内在缺陷，根据三角验证法原则，从不同的理论视角协调不同学科领域的研究者，收集更为充足的数据，以不同的研究方法对与二语学习者相关的书面语句长进行探索。借助相互补充、相互参照又互相兼容的研究结果可以获得更为真实全面的研究结论，以便系统地揭示与二语学习者相关的书面语句长这一语言现象的全貌，深化对书面语句长的认识，并为二语学习和教学提供启示。

回顾与展望： 书面语句长研究

1. 引言

2. 研究回顾

3. 反思与展望

4. 结语

回顾与展望：书面语句长研究