基于结构方程模型的高级水平汉语学习者语言理解能力结构探究

2013-10-13 07:39:30王佶旻

华文教学与研究 2013年2期

黄敬，王佶旻

（1.2.北京语言大学汉语水平考试中心，北京，100083）

0.引言

语言能力问题是语言测试研究的基本问题，因此对这个问题的讨论在语言测试理论中显得尤为重要。根据接受性和产出性两类模式，语言能力可分为语言理解能力和语言表达能力（Brown，1996）。听力理解能力和阅读理解能力都属于语言理解能力。关于语言能力结构的研究，国内外学界都做了大量的研究。但是在国内汉语作为第二语言测试界，有关语言理解能力的研究还有待补充。听力理解和阅读理解都是复杂的和多维的过程，国内外学者们都在试图从不同角度描述其内部包括的子能力。正如 Alderson＆Lukmani（1989）指出，不同的研究者认为存在不同数量和类型的子能力，但是有的研究者拥有实验数据的支持，有的却没有（例如 Davis，1968；Munby，1978；Richards， 1983； Weir， 1993）。同时，在子能力的数量和类型这一问题上，学者们仍然没有达成一致。在国内，有关语言理解能力结构的研究，特别是汉语作为第二语言的语言理解能力的结构研究尚不充分，本研究可作为这方面研究的补充。同时，对语言理解能力结构进行深入研究，可以为汉语测验的编制提供思路，为分数解释和诊断性测验提供依据，也可以为汉语教学起到指导和改善作用，为有针对性地进行听力和阅读技能的训练，改进课堂教学效果提供科学的依据。

基于以上理论目的和实践目的，本研究将使用结构方程模型（Structural Equation Model，SEM）的方法，探讨汉语作为第二语言的高级水平学习者语言理解能力的结构。本研究涉及语言理解能力及其内部子能力这些潜变量的复杂关系，传统的统计方法（如回归分析）不能妥善处理这些潜变量，而结构方程模型能够同时处理潜变量（latent variable）及其外显指标（observable indicators）（侯杰泰、温忠麟、成子娟，2004）。此外，结构方程分析经常用以比较不同模型，将同一组数据用不同的模型去拟合，看看哪一个模型拟合更好，从而推想被试的能力结构（侯杰泰、温忠麟、成子娟，2004），这也有利于本研究比较汉语作为第二语言的高级水平学习者语言理解能力结构的多个可能模型，并最终得出最优模型。在语言测试领域，一些研究也使用过相似的方法来研究第二语言能力结构（如Bachman ＆ Palmer， 1981， 1982；Buck，1991，1992； Sang， Schmitz， Vollmer， Baumert ＆Roeder， 1986； Sasaki， 1996； Shin， 2005），但很少有研究使用结构方程模型的方法来研究汉语作为第二语言学习者语言理解能力的结构。

1.研究问题

基于以上论述，本研究主要解决以下问题：

第一，汉语作为第二语言的高级水平学习者的听力理解能力和阅读理解能力这两种语言理解能力是否可分？如果可分，其结构分别是什么？其内部所包括的子能力的数量和类型分别是什么？

第二，汉语作为第二语言的高级水平学习者的语言理解能力是否可分？如果可分，语言理解能力的结构是什么？其内部所包括的子能力的数量和类型分别是什么？

2.研究背景

基于以上提出的研究问题，我们将从语言理解能力结构研究和听力理解能力与阅读理解能力的结构关系研究两方面来梳理前人的有关研究成果。

2.1 语言理解能力结构研究

关于语言理解能力的结构，学界一直存在着争议。归结起来主要有两个基本问题：第一，语言理解能力的可分性；第二，如果可分，那么语言理解能力内部的子能力的数量和种类分别是什么？对于第一个问题的回答，研究者关于语言理解能力结构主要持有两派观点，即语言理解能力不可分论和语言理解能力可分论。

持不可分论的学者认为，语言理解能力由一个单一的、整体的、综合的特质构成，并不存在不同的可分性的子能力。Lunzer＆Gardner（1979）根据研究指出，阅读是一种单一的、整体性的技能，并没有明晰的证据表明其内部存在可分离的子能力。Alderson＆Lukmani（1989）通过研究也对阅读理解能力是否由不同的子能力构成，以及这些子能力之间是否存在层级关系提出了质疑。他认为，即使是专家，有时候也很难判断某一道阅读题究竟考查的是哪一种阅读能力。

持可分论观点的学者认为，语言理解能力是由多个各不相同的子能力构成的。但是对于构成语言理解能力的子能力的数量和种类，学界一直未能达成共识。目前存在两派观点：

一种观点认为，语言理解能力由两部分构成。在听力理解能力结构研究方面，一些研究者提出听力理解能力包括两个部分（Clark＆Clark， 1977； Hughes， 1989； Oakeshott－Taylor，1977；Rivers，1966），最为典型的是 Carroll（1972），他认为听力理解能力由两部分构成：一是理解语言信息的能力；二是将语言信息和广阔的交际语境联系起来的能力。在阅读理解能力结构研究方面，目前的研究者越来越倾向于认为，阅读理解能力由解码和理解两部分构成。解码是识别词汇，而理解则包括对句子进行语法分析、理解句子在语篇中的意义、建构语篇结构以及将这些理解与已有知识整合等（Gough， Ehri＆ Treiman， 1992）。由于语言材料呈现的方式不一样，在解码阶段，听力和阅读存在明显的差异，而在理解阶段，两者则是一致的。

另一种观点认为，语言理解能力内部包含三种及以上的子能力。但是，对于语言理解能力内部的子能力的数量和种类，研究者并未取得一致意见。在听力理解能力结构研究方面，研究者们一直尝试确定构成听力理解能力的子能力。但是，对于构成听力理解能力的子能力的数量和种类，学界一直未能达成共识。不同的研究者从不同的角度划分了听力理解能力的子能力，少至3种，多达250种（例如Kenneth， 1976； Munby， 1978； Richards， 1983；Valette， 1977； Weir， 1993；杜建， 1992；谷陵，2003；金天相、李泉，1994；李清华，1987；刘秀明、王苹，2008；杨惠元，1989，1991；朱正才、范开泰，2001）。在阅读理解能力结构研究方面，从事阅读研究的学者们同样也都一直试图确定构成阅读理解能力的子能力，并提出了许多不同的子能力列表。但是对于构成阅读理解能力的子能力的数量和种类，学界也未能达成共识。不同的研究者从不同的角度划分了阅读理解能力的子能力，少至3种，多达100 种（例如 Carroll，1993；Carver，1982， 1983，1984， 1990， 1992； Davis， 1944，1968； Grabe，1991； Gray， 1960；Harmer， 1983； Kintsch ＆Dijk，1978；Kintsch＆ Yarbrough，1982；Lennon，1962；Munby，1978）。综观此类研究，多角度考察了语言理解能力，对语言理解能力的研究呈现出多元化趋势。既有从语音（重音、语调等）、词汇、语法（句型、句式等）等语言要素的角度考察语言理解能力的结构，也有从交际目的、说话者态度等语用学角度来分析语言理解能力的结构，还有从修辞、连贯等篇章要素的角度来研究语言理解能力的结构，等等。这样的划分虽然全面，但是带来的一个严重的问题就是划分的维度和层次不清晰，有的研究对于子能力的划分过于细致，导致下位能力与上位能力之间层次混乱；有的研究对于子能力的划分过于笼统，导致有的子能力过于复杂，实际上是一个综合性能力。这样既加大了子能力定义的难度，也影响了其理论与实证价值的实现。

在实证研究方面，大多数的研究使用了因素分析的方法（Carroll， 1993； Davis， 1968；Lennon， 1962； Rost， 1993； Spearitt， 1972；金琰如、王佶旻，2012）和多元回归分析的方法（Davey， 1988； Drum， Calfee ＆ Cook， 1981；Freedle ＆ Kostin， 1996； Nissan， DeVincenzi＆Tang，1996； Pollitt， Hutchinson， Entwistle ＆DeLuca， 1985）。随着统计技术的发展，一些研究者开始使用认知诊断模型来研究语言理解能力（Buck＆ Tatsuoka， 1998； Jang， 2009；李小兰，2008；王静，2008；徐式婧，2007；杨旭，2010），但此类研究都是侧重解决有关测验分数的诊断性报告的问题，而非研究语言理解能力结构本身的结构特点。

2.2 听力理解能力和阅读理解能力的结构关系研究

有关听力理解能力和阅读理解能力的结构关系依旧没有定论。Reves＆Levine（1988）运用相关分析和多元回归分析进行研究，结果发现两种语言理解能力（听力理解和阅读理解）都包含一个单一因子和许多子能力。他们认为阅读理解能力内部的子能力在某种程度上来说和听力理解能力内部的子能力是相似的。听力理解能力不同于阅读理解能力，是因为听力理解与阅读理解相比，是更为整体性的语言理解能力。口头话语和书面话语之间的差异会导致处理模式的差异。Buck（1991）使用多质多法（Multitrait－Multimethod， MTMM）模型进行构想效度的研究表明听力理解能力作为一种不同的特质区别于阅读理解能力。然而，Buck（1992）的研究指出支持听力理解能力作为一种不同的特质这一观点的证据是矛盾的。通过两次研究所得出的不同结果，他进一步推测研究中的 “强大特质效应”的存在并不能表明听力理解能力区别于阅读理解能力。Bae＆Bachman（1998）使用验证性因素分析进行研究，认为听力理解能力和阅读理解能力存在重叠部分，但各自又有独特的方面。Freedle＆Kostin（1994，1999）对比了听力理解能力和阅读理解能力，也得出了类似的结论。Buck（2001）在对以往理论研究和实证研究总结的基础之上，认为 “听力理解能力和阅读理解能力的许多重要特征实际上是语言理解能力所有形式的特征。虽然两者在某些方面存在独特性，但它们拥有许多共同的特征。”Park（2004）则认为听力理解能力和阅读理解能力是不同的。第二语言听话者比较容易处理推理性信息，而第二语言阅读者则较为容易处理事实性信息。语言知识和背景知识对于听力理解能力来说都十分重要，而在阅读理解能力中，背景知识没有语言知识重要。

3.研究方法、过程及结果

3.1 样本

本研究的数据来自于2010年10月16日施测的HSK［高等］考试，共有来自52个国家和地区的2733名考生参加了此次考试。此考试适用于汉语作为第二语言的高级水平学习者，接受过3000学时和3000学时以上现代汉语正规教育的学习者（包括具有同等学历或同等水平的汉语学习者）可达到这一级标准。

3.2 测量工具

本研究使用的试卷是HSK［高等］的笔试试卷。笔试试卷分为三个部分：听力理解、阅读理解和综合表达，共120题。本研究由于需要同时考查听力理解能力和阅读理解能力的结构，故只选取听力理解和阅读理解两个分测验。其中听力理解分测验主要考查应试者听懂并理解汉语口语的能力，有2个小部分，共40题，约30分钟；阅读理解分测验主要考查应试者看懂并理解汉语书面材料的能力，有2个小部分，共40题，约40分钟。

3.3 观测变量

3.3.1 对试题进行分类

基于前人的研究和HSK［高等］测验试题的内容以及测验问题和选项分析，80道测验试题被分为以下3类：

1）概括总结能力：理解并抓住语言材料的主要内容的能力。

2）细节捕捉能力：理解并抓住语言材料的有关细节的能力。

3）推理判断能力：理解并根据语言材料进行推理的能力。

基于此分类，两位专家受邀分别考查了听力理解分测验和阅读理解分测验的语言材料以及问题和选项，对80道测验试题进行了归类，并比较分类结果。两位专家分类结果一致的题目有77道，占总题数的96%。未能取得一致意见的题目为3道，其中阅读理解分测验试题2道，听力理解分测验试题1道。在经过讨论之后，两位专家对所有题目的分类取得了一致意见。分类结果见表1：

表1 ：试题分类结果

3.3.2 项目合并

在结构方程模型中，观测变量（或称指标）被用来测量那些不能被直接测量的潜变量（或称因子）。题目或题目组均可作为因子的外显指标。就本研究而言，选择采用题目组作为各因子的观测变量，将各分测验中相同分类下的几个题目合并成为一个新的连续变量。主要原因有：第一，这80道试题均为二项记分，不能满足现有结构方程模型软件的需要；第二，结构方程模型对于样本量与观测变量个数之间的比值有一定的要求，样本量小，变量个数多的情况下极有可能得到不稳定的解，因此本研究采用将题目划分成小组的方式来减少变量个数。在项目合并的过程中，应遵循以下原则：1）合并的项目应该是相似的，并被用来测量同一构念（Kishton＆ Widaman， 1994）；2）合并的项目应该来自同一篇文章，因为内容相似也是项目合并的一个重要原则（Nasser，Takahashi＆Benson，1997）；3）项目合并后的合成分数应该尽可能呈正态分布（Bandalos＆Finney，2001； Enders＆ Bandalos， 1999）；4）项目小组中的每一项目应该是单维的（Hattie，1986；Hayduk， 1996； Kishton ＆ Widaman， 1994）。

因此，最终得到13个听力变量和10个阅读变量，总共为23个变量，如表2所示：

表2 ：观测变量与分数

3.4 研究过程

3.4.1 初步数据分析

首先，对23个观测变量进行描述性统计分析，并计算各变量的组间内部一致性信度系数。计算结果如表3。

表3 ：各变量组间内部一致性信度系数

由表3知，听力理解测验13个题目组的内部一致性信度系数为0.852，阅读理解测验10个题目组的内部一致性信度系数为 0.816，所有23个题目组的内部一致性信度系数为0.900，可以看出各分测验题目组间具有较高的内部一致性。

3.4.2 结构方程模型分析

基于对以往文献的回顾以及本研究的目的，本研究将建立以下三类模型：1）单一能力模型；2）双能力模型；3）三能力模型。在单一能力模型中，只包含一个 “一般理解能力”因子。在双能力模型和三能力模型中，均包含了 “概括总结能力”、 “细节捕捉能力”和 “推理判断能力”三个因子。但是，在双能力模型中，将 “概括总结能力”和 “细节捕捉能力”合并为 “理解显性信息的能力”，而将“推理判断能力”称为 “理解隐性信息的能力”。

因此，本研究将分为两步：

首先，在听力理解能力和阅读理解能力分别是不同的能力特质这一理论假设下，分别对听力变量和阅读变量进行三个模型的检验；第二，在听力理解能力和阅读理解能力都是语言理解能力，只是呈现模式不同（声音和文本）这一理论假设下，把听力变量和阅读变量整合在一起进行三个模型的检验。

3.4.3 模型评价的标准

拟合指数是模型拟合数据程度的评价标准，一个理想的拟合指数，应当具有下面三个特征（温忠麟、侯杰泰、马什赫伯特，2004）：1）不受样本容量的影响；2）惩罚复杂模型；3）对误设模型敏感。

参考已有研究中常用且普遍认为较稳定的拟合指数（Boomsma，2000；Hoyle＆Panter，1995； Raykov， Tomer ＆ Nesselroade， 1991），本研究拟选择以下几个拟合指数作为模型拟合的检验标准：GFI、CFI、RMSEA、ECVI、AIC。需要特别说明的是，由于本研究采用大样本，且 χ2和 χ2／df易受样本容量的影响（侯杰泰、温忠麟、成子娟，2004），因此本研究不选择χ2和χ2／df作为模型评价的标准。各拟合指数特性和判断标准如下：

GFI（goodness of fit index，拟合优度指数）：早期使用较多，一般认为大于或等于0.90则模型拟合较好。

CFI（comparative fit index，比较拟合指数）：不受样本容量的影响，从而避免对模型与小样本拟合优度的低估。缺点是没有惩罚复杂模型。大于0.90表示较好的拟合。

RMSEA（root mean square error of approximation，近似误差均方根）：评价模型时，会考虑模型的复杂性，受样本量影响较小。小于0.05表示非常好的拟合，0.05和0.08之间表示较好的拟合，大于0.10说明拟合很差（Browne＆Cudeck，1993）。

ECVI （expected cross－validation index，交互效度指数）：反映了模型拟合结果对同一总体的另一样本的可重复性，其值越小，在另一样本拟合的结果越好。

AIC （akaike information criterion，赤池信息量准则）：是用于比较不同模型拟合数据效果的一种信息指数，可以权衡所估计模型的复杂度和此模型拟合数据的优良性。其数值越小，表明模型拟合越好。

3.5 研究结果

3.5.1 对听力变量和阅读变量的分别检验

我们分别对听力变量和阅读变量进行了三个模型的检验（单一能力模型、双能力模型和三能力模型）。单一能力模型假设第二语言听力理解能力和阅读理解能力都是单一的、整体的能力。而双能力模型和三能力模型则假设在第二语言理解能力中内部存在可分性的子能力，同时，作为高阶因子的 “听力理解能力”或者 “阅读理解能力”影响着作为一阶因子的子能力，并通过被试在听力试题或者阅读试题上的作答反应表现出来。三个模型检验后的拟合指数总结于表4：

如表4所示，无论是听力变量还是阅读变量，双能力模型和三能力模型的拟合度均优于单一能力模型。单一能力模型的GFI和CFI均低于 0.90 （未达到 0.09以上）， RMSEA 也均介于0.05和0.08之间（虽然表明模型拟合较好，但是仍高于双能力模型和三能力模型的RMSEA指数），ECVI和AIC也都是三个模型当中最高的。参考所有的拟合指数，对于听力变量，三能力模型的GFI和CFI分别为0.994和 0.995，均达到 0.90 以上， RMSEA 为 0.015，远远小于 0.05， ECVI和 AIC 分别为 0.058 和158.386，均是三个模型中最小的，故三能力模型优于单一能力模型和双能力模型；对于阅读变量，双能力模型的GFI和CFI分别为0.977和 0.958，均达到 0.90 以上， RMSEA 为 0.054，介于 0.05和 0.08之间， ECVI和 AIC 分别为0.123和 335.009，也均是三个模型中最小的，故双能力模型优于单一能力模型和三能力模型。听力理解能力三能力模型图和阅读理解能力双能力模型图见图1和图2。

表4 ：对听力变量和阅读变量进行三个模型检验后的拟合指数

图1 ：听力理解能力的三能力模型图

因此，在听力理解能力和阅读理解能力分别是不同的能力特质这一理论假设下，分别对听力变量和阅读变量进行三个模型的检验结果显示：1）第二语言听力理解能力和阅读理解能力并不是一个单一的、整体的能力，其内部包括不同的可分性子能力；2）对于听力理解能力而言，三能力模型为最优模型，而对于阅读理解能力而言，双能力模型为最优模型。

3.5.2 对语言理解能力的检验

在听力理解能力和阅读理解能力都是语言理解能力，只是呈现模式不同（声音和文本）这一理论假设下，我们将听力变量和阅读变量整合在一起进行了三个模型的检验。三个模型的拟合指数总结于表5：

图2 ：阅读理解能力的双能力模型图

表5 ：对语言理解能力进行三个模型检验后的拟合指数

如表5所示，三个模型的GFI和CFI均处于 0.60 和 0.70 之间，远远低于 0.90。单一能力模型的RMSEA虽然小于0.50，但也处于接近0.50的位置，而双能力模型和三能力模型的RMSEA均处于0.50和0.80之间，只表明模型拟合较好。因此，三个模型的拟合度都不太好。回顾之前分别对听力变量和阅读变量的检验，双能力模型和三能力模型在听力变量和阅读变量中都拟合较好，而将听力变量和阅读变量整合在一起检验后则拟合不太好。

因此，我们对三个模型进行了一些调整，在原有模型的基础之上，我们加入了两个 “渠道”因子，即 “听觉渠道”和 “视觉渠道”。这一做法的理论假设为，在第二语言听力理解能力和阅读理解能力中，不仅仅只包含了一个共有的理解过程，同时也包含着一个不同的解码过程。在听力理解能力中，存在着对听觉渠道信息的解码，而在阅读理解能力中，存在着对视觉渠道信息的解码。三个新模型的拟合指数总结于表6：

表6 ：对语言理解能力进行三个新模型检验后的拟合指数

如表6所示，在对原模型调整后，三个新模型的拟合度都比较好。但是，是否语言理解能力只包含两个 “渠道”因子，而不包括三个“子能力”因子呢？于是，我们将新模型中的“子能力”因子剔除，得到一个只包含两个“渠道”因子的模型（简称 “渠道”模型），并对所有变量进行了检验。 “渠道”模型的GFI和 CFI 分别为 0.827 和 0.849， RMSEA 为0.065，这就表明 “渠道”模型不能较好拟合。同时，这也就说明了在原有模型的基础上加上“渠道”因子是必要的。

根据表6的各项拟合指数，三个新模型的拟合度都很好。因此，仅仅依据拟合指数，我们很难选出语言理解能力的最优模型。单纯就统计的角度来看，新单一能力模型是最优模型，原因如下：1）在三个新模型中，单一能力模型的拟合指数是最好的；2）单一能力模型和三能力模型的各项拟合指数十分接近，单一能力模型的GFI、CFI和RMSEA分别为0.962、 0.946 和 0.031，三能力模型的 GFI、CFI 和 RMSEA 分别为 0.950、 0.939 和 0.038，两个模型的ECVI和AIC也都十分接近。同时在三能力模型中，三个一阶因子在高阶因子上的因子负荷都接近1，这就似乎表明三个 “子能力”因子实际上可能就是一个单一因子。

但是，在结构方程模型中，选择最优模型不能仅仅依靠统计信息（侯杰泰、温忠麟、成子娟，2004）。由于在对听力变量和阅读变量的分别检验中，单一能力模型的拟合度均不好。因此，对所有变量而言，似乎选择双能力模型或者三能力模型为最优模型比较合适。而根据表6，新三能力模型的各项拟合指数均优于新双能力模型。因此，我们选择新三能力模型为语言理解能力的最优模型。语言理解能力的最优模型图见图3。

图3 ：语言理解能力的最优模型图

4.讨论

4.1 听力理解能力结构和阅读理解能力结构

本研究的研究问题一是：汉语作为第二语言的高级水平学习者的听力理解能力和阅读理解能力这两种语言理解能力是否可分？如果可分，其结构分别是什么？其内部所包括的子能力的数量和类型分别是什么？

关于这一研究问题，我们分别对听力变量和阅读变量进行了三个模型的检验。如表4所示，在听力理解能力中，三能力模型优于单一能力模型和双能力模型；在阅读理解能力中，双能力模型优于单一能力模型和三能力模型。如图1所示，三能力模型在听力变量中拟合较好，包含三个子能力因子，即 “概括总结能力”、 “细节捕捉能力”和 “推理判断能力”。如图2所示，双能力模型在阅读变量中拟合较好，包含两个子能力因子，即 “理解显性信息的能力”和 “理解隐性信息的能力”。

就双能力模型而言，它在阅读变量中的拟合度优于在听力变量中的拟合度。这就说明“概括总结能力”和 “细节捕捉能力”并不能够很好地在阅读变量中区分开来，但却能够很好地在听力变量中区分开来。我们认为原因如下：

第一，参加HSK［高等］考试的汉语学习者对汉语阅读文本比较熟悉，因此，他们既能掌握和理解阅读文本的主要内容，也能较好地理解阅读文本的具体细节。因此，这就使得“概括总结能力”和 “细节捕捉能力”在阅读变量中很难被区分开来。然而，正如许多听力研究者所言，即使学习者理解了口头演讲中的每一个词的意义，他们也很难理解其主要观点（Olsen＆Huckin，1990）。因此，这就使得“概括总结能力”和 “细节捕捉能力”能够在听力变量中得以区分。同时，这也就说明了对于高级水平汉语学习者而言，理解长对话或者口头演讲比理解阅读文本难度更大和更具挑战性。

第二，HSK［高等］的听力理解分测验和阅读理解分测验的任务特征不同，也是导致听力理解能力和阅读理解能力具有不同的能力结构的一个重要原因。HSK［高等］的阅读理解分测验的阅读文本相对较短，每篇文章750字左右。同时，考生在进行阅读理解测试的过程中可以随时反复多次阅读文本。这些都有利于考生理解文章的主要内容和具体细节。而听力理解分测验中有的听力材料比阅读文本要长。更为重要的是，考生在听力理解测试的过程中只能听一遍，没有机会回过头去重新检查和思考。这就使得考生的 “概括总结能力”和 “细节捕捉能力”得以有效区分。

正如Alderson（2000）所言，子能力对于初级阅读者来说能够更为有效地进行区分，技能成分的研究方法对于低水平的第二语言阅读者来说可能较为有效，而对于高级阅读者来说则不亦然。也就是说，在考生表现较差的测验中，子能力能够更好地区分开来。因此，在本研究中，较之阅读变量而言，子能力能够更好地在听力变量中区分开来。

4.2 语言理解能力结构

本研究的研究问题二是：汉语作为第二语言的高级水平学习者的语言理解能力是否可分？如果可分，语言理解能力的结构是什么？其内部所包括的子能力的数量和类型分别是什么？

有关这一研究问题，我们将听力变量和阅读变量整合在一起进行了三个模型的检验。研究结果从实证的角度支持了听力理解能力和阅读理解能力都是语言理解能力，只是呈现模式不同（声音和文本）这一理论假设。但就本研究而言，听力理解能力和阅读理解能力两者的关系是异大于同的，因为单纯包含 “子能力”因子的三个模型的拟合度都不好，在加入 “渠道”因子之后，三个新模型的拟合度有了显著提高。基于目前的分析，我们很难断定语言理解能力是整体的、单一的能力还是其内部包含若干不同的子能力。虽然我们综合考虑把新三能力模型作为最优模型，但是新单一能力模型和新双能力模型的拟合度同样也是好的，这种不确定性有可能源于本研究的数据特征。正如之前所讨论的，HSK［高等］的听力理解分测验和阅读理解分测验上的任务特征不同，这就使得当我们把听力变量和阅读变量整合在一起检验时， “渠道”因子就解释了总体变异中的大部分，而 “子能力”因子的影响就小得多。

因此，就目前的研究结果而言，虽然单一能力模型优于双能力模型和三能力模型，但是我们就此断言第二语言理解能力是一个单一的、整体的能力是值得商榷的。正如前面的讨论，实验数据受到被试语言能力和测验任务特征的影响，因此第二语言理解能力的可分性也可能受到被试语言能力和测验任务特征的影响。

5.结论

本研究的结论如下：

第一，听力理解能力和阅读理解能力的结构是相似的，它们都包含两个或者三个子能力。听力理解能力包含三个子能力，即 “概括总结能力”、 “细节捕捉能力”和 “推理判断能力”；阅读理解能力包含两个子能力，即“理解显性信息的能力”和 “理解隐性信息的能力”。

第二，听力理解能力和阅读理解能力在理解过程方面是相似的，但在解码过程中却是不同的，具体表现在呈现模式上，即听觉渠道和视觉渠道。

第三，第二语言理解能力的可分性会受到被试语言能力和测验任务特征的影响。因此，在解决有关语言理解能力的可分性及其内部子能力的种类和数量的问题时，需要考虑具体测验情境下的被试语言能力因素和测验任务特征因素。

杜建 1992 听音理解过程和听力评估方法［J］.外语教学与研究（4）：47－51.

谷陵 2003 论汉语听力测试中应考查的六种听力技能［J］.云南师范大学学报（对外汉语教学与研究版）（6）：23－25.

侯杰泰，温忠麟，成子娟 2004 结构方程模型及其应用［M］.北京：教育科学出版社：14－16.

金天相，李泉 1994 广播新闻听力课教学论略［J］.汉语学习（3）：60－63.

金琰如，王佶旻 2012 初级阶段留学生汉语听力能力结构探究［J］.语言教学与研究（3）：35－41.

李清华 1987 谈科技汉语的听力理解［J］.语言教学与研究（2）：103－110.

李小兰 2008 知识空间理论与规则空间模型在汉语听力理解技能测验编制中的应用［D］.北京语言大学硕士学位论文.

刘秀明，王苹 2008 预科汉语听力成绩测试中的微技能与信息转换［J］.喀什师范学院学报（1）：95－97.

王静 2008 C.TEST阅读理解测验的诊断性评价研究［D］.北京语言大学硕士学位论文.

温忠麟，侯杰泰，马什赫伯特 2004 结构方程模型检验：拟合指数与卡方准则［J］.心理学报（2）：186－194.

徐式婧 2007 C.TEST听力理解测验的诊断性评价研究［D］.北京语言大学硕士学位论文.

杨惠元 1989 谈谈听力教学的四种能力训练［J］.世界汉语教学（1）：58－63.

———1991论听和说［J］.语言教学研究（1）：88－110.

杨旭 2010 融合模型在C.TEST听力理解试题中的认知诊断研究［D］.北京语言大学硕士学位论文.

朱正才，范开泰 2001 语言听力理解的认知结构与测试［J］.语言教学与研究（3）：41－46.

Alderson， J. 2000 Assessing Reading［M］.Cambridge，UK： Cambridge University Press.

Alderson， J.＆ Y.Lukmani 1989 Cognition and reading： Cognitive levels as embodied in test questions［J］.Reading in a Foreign Language 5（2）： 253－270.

Bachman， L.＆ A.Palmer 1981 The construct validation of the FSI oral interview ［J］.Language Learning 31： 67－86.

———1982The construct validation of some components of communicative proficiency［J］.TESOL Quarterly 16： 449－465.

Bae， J.＆ L.Bachman 1998 A latent variable approach to listening and reading： Testing factorial invariance across two groups of children in the Korean／English Two－Way immersion Program［J］.Language Testing 15（3）： 380－414.

Bandalos，D.＆ S.Finney 2001 Item parceling issues in structural equation modeling［A］.In G.Marcoulides et al. （eds.）， New Developments and Techniques in Structural Equation Modeling ［C］. Mahwah， NJ：Lawrence Erlbaum Associates： 269－295.

Boomsma， A. 2000 Reporting analyses of covariance structure［J］.Structural Equation Modeling 7： 461－483.

Brown， J. 1996 Testing in Language Programs ［M］.Upper Saddle River， NJ： Prentice Hall Regents.

Browne，M.＆ R.Cudeck 1993 Alternative ways of assessing model fit［A］.In K.Bollen et al.（eds.）， Testing Structural Equation Models ［C］.Newbury Park，CA： Sage Publications： 136－162.

Buck， G. 1991 The testing of listening comprehension：An introspective study［J］.Language Testing 8 （1）：67－91.

———1992Listening comprehension：Construct validity and trait characteristics［J］.Language Learning 42（3）： 313－357.

———2001Assessing Listening［M］.Cambridge，UK：Cambridge University Press.

Buck， G.＆ K.Tatsuoka 1998 Application of the rulespace procedure to language testing： Examining attributes of a free response listening test［J］.Language Testing 15（2）： 119－157.

Carroll， J.1972 Defining language comprehension［A］.In R.Freedle et al.（eds.）， Language Comprehension and the Acquisition of Knowledge ［C］. New York：John Wiley.

———1993Human Cognitive Abilities［M］.Cambridge， UK： Cambridge University Press.

Carver， R. 1982 Optimal rate of reading prose ［J］.Reading Research QuarterlyXVIII（1）： 56－88.

———1983Is reading rate constant or flexible？［J］.Reading Research QuarterlyXVIII（2）： 190－215.

———1984Rauding theory predictions of amount comprehended under different purposes and speed reading conditions［J］.Reading Research QuarterlyXIX（2）： 205－218.

———1990Reading Rate：A Review of Research and Theory［M］.New York： Academic Press.

———1992What do standardized tests of reading comprehension measure in terms of efficiency，accuracy， and rate？［J］. Reading Research Quarterly 27（4）： 347－359.

Clark， H.＆ E.Clark 1977 Psychology and Language：An Introduction to Psycholinguistics［M］.New York：Harcourt Brace Jovanovich.

Davey， B. 1988 Factors affecting the difficulty of reading comprehension items for successful and unsuccessful readers［J］.Experimental Education （56）： 67－76.Davis， F. 1944 Fundamental factors of comprehension in reading［J］.Psychometrika 9： 185－197.

———1968Research in comprehension in reading［J］.Reading Research Quarterly 3： 499－545.

Drum，P.，R.Calfee＆ L.Cook 1981 The effects of surface structure variables on performance in reading comprehension tests［J］.Reading Research Quarterly 16：486－514.

Enders， K.＆ L.Bandalos 1999 The effects of heterogeneous item distribution on reliability［J］.Applied Measurement in Education 12： 133－150.

Freedle， R.＆ I.Kostin 1994 Can multiple－choice reading tests be construct valid？［J］.Psychological Science 5： 107－110.

———1996The Prediction of TOEFL Listening Comprehension Item Difficulty for Mini－talk Passages： Implications for Construct Validity （TOEFL Research Report No.RR－56）［M］.Princeton， NJ： Educational Testing Service.

———1999Does text matter in a multiple－choice test of comprehension？ The case for the construct validity of TOEFL’s minitalks［J］.Language Testing 16（1）：2－32.

Gough， P.， L.Ehri＆ R.Treiman 1992 Reading Acquisition［M］.Hillsdale， NJ： L Erlbaum.

Grabe， W. 1991 Current development in second language reading research ［J］. TESOL Quarterly 25：375－397.

Gray W. 1960 The major aspects of reading［A］.In H.Robinson （ed.）， Sequential Development of Reading Abilities［C］.Chicago： University of Chicago Press，8－24.

Harmer， J. 1983 The Practice of English Language Teaching［M］.New York： Longman Group Limited，144－145.

Hattie，A. 1986 Methodology review：Assessing unidimensionality of tests and items ［J］.Applied Psychological Measurement 9： 139－164.

Hayduk，L. 1996 LISREL Issues，Debates， and Strategies［M］.Baltimore， MD： Johns Hopkins University Press.

Hoyle，R.＆ A.Panter 1995 Writing about structural equation models［A］.In H.Hoyle （ed.）， Structural E-quation Modeling： Concepts， Issues， and Applications［C］.Thousand Oaks， CA： Sage Publications.

Hughes， A. 1989 Testing for Language Teachers［M］.Cambridge， UK： Cambridge University Press.

Jang， E. 2009 Cognitive diagnostic assessment of L2 reading comprehension ability： Validity arguments for Fusion Model application to language assessment ［J］.Language Testing 26（1）： 31－73.

Kenneth， C. 1976 Developing Second Language Skills：Theory to Practice［M］.Boston： Houghton Mifflin Company.

Kintsch，W.＆ T.van Dijk 1978 Toward a model of text comprehension and production［J］.Psychological Review 85： 363－394.

Kintsch， W.＆J.Yarbrough 1982 Role of rhetorical structure in text comprehension［J］.Educational Psychological 74（6）： 828－834.

Kishton，J.＆ K.Widaman 1994 Unidimensional versus domain representative parceling of questionnaire items：An empirical example［J］.Educational and Psychological Measurement 54： 757－765.

Lennon， R. 1962 What can be measured？［J］.Reading Teacher 15： 326－337.

Lunzer， E.＆ K.Gardner 1979 The Effective Use of Reading［M］.London： Heinemann Educational Books.Munby， J. 1978 Communicative Syllabus Design［M］.Cambridge： Cambridge University Press.

Nasser， F.， T.Takahashi＆ J.Benson 1997 The structure of test anxiety in Israeli－Arab high school students： An application of confirmatory analysis with miniscales［J］.Anxiety， Stress， and Coping 10： 129－151.

Nissan， S.， F.DeVincenzi＆ L.Tang 1996 An Analysis of Factors Affecting the Difficulty of Dialogue Items in TOEFL Listening Comprehension（TOEFL Research Report No.RR－51）［M］.Princeton， NJ： Educational Testing Service.

Oakeshott－Taylor， J. 1977 Information redundancy，and listening comprehension［A］.In R.Dirven （ed.），Horverstandnis im Fremdsprachenunterricht（Listening Comprehension in Foreign Language Teaching）［C］.Kronberg ／Ts： Scriptor.

Olsen， L.＆ T.Huchin 1990 Point－driven understanding in engineering lecture comprehension［J］.English for Special Purposes 9： 33－47.

Park，G. 2004 Comparison of L2 listening and reading comprehension by university students learning English in Korea［J］.Foreign Language Annals 37： 448－458.

Pollitt， A.， C.Hutchinson， N.Entwistle ＆ C.DeLuca 1985 What Makes Exam Questions Difficult？ An Analysis of‘O’ Grade Questions and Answers［M］.Edinburgh： Scottish Academic Press.

Raykov， T.， A.Tome ＆ J.Nesselroade 1991 Reporting structural equation modeling results in Psychology and Aging： Some proposed guidelines［J］.Psychology and Aging 6： 499－503.

Reves， T.＆ A.Levine 1988 The FL receptive skills：Same or different？［J］.System 16： 327－336.

Richards，J. 1983 Listening comprehension： Approach，design， procedure［J］.TESOL Quarterly 17（2）： 219－240.

Rivers， W. 1966 Listening comprehension［J］.Modern Language Journal 50（4）： 196－202.

Rost， D. 1993 Assessing the difference components of reading comprehension： fact or fiction？［J］.Language Testing 10（1）： 79－92.

Sang， F.， B.Schmitz， H.Vollmer， J.Baumert＆ P.Roeder 1986 Models of second language competence：Structural equation approach［J］.Language Testing 3：54－79.

Sasaki，M. 1996 Second Language Proficiency，Foreign Language Aptitude，and Intelligence：Quantitative and Qualitative Analyses［M］.New York： Peter Lang.

Shin， S. 2005 Did they take the same test？ Examinee language proficiency and the structure of language tests［J］.Language Testing 22（1）： 31－57.

Spearitt， D. 1972 Identification of subskills of reading comprehension by maximum likelihood factor analysis［J］.Reading Research Quarterly 8： 92－111.

Valette， R. 1977 Modern Language Testing［M］.New York： Harcourt Brace Jovanovich.

Weir， C. 1993 Understanding and Developing Language Tests［M］.New York： Prentice Hall.