多元回归分析中的交互作用问题——以语言阈限假设检验为例

2012-09-18 00:35
外国语文 2012年4期
关键词:阈限二语英语水平

鲍 贵

(南京工业大学 英语系,江苏 南京 211816)

1.引言

在因素方差分析(factorial ANOVA)中,我们对交互作用(interaction)的概念并不陌生。在双因素方差分析中,当一个因素(即类别型自变量)对因变量的作用独立于另一个因素时,两个因素之间就没有发生交互作用,自变量的总体效应等于各个自变量的效应之和。但是,当一个因素对因变量的作用依赖于另一个因素时,即一个因素的作用(包括作用的大小和方向)在另一个因素的不同水平上不一致时,两个因素之间便有了一阶(first order)交互作用,自变量的总体效应不再等于各个自变量的效应之和。在更为复杂的因素方差分析中,如果出现交互作用,则要探究该作用存在于一阶还是更高阶上。

不管自变量是类别型变量还是连续型变量,交互作用普遍存在于含有多个自变量的模型中。各类统计学教材和实证研究进行因素方差分析时一般都会提及交互作用问题,但是在讨论回归分析时很少会涉及连续型变量之间的交互作用问题。忽视连续型变量之间的交互作用会模糊变量之间错综复杂的关系,不利于理论模型的构建与验证。在回归分析中,社会科学的诸多理论都假设两个或更多个连续型变量发生交互作用,可以说交互作用的检验是社会科学理论检验的核心所在(Cohen et al.,2003:255)。这一观点同样适合于外语教学研究。

在外语教学研究中,只有个别研究(彭鹏、陶沙,2009)在回归分析时考虑到了连续型变量之间的交互作用问题,且对交互作用缺乏必要的深入分析。鲍贵(2012)提到,语言阈限假设的检验应该包含交互作用检验。本文拟结合该假设的检验探讨多元回归分析中的交互作用分析问题。

2.语言阈限假设前期研究在统计分析方法上的缺陷

语言阈限假设(Bernhardt&Kamil,1995)又称短路假设(the short-circuit hypothesis)(Clarke,1980),指学习者只有在二语水平达到一定的水平(即语言阈限)之后才能熟练地进行二语阅读,母语阅读能力才有可能向二语阅读大量地迁移;在未达到一定的语言水平之前,母语阅读能力对二语阅读可能起反作用、没有作用或作用不大,迁移出现“短路”现象。前期的实证研究采用的统计分析方法为皮尔逊相关分析、不含交互作用项的多元回归分析和方差分析,研究发现不完全一致。

相关分析的目的是为了检验母语阅读能力和二语阅读能力之间的关系随学习者二语水平(有序的类别变量)的提高而增强这一假设。Perkins et al.(1989)、Lee&Schallert(1997)和Yang(2007)验证了该假设,但是Walter(2004)却拒绝了该假设。

按学习者二语水平分组进行多元回归分析的目的是为了比较在学习者二语水平的不同阶段母语阅读能力对二语阅读能力贡献力的大小(R2)。需要验证的假设是相对于二语低水平阶段,在二语高水平阶段母语阅读能力对二语阅读能力的预测力更强。在对学习者样本按二语水平进行分组比较的研究中,有些研究(Bossers,1991;Lee&Schallert,1997;Yang,2007;吴诗玉、王同顺,2006;鲍贵、林铃,2008;王宗迎、蔡任栋,2011)支持了该假设。采用不同的阅读能力测试方法,Brisbois(1995)和Taillefer(1996)却得到矛盾的结果。Pichette et al.(2003)对同一批学习者两个学习阶段的回归分析也得到矛盾的结论。

Yamashita(2002)和吴诗玉、王同顺(2005)采用方差分析的目的是检验母语阅读能力和二语水平在二语阅读理解中的相互补偿作用,为语言阈限假设提供佐证。这两项研究将母语阅读能力和二语水平两个连续型变量转化成有序的类别变量,双因素方差分析后发现两个自变量均有显著的主效应,没有交互效应,事后组间比较发现母语阅读能力和二语水平在二语阅读理解中存在补偿作用,二语水平少量的增加能够弥补母语阅读能力大幅度的减少以达到同等程度的二语阅读能力。但是与Yamashita(2002)等学者的观点不同的是,本文认为,补偿作用的存在并不能直接说明随着二语水平的提高,母语阅读能力对二语阅读能力的预测力随之增强,因而该结论并不能作为支持语言阈限假设的有力证据。Walter(2004)采用方差分析的目的是比较在二语不同水平中母语和二语阅读能力差异的变化,借以检验语言阈限假设。该研究以二语水平和语言类别(母语和二语)为二分自变量,二语阅读能力为因变量,混合设计方差分析后发现,二语水平和语言类别存在显著的交互作用。在二语低水平组中,母语阅读能力明显高于二语阅读能力,但是在二语高水平组中,母语和二语阅读能力接近,似乎支持了语言阈限假设。

以上研究产生不同结果的原因有很多,包括受试水平的操作定义和各个变量的测量方法等。最为重要的原因之一是统计分析方法选择存在的缺陷。统计分析方法本身没有优劣之分,但是方法的选择却有好坏之分,这取决于研究问题。语言阈限假设检验的核心问题是母语阅读能力(连续型变量)对二语阅读能力(连续型变量)的作用是否受学习者二语水平(连续型变量)的制约。如果母语阅读能力的作用受到学习者二语水平的制约,说明母语阅读能力和二语水平存在交互作用。如果没有交互作用,语言阈限假设便不能成立。因此,在采用多元回归分析时需要增加母语阅读能力和二语水平的交互作用项,恰当的回归预测模型应为交互作用模型(交互作用项为二语水平×母语阅读能力),而不应是前期回归分析所采用的叠加模型(不含交互作用项)。或许由于不了解如何检验包含交互作用项的回归模型,前期研究或采用分组回归分析的做法,或分组使用相关分析和方差分析。采用相关系数组间差异比较方法的缺陷在于,相关系数组间差异的大小比较与有无交互作用没有必然的联系。在无交互作用时,方差不齐可能使相关系数组间差异呈显著性;在有交互作用时,方差不齐也可能使相关系数组间差异不显著(Whisman&McClelland,2005:112)。分组分析方法还存在两个问题。其一,语言阈限水平不是固定的值,将二语水平按照具有武断性的组别划分来检验语言阈限假设隐含着这样一种观点:语言阈限是一个确定值,因而组别划分法不恰当。其二,将作为连续型变量的二语水平(和母语阅读能力)转化成有序的类别变量,使原数据的大量信息丢失,可能导致虚假的统计分析结果。鉴于此,本研究拟采用回归模型对比分析的方法检验语言阈限假设,为后期研究提供方法论上的借鉴。

3.研究设计

3.1 研究问题

本研究回答以下三个问题:

(1)英语水平和汉语阅读能力预测英语阅读能力时是否存在交互作用?

(2)如果有交互作用,含交互作用项的模型是否比不含交互作用项的模型更好?

(3)如果有交互作用,交互作用的本质是什么?

对以上问题的回答有助于验证语言阈限假设的真伪。对应于三个问题,语言阈限假设的检验分三个部分。第一部分检验英语(二语)水平和汉语(母语)阅读能力在预测英语阅读能力时是否存在交互作用。第二部分检验含交互作用项的模型是否比不含交互作用项的模型更好。第三部分检验在英语低水平阶段,汉语阅读能力是否对英语阅读能力没有预测力或预测力很小,在英语中、高水平阶段,汉语阅读能力是否对英语阅读能力有更大的预测力。本研究的假设是:英语水平和汉语阅读能力存在交互作用,含交互作用项的模型比不含交互作用项的模型更好,汉语阅读能力的预测力随英语水平的提高而增强,因而语言阈限假设成立。

3.2 研究数据

本研究采用的数据同鲍贵、林铃(2008)。受试来自国内某大学两个年级的80名英语专业的学生,其中一年级学生为48名,三年级学生为32名。他们均在统一的时间内完成英语阅读能力、英语水平和汉语阅读能力三类测试。英语阅读能力测试由4篇阅读理解短文构成,选自历届CET-6试题库,题型为20道多项选择题,每题分值为2分,总分值是40分。英语水平测试由听力理解(20道多项选择题,每题1分)、词汇语法(词汇部分共13道题,语法部分为7道题,题型为多项选择题,每题1分)和写作(命题议论文,分值为20分)三个部分组成,总分为60分,也选自历届CET-6试题库。汉语阅读能力测试由4篇现代汉语阅读短文构成,选自历届全国成人高考试题库,题型为多项选择题和填空题,3篇短文每篇后均附有4道选择题,每题分值为2.5分,最后1篇短文后附有5道填空表述题,每题分值2分,累计分值为40分。

3.3 统计分析方法

本研究对比的预测模型分别为不含交互作用项的模型(预测的英语阅读能力=常数+英语水平+汉语阅读能力)和含交互作用项的模型(预测的英语阅读能力=常数+英语水平+汉语阅读能力+英语水平×汉语阅读能力)。两个模型用符号表示依次为:和(是常数,是回归系数)。回归分析方法采用普通最小二乘法(ordinary least squares,OLS)。与鲍贵、林铃(2008)不同的是,本研究采用的统计分析软件是R①R 是功能强大的统计、制图和编程软件,网址:http://cran.at.r- project.org/.而不是常用的SPSS,因为R更有利于交互作用诊断和回归模型优劣比较。为了便于回归系数的解释,避免交互作用项与两个自变量之间的共线性问题,本研究对各个自变量先进行中心化处理②中心化是数据的线性转化。自变量中心化值为各个变量观测值与对应变量平均数的差异值。,再计算交互作用项。

4.结果与讨论

4.1 英语水平和汉语阅读能力交互作用的初步诊断

表1报告各个中心化自变量和因变量之间的皮尔逊相关系数、平均数和标准差。文中报告的所有统计量均保留两位小数,第二位小数是0时则略去该位小数。

表1 模型变量的概要性统计

**p< .01。

表1显示,英语水平、汉语阅读能力与英语阅读能力分别呈中等和低度显著正相关。英语水平×汉语阅读能力与英语阅读能力没有显著的相关关系,似乎表明英语水平和汉语阅读能力对英语阅读能力的作用不存在交互作用。表1还显示,英语水平和汉语阅读能力存在显著低度正相关关系,英语水平×汉语阅读能力与英语水平没有显著的相关关系,与汉语阅读能力却存在显著的低度负相关关系。由于各个变量之间的复杂关系,回归预测中交互作用是否真正存在尚需进一步验证。

在汉、英阅读能力的关系中,如果英语水平是调节变量(moderator),那么它们之间的关系就会随英语水平而改变,在以中心化英语水平平均数为切割点绘制出的反映汉、英阅读能力关系的两条平滑线(smooth)就会不平行。图1显示英语水平对汉、英阅读能力之间关系的调节作用。

图1 英语水平对汉、英阅读能力之间关系的调节作用

左图的平滑线呈明显的上升趋势,说明汉、英阅读能力之间的正相关程度随英语水平的提高而增强。右图中的实线基于中心化英语水平观测值小于或等于0(代表英语低水平),数据点以空心圆表示;虚线基于中心化英语水平观测值大于0(代表英语高水平),数据点以“+”号表示。右图中的两条线不平行,其中实线呈水平状,说明在英语低水平阶段,汉语阅读能力的增强并没有促进英语阅读能力的提高;就数据点的主体部分而言,虚线则呈上升之势,说明汉语阅读能力的增强对英语阅读能力的提高有促进作用。由此初步判断,英语水平和汉语阅读能力预测英语阅读能力时存在交互作用。

4.2 回归模型比较

本节从模型的拟合优度(goodness of fit)和简约性(parsimony)两个方面评价不含交互作用项的模型(模型1)与含交互作用项的模型(模型2)的优劣。对不含交互作用项回归模型两个预测变量的多元共线性诊断发现,方差膨胀因子VIF(variance inflation factor)均为1.2,说明它们之间没有多元共线性存在,与表1相关系数反映的情况一致。最大学生化残差绝对值2.98没有显著意义(p>.05),说明因变量数据中没有异常值(outlier)。强影响点检验发现,所有观测点的Cook距离(Cook’s distance)均小于1,说明模型1中没有强影响点。方差齐性检验发现,该模型满足方差齐性假设(χ2=1.63,df=1,p > .05)。对含交互作用项回归模型三个预测变量的多元共线性诊断发现,方差膨胀因子VIF分别为 1.2(英语水平)、1.39(汉语阅读能力)和 1.17(英语水平×汉语阅读能力),说明这三个预测变量之间没有多元共线性存在,与表1相关系数反映的情况一致。最大学生化残差绝对值2.98(与前一个模型是同一个数据点)没有显著意义(p>.05),说明因变量数据中没有异常值。强影响点检验发现,所有观测点的Cook距离均小于1,说明模型2中没有强影响点。方差齐性检验发现,该模型满足方差齐性假设(χ2=1.72,df=1,p > .05)。以上结果表明,本例适合使用普通最小二乘法,两个模型参数估计结果可信。多元回归分析结果详见表2。

表2 回归模型比较

* p < .05,**p < .01,*** p < .001。

模型2表明,交互作用呈显著性(t=2.65,p < .01),英语水平和汉语阅读能力预测英语阅读能力时存在交互作用。由于交互作用的存在,在不同的英语水平上,汉语阅读能力的斜率(或回归系数)是不同的,4.3节将对此作进一步的论证。

表2显示,两个模型自变量的回归系数有所不同。这是因为英语水平和汉语阅读能力与它们的交互作用项存在不同程度的相关关系(见表1)。在不含交互作用项的模型(模型1)中,汉语阅读能力对英语阅读能力没有独特的预测力(t=1.05,p > .05),但是在加入交互作用项的模型(模型2)中,汉语阅读能力的独特贡献便体现出来(t=2.0,p<.05),因此汉语阅读能力对英语阅读能力的作用取决于英语水平的大小。

从修正R2值来看,模型2对英语阅读的解释力(.44)比模型1的预测力(.39)多5%,可见模型2的解释力更强,预测效果更好。而且,模型2的残差标准误差(3.56)小于模型1的残差标准误差(3.7)。因此,从解释力和残差标准误差来看,含交互作用项的模型的拟合优度好于不含交互作用项的模型。

判断模型优劣的标准除了考虑模型拟合优度外,还要考虑模型的简约性。本研究中,模型1嵌套(nested)在模型2中。两个模型方差分析的结果见表3。

表3 回归模型比较的方差分析

**p<.01

虽然模型1比模型2少使用一个自变量,但是由于两个 模型有显著差异(F=7.04;p<.01),因而不能接受模型1,而应接受模型2,说明在模型2中加入交互作用项是合理的。当我们用Akaike信息准则(Akaike information criterion,AIC)①AIC指数在模型拟合优度和模型复杂性惩罚之间寻求平衡,值越小,模型越好。和贝叶斯信息准则(Bayesian information criterion,BIC)②BIC指数类似于AIC,但是对复杂模型的惩罚更严厉,值越小,模型越好。比较这两个模型时也发现,模型2的AIC值(436.27)和BIC值(448.18)均分别小于模型1的AIC值(441.36)和BIC值(450.89),因而模型2好于模型1。

4.3 回归交互作用的本质

由以上结果可知,英语水平和汉语阅读能力预测英语阅读能力时存在交互作用。英语水平和汉语阅读能力的主效应和交互效应的方向一致,说明交互作用的本质是协同(synergistic)效应,即两个自变量和交互作用项对因变量的作用方向一致,且总效应(预测力)大于各自主效应(预测力)之和。为了便于进一步探索这一本质,下面进行简单斜率(simple slope)分析。

含交互作用项的回归预测方程为:=22.93+0.4+0.22+0.04。由于该方程的调节变量是英语水平,因此简单回归方程是在不同英语水平值上汉语阅读能力对英语阅读能力的预测模型。本例的简单预测回归方程表示为:=(22.93+0.4)+(0.04+0.22),其中(22.93+0.4)是简单常数,(0.04+0.22)是简单斜率。简单常数和简单斜率均为复合系数(compound coefficient),随英语水平的变化而变化。按照通行的做法(Whisman&McClelland,2005;Preacher et al,2006),英语水平变量取 3 个值,即-6.88(=-6.88,表示低于标准化平均数一个标准差)、0(=0,表示标准化平均数)和+6.88(= +6.88,表示高于标准化平均数一个标准差),它们分别代表英语低、中、高水平。在英语低、中、高水平中,简单预测回归方程依次为:=20.18﹣0.06、=22.93+0.22 和 =25.68 ﹢0.5。图2 比较不同英语水平中英语阅读能力在汉语阅读能力上的简单回归线。

图2 英语阅读能力在汉语阅读能力上的简单回归

图中三条回归线大约在= -10(对应的汉语阅读能力原始分为21分)处交叉,交互作用表现为无序状(disordinal)。英语低水平中,简单回归线略呈下降趋势,说明汉语阅读能力对英语阅读能力的预测力微乎其微。英语中、高水平中,简单回归线呈扇形(fanning)上扬,且伸展幅度较大,说明汉语阅读能力对英语阅读能力的预测力依次增强。本研究样本中汉语阅读能力中心化值低于-10的数值很少(仅3例),所以图中的交叉点邻近回归线的左端。就观测数据主体而言,三条回归线显示出有序的(ordinal)交互作用。虽然汉语阅读能力和英语水平的交互作用不强(只能解释英语阅读能力变异的5%),但是简单回归线图却明显地显示出协同交互效应。

简单斜率的显著性检验发现,在英语低水平中的斜率(-0.06)没有统计显著意义(t1= -0.58,p > .05),但是在英语中、高水平中的斜率(0.22和0.5)均为正值,且有统计显著意义(t2=2.01,p < .05;t3=2.59,p < .05)。由此可以认为,在英语低水平中,汉语阅读能力对英语阅读能力不起作用,但是在英语中、高水平中,汉语阅读能力对英语阅读能力有显著的预测力,且依次增强。至此,本研究问题中的假设得到了验证,语言阈限假设成立。

5.结语

本研究以语言阈限假设检验为例,指出前期研究在统计分析方法的选择上存在的不足之处,通过交互作用诊断、回归预测模型比较和简单斜率分析验证了母语阅读能力和二语水平在预测二语阅读能力时存在交互作用,支持了语言阈限假设。

多元回归分析是外语教学研究中常用的统计分析方法。由于变量之间关系的复杂性,我们在理论模型构建和模型验证时需要考虑交互作用问题以及如何选择恰当的统计分析方法。本研究为回归分析中交互作用的检验提供了典型的案例,以期引起外语教学研究者对这一问题的重视,提升未来研究统计分析的质量。

[1]Bernhardt,E.& M.Kamil.Interpreting Relationships Between L1 and L2 Reading:Consolidating the Linguistic Threshold and the Linguistic Interdependence Hypotheses[J].Applied Linguistics,1995,(16)1:15-34.

[2]Bossers,B.On Thresholds,Ceilings and Short-circuits:The Relation Between L1 Reading,L2 Reading and L2 Knowledge[C]//J.H.Hulstijn & J.F.Matter.AILA Review,8:Reading in Two Languages.Alblasserdam,the Netherlands:Haveka B.V.,1991:45 –60.

[3]Brisbois,J.E.Connections Between First-and Second-Language Reading [J].Journal of Reading Behavior,1995,(27)4:565–584.

[4]Clarke,M.A.The Short-circuit Hypothesis of ESL Read-ing-or When Language Competence Interferes with Reading Performance[J].The Modern Language Journal,64,2:203-209.

[5]Cohen,J.,P.Cohen,S.G.West& L.S.Aiken.Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences[M].Mahwah,New Jersey:Lawrence Erlbaum Associates,Inc.,Publishers,2003.

[6]Lee,J.& D.L.Schallert.The Relative Contribution of L2 Language Proficiency and L1 Reading Ability to L2 Reading Performance:A test of the threshold hypothesis in an EFL context[J].TESOL Quarterly,1997,(31)4:713-739.

[7]Perkins,K.,S.R.Brutten & J.T.Pohlmann.First and Second Language Reading Comprehension.RELC Journal,1989,(20)2:1-9.

[8]Pichette,F.,N.Segalowitz & K.Connors.Impact of Maintaining L1 Reading Skills on L2 Reading Skill Development in Adults:Evidence from Speakers of Serbo-Croatian Learning French [J].The Modern Language Journal,2003,(87)3,391-403.

[9]Preacher,K.J.,P.J.Curran & D.J.Bauer.Computational Tools for Probing Interactions in Multiple Linear Regression,Multilevel Modeling,and Latent Curve Analysis[J].Journal of Educational and Behavioral Statistics,2006,(31)4,437-448.

[10]Taillefer,G.E.L2 Reading Ability:Further Insight into the Short-Circuit Hypothesis.The Modern Language Journal,1996,(80)4:461-477.

[11]Walter,C.Transfer of Reading Comprehension Skills to L2 Is Linked to Mental Representations of Text and to L2 Working Memory[J].Applied Linguistics,2004,(25)3:315-339.

[12]Whisman,M.A.& G.H.McClelland.Designing,Testing,and Interpreting Interactions and Moderator Effects in Family Research [J].Journal of Family Psychology,2005,(19)1,111-120.

[13]Yamashita,J.Mutual Compensation Between L1 Reading Ability and L2 Language Proficiency in L2 Reading Comprehension[J].Journal of Research in Reading,2002,(25)1:81-95.

[14]Yang,Lian Lian.The Relationship Between Chinese Reading Ability and English Reading Comprehension [J].English Teaching & Learning,2007,(31)2,127-158.

[15]鲍贵,林铃.母语阅读能力向外语阅读迁移问题研究[J].天津外国语学院学报,2008(3):30-35.

[16]鲍贵.我国外语教学研究中的统计分析方法使用调查[J].外语界,2012(1):44-51,60.

[17]彭鹏,陶沙.单词解码、英语语言理解和一般认知能力在汉语儿童英语阅读学习中的作用[J].外语教学与研究,2009(1):30-37.

[18]王宗迎,蔡任栋.母语阅读能力和外语水平对外语阅读的影响[J].基础英语教育,2011(5):7-15.

[19]吴诗玉,王同顺.汉语阅读能力和英语词汇与语法水平在英语阅读中的优劣补偿研究[J].国外外语教学,2005(4):7-13,21.

[20]吴诗玉,王同顺.结构建构框架下的外语阅读技能迁移研究[J].外语教学与研究,2006(2):122-128.

猜你喜欢
阈限二语英语水平
从中式英语探析我国大学生英语水平现状
通道形式与英语水平对大学生英语听力成绩的影响
“透视”第二语言习得心理过程*——关于二语加工的一次学术访谈
当代二语习得研究中介语对比分析方法理论与实践
过渡礼仪视阔下的少先队入队仪式分析
《教学二语习得简介》述评
仪式过程理论“阈限”范畴中的身体展演研究
二语习得中母语正迁移的作用分析
英语水平
国内外阈限研究综述及其对节事阈限研究的启示**