语块对英语写作影响的效应量研究

2016-07-27 08:42华北理工大学外国语学院秦学锋
当代教育实践与教学研究 2016年1期
关键词:实际意义语块英语写作

华北理工大学外国语学院 秦学锋 吴 艳 吕 黛



语块对英语写作影响的效应量研究

华北理工大学外国语学院 秦学锋 吴 艳 吕 黛

摘 要:基于假设检验的统计分析只能回答研究效应是否存在。效应量是评价研究效果真实大小和意义的统计指标。本文在8个语块对英语写作影响的研究结果基础上,通过计算效应量,分析、解释每个研究的效应量大小和实际意义。效应量在外语研究中的使用有利于科学评价研究的真实效果。

关键词:效应量 实际意义 语块 英语写作

一、引言

近年来,语块在提高英语学习者写作中的作用引起了国内外语教师和研究者的重视。一些学者围绕语块对英语写作的影响开展了实证研究,结果显示使用语块能够促进语言表达的流利性、准确性和得体性,从而有效提高学习者的外语写作水平。然而,这些研究结果主要依据了假设检验的统计学显著性结果。由于假设检验的显著性结果受样本大小的影响较大,其结果达到统计学意义上的显著性(statistical significance),并不能代表实际效果的显著性(practical significance)。对此,国内外学者提出,在运用假设检验的基础上,单个实证研究必须计算、报道研究结果的效应量(effect sizes,es),为评估研究效果的真实效应大小提供科学依据。

通过分析国内语块对英语写作影响的实证研究文献发现,国内学者的研究结果中尚没有对效应量的计算和报道。因此,本文将以国内语块对英语写作影响的实证研究为例,在所报道的数据基础上进一步计算,呈现研究结果的效应量,以期引起国内外语教学研究领域对效应量的重视,从而为运用元分析方法综合评价语块对英语写作影响的实际效果提供数据支持。

二、统计学意义、实际意义和效应量

假设检验只能帮助回答“研究效果是否存在”这一问题,并不能回答“研究效果有多大”。研究者认为,当统计结果的概率小于设定的显著性水平(如α=.05),即达到统计学意义上的显著性时,得出拒绝原假设而接受被择假设的结论,从而认为研究效果具有显著性。然而,这一结论仅表示研究效果存在,并不能回答研究效果有多大,是否在教育学、心理学或特定研究领域中具有实际意义不得而知。换句话说,假设检验结果达到统计学意义并不代表研究结果具有实际意义。相反,假设检验结果没有统计学意义,也并不代表不具有实际意义。两者的真实含义通常容易被混淆。

受样本大小的影响较大,假设检验结果中存在两种现象:一是在研究样本较大的情况下,即使微小的差别或关系也能呈现出统计学上的显著性,但其实际意义可能并不大;二是如果研究样本太小,即使存在较大的差别或关系也无法呈现出统计学上的显著性,而现实中研究结果的实际意义却不容忽视。

为给客观评估研究效果的真实大小和意义提供依据,克服样本大小对研究效果的影响,统计学家提出了效应量(effect sizes,es)这一概念,用来估计研究效果的真实大小或强度。效应量最大特点是不受样本大小影响,是以标准差为单位的统计指数(即标准分Z-score),可用来比较不同测量单位结果间的大小。社会学、教育学和心理学等领域,根据研究设计的不同,常用的效应量有两类:一类是评价差异大小的簇效应量,主要指标准化均值差;另一类是评价相关强度大小的簇效应量,主要为相关系数。

针对效应量大小的评判标准,研究者以行为科学研究为基础,提出衡量效应量的参考标准:对于d簇效应量,0.2为小效应、0.5为中效应、0.8为大效应;对于r簇效应量,0.10小效应、0.30为中效应、0.50为大效应。还有学者提出评价二语研究领域中效应量大小的参考标准,对于组间设计中的d簇效应量,0.40为小效应量、0.70为中效应量、1.00为大效应量;对于组内设计中的d簇效应量,0.60为小效应量、1.00为中效应量、1.40为大效应量;对于r簇效应量,0.25为小效应量、0.40为中效应量、0.60为大效应量。可以看出,前者的标准低于后者提出的标准。

尽管上述两个参考标准因为研究领域的不同在大小等级划分上存在差异,但d簇效应量是以标准差为单位的标准分,不同研究中的效应量都可参照正态分布表对研究结果进行解释。对照正态分布表可以确定正态曲线下低于某一标准分的面积或累积百分比。

例如,一次组间实验的效应量为0.2,即实验组均值高于对照组均值0.2个标准差,差正态分布表可知对照组中58%的样本低于实验组的平均分。而两个变量的相关系数r本身就可以作为效应量,r的平方值(表示为R2,称为决定系数)可以解释为两个变量间的共同变异量。又如,一项研究中两个变量间的相关系数r,即效应量,为0.3,其平方值R2=0.09,表示两个变量间的共同变异量为9%,或者说一个变量解释了另一个变量9%的变异。需要指出的是,研究者不要把参考标准作为教条,应该根据具体研究领域和研究问题对效应量的大小做出解释,否则会得出错误结论。

三、研究设计

1. 研究问题。本次研究仅在已有文献的基础上计算单个研究的效应量(es),旨在计算和呈现现有文献中单个研究的效应量的大小。

2. 研究数据。本次研究从外语类中文核心期刊中选取已公开发表的8篇研究语块对英语写作影响的实证研究论文。研究均采用组间实验设计,统计方法为独立样本T检验。为计算每个研究的效应量,从每篇论文中提取的数据包括实验组和对照组的样本量ne、nc,平均分me、mc,标准差se、sc和显著性值p(见下表)。

语块对英语写作影响研究的统计数据汇总表

注:1. 陈东岚(2015);2. 伍萍(2014);3. 郭月琴、吴秀娟(2013); 4. 楼捷(2011);5. 徐军、黄永华(2011); 6.肖武云(2011);7. 盖淑华(2010);8. 邓鹂鸣、王香云(2007)。为便于计算,作者将部分数据四舍五入后保留小数点后两位数。

3. 研究工具。本次研究使用了由Wilson设计的在线效应量计算工具(Standardized Mean Difference),用于计算每个研究的效应量d,即标准化均值差方(standardized-mean-difference)。使用者只需在线输入实验组和对照组的样本量、平均值和标准差即可计算出效应量。

四、结果和讨论

本次研究的目的仅在以现有文献为例,在所提供数据的基础上计算每个研究的效应量。上表呈现了本次选取的8个语块对英语写作影响的实证研究的数据。所有研究的假设检验均达到了统计学意义上的显著性水平,由此证明了语块使用在提高英语写作水平上有效性。但研究结果仅回答了研究效果的存在,并没有回答研究效果的大小。从表中呈现的效应量可知,语块使用对英语写作均产生了积极作用,但每个研究的实际意义并不相同,存在很大差别。根据Cohen(1988)的参考标准,郭月琴、吴秀娟(2013)的研究效应量(d=0.44)和徐军、黄永华(2011)的研究效应量(d=0.54),接近中等效应量;其他6个研究的效应量均为大效应量。根据Plonsky和Oswald(2014)的评价二语研究领域中组间设计效应量大小的参考标准,郭月琴、吴秀娟(2013)的研究效应量(d=0.44)和徐军、黄永华(2011)的研究效应量(d=0.54)则趋向于小效应量,陈东岚(2015)的效应量介于中效应量和大效应量之间,其他5个研究的效应量为大效应量。尽管两个参考标准有所不同,但都反映了语块使用对提高学生英语写作水平除具有统计学显著意义外,还具有不同程度的实际意义。

为更直观解释和理解效应量在实际教学中的作用和意义,通过对照正态分布表,每个研究的效应量可以从两方面解释:一是对照组学生低于实验组均值的百分比,二是实验组均值在对照组中的排名(见上表)。

例如,陈东岚(2015)研究中语块使用对提高英语写作水平的效应量为0.81,表示在对照组中79%的学生(39人)的成绩低于实验组均值(10.78),这一均值在对照组50名学生的成绩中排在第11位。邓鹂鸣、王香云(2007)研究中语块使用对提高英语写作水平的效应量为2.97,表示对照组100%的学生(34人)的成绩低于实验组均值(6.86),这一均值高于对照组中所有34名学生的成绩,排在第1位。通过这两种解释,普通读者可以更直观地看出语块使用对提高英语写作水平的实际意义和作用。

导致各个研究效应量不同的原因与研究设计中的多个因素有关系:

一是研究样本特征不同,如有的研究样本来自重点大学,有的来自非重点大学;有的研究样本为一年级学生,有的为二年级学生;有的为英语专业学生,有的为非英语专业学生等。二是研究时长不同。如有的研究持续一个学期,而有的研究持续两个学期。三是研究工具不同。实验后期进行测试时,各个研究在写作的内容和难易度等方面的要求不一致,写作时间可能也不同。四是语块教学内容不同。主要表现为实验中学生所学语块的来源不同,如教材不同等。五是语块教学方式不同,如有的研究中实验班和对照班为同一教师,有的为不同教师;有的采用讨论式教学,有的采用自主学习方法。这些因素对研究效果产生的影响,可以在元分方法中作为调节变量,探索导致研究间系统变异的来源和大小,从而更全面、科学地认识和评价语块对英语写作影响的真实效应和实际意义。

五、结论

基于概率的统计假设检验只能回答研究效应是否存在,效应量的使用可以克服样本大小对假设检验结果的影响,是评价研究效果真实大小的统计指标。由于效应量是以标准差为单位的标准分,可以用来比较针对同一研究问题不同研究设计研究间的真实效应。本文以8个研究为例,介绍并呈现语块对英语写作影响的效应量大小和实际意义,以期引起国内外语研究者对效应量的重视,从而提高研究水平和研究质量,为以后运用元分析方法整合同一研究问题的所有单个研究综合评价研究效应、探讨研究设计中的调节变量对研究效应的影响等提供科学依据。

注释:

[1]Wilson的在线效应量网址为:http://cebcp.org/practicalmeta-analysis-effect-size-calculator/.

参考文献:

[1]Borenstein, M., Hedges, L. V., Higgins, J. P. T., & Rothstein, H. R.Introduction to Meta-Analysis [M]. Hoboken, NJ: Wiley,2009

[2]Coe.R.It’s the effect size.stupid: What effect size is and why it is important,2002.accessed from www.leeds.ac.uk/educol/ documents/00002182.htm

[3]Cohen. J.Statistical power analysis for the behavioral sciences (2nd ed).Hillsdale. NJ: Erlbaum,1988

[4]Cumming.G.The new statistics: Why and how.Psychological Science, 2014

Cumming.G.Understanding the New Statistics: Effect Sizes. Confidence Intervals. and Meta-Analysis[J].New York: Routledge,2012

[5]Ellis.P.D.The Essential Guide to Effect Sizes: Statistical Power. Meta-analysis. and the Interpretation of Research Results[M]. Cambridge: Cambridge University Press,2010

[6]Kirk.R.E.Practical significance: a concept whose time has come[J]. Educational and Psychological Measurement,1996

[7]Lipsey, M.W&Wilson.D.B.Practical meta—analysis[M]. Thousand Oaks: SAGE,2001

Plonsky, L., & Oswald, F. L. How big is “Big”? Interpreting effect sizes in L2 research[J]. Language Learning, 2012

[8]鲍 贵,席 雁.统计显著性检验:问题与思考[J].南京工程学院学报(社会科学版),2010

[9]陈东岚.语言意识驱动下的语块教学法在大学英语写作教学中的运用[J].外语学刊,2015

[10]邓鹂鸣,王香云.背诵式语言输入对中国学生二语写作能力发展的有效性研究[J].外语教学,2007

[11]盖淑华.最近发展区域中的词块习得实证研究— 基于支架式教学的实证研究[J].外语与外语教学,2010

[12]郭晓英, 毛红梅.语块教学对英语写作能力影响的实验研究[J].山东外语教学, 2010

[13]郭月琴, 吴秀娟.CLIL 模式在大学英语写作中的应用探究[J].外国语文, 2013

[14]楼 捷.论网络语料库辅助对英语写作语块运用能力的影响[J].外语与外语教学,2011

[15]权朝鲁.效果量的意义及测定方法[J].心理学探新,2003

[16]肖武云.基于语块的以写促说的教学模式实证研究[J].外语界,2011

[17]徐 军,黄永华.词块在师范学生英语作文中的应用[J].山东外语教学,2011

[18]郑昊敏,温忠麟,吴 艳.心理学常用效应量的选用与分析[J].心理科学进展,2011

文章编号:ISSN2095-6711/Z01-2016-01-0193

猜你喜欢
实际意义语块英语写作
让思维导图在物理教学中插上翅膀
母语负迁移对初中英语写作的影响
从高考英语作文评阅看英语写作中存在的问题及启示
语境与英语写作研究
词块策略在高中英语写作教学中的运用
英语语块在汉英翻译中的积极作用
从语块类型看英语专业大学生语块获取能力与听力理解能力的相关性研究
诠释学视域中的语块研究
语域语块与外贸英语教学