张敏
(淮北师范大学 教育学院,安徽 淮北 235000)
心理学实证研究中的变量关系与研究设计
张敏
(淮北师范大学 教育学院,安徽 淮北 235000)
变量是心理学实证研究中的核心概念,是研究所要探讨的因素,分为存在变量和引发变量两种类型。心理学实证研究的逻辑起点是变量,本质是研究变量之间的相互关系;根据变量间的关系,把心理学实证研究分为相关研究和因果研究两种类型,探讨存在变量与存在变量之间的关系,主要是相关研究,探讨引发变量与引发变量之间的关系,主要是因果研究。不同类型的心理学实证研究,需要采用不同的研究设计和统计方法。
心理学实证研究;存在变量;引发变量;相关关系;因果关系
心理学研究大体有两种取向,一种是理论研究,主要通过归纳、演绎、分析、综合等方法对现有文本资料进行研究,像西方心理学史、中国心理学史这些具有“史学”性质的研究主要归为理论研究;另外一种是实证研究,主要通过观察、测量、实验等方法获得有关心理现象与心理规律的看法,虽然不免有“分析主义”或“还原主义”的嫌疑[1],却代表了当今国际心理学界的主流取向。就心理学的实证研究而言,无论是发展心理学、教育心理学还是其他心理学分支的研究,都遵循着“一点、两面”这一基本的逻辑思路。所谓“一点”指的是所有的心理学实证研究都有着共同的逻辑起点,即变量;“两面”指的是所有的心理学实证研究本质上都是为了考察变量间两个方面的关系,即相关关系或因果关系。弄清楚变量及变量之间的关系,是展开心理学实证研究的基本前提。
心理学实证研究中,变量(或称研究变量)是一个核心概念,指的是研究所要探讨的因素。一般而言,所有变量都可以从稳定性的角度划分为存在变量和引发变量两种类型,前者指预先已经存在的、相对稳定的、并非研究过程中引起的变量,性别、智力、学业成绩、人格特征等都属于存在变量;后者指在研究过程中由研究者施加或引起的、可以发生变动的变量,物理刺激、教学方法以及由此而导致的心理或行为等都属于引发变量。
除此以外,在心理学实证研究中,为了研究的方便,常常从可操纵性的角度把变量分为自变量和因变量两种类型,前者指研究者主动操纵或掌握的变量,后者指被测定或被记录的变量。如研究文本中的汉字颜色对阅读效率的影响,汉字颜色是自变量,各种颜色(白、蓝、红、黄等)可以由研究者主动操纵或改变,阅读效率是因变量,可以通过单位时间内的阅读成绩加以考量;再如研究情绪弹性对注意偏向(attentional bias)的影响,情绪弹性是自变量,被试不同的情绪弹性(高、中、低)可以由研究者主动选择和分组;注意偏向程度是因变量,可以通过被试加工情绪信息时的反应时间或错误率加以考量。但这种划分方法容易造成理解上的歧义,因为从语义上看,自变量与因变量的划分,似乎已经规定了二者之间的关系就是因果关系,前者是因,后者是果,但事实并不这样简单。这就涉及到变量之间的关系问题。
事物之间的关系本质上只有两种,一种是相关关系,另一种是因果关系,心理学实证研究中变量之间的关系也是如此。相关关系是指客观现象之间确实存在的、但数量上不是严格对应的依存关系。比如,种族与身高存在着相关关系,西方人普遍高于东方人,但并非所有的西方人都比东方人高,即种族与身高之间并不存在严格对应的依存关系。而在因果关系中,原因和结果是相互制约、同时又具有必然联系的一对范畴,若两个变量x和y之间为因果关系,也即是说若x引起了y,必须满足四个条件:(1)在时间上x先于y;(2)x引起了y的变化,即二者是原因和效果的关系; (3)x和y的变化不是由第三种因素共同引起的; (4)如果x引起了y的变化,意味着这种变化应该是一个动态的过程[2]。Bullock等学者在此基础上又增加了一条标准,即原因变量与结果变量之间的因果假设必须具备相当的理论基础[3]。
就心理学实证研究而言,无论是通过实验还是测量的方法研究心理现象,都可以从稳定性的角度把研究变量划分为存在变量和引发变量两种类型,但二者之间存在着比较复杂的关系。第一,从存在变量与存在变量的关系看,二者之间一般是相关关系。例如,研究性别对推理能力的影响,性别与推理能力都是不可变动的存在变量,二者的关系只能说是性别差异与推理能力之间可能存在着某种关系,男性或女性的推理能力更强,却不能由此推论出性别是因,推理能力是果,推理能力的强弱一定是由性别差异引起的。第二,从引发变量与引发变量的关系看,二者之间一般是因果关系。例如,研究阅读时间对记忆效果的影响,阅读时间和记忆效果都是可以发生变动的引发变量,二者的关系从表面上看似乎是相关关系,即阅读时间与记忆效果之间可能存在着某种关系,阅读时间越长记忆效果越好,但进一步分析发现,阅读时间可以由研究者主动操纵、随意改变,而记忆效果则随着阅读时间的长短发生变化,存在着时间上的先后顺序,由此可以推论出阅读时间是因,记忆效果是果,记忆效率的差异一定是由阅读时间的长短引起的,因而二者之间实质上是因果关系。第三,从存在变量与引发变量的关系看,二者之间一般也是相关关系。例如,研究认知风格对学习效率的影响,认知风格是存在变量,大体上可以分为场独立型和场依存型两种类型,且相对稳定,学习效率是引发变量,可以用单位时间内的作业量或单位作业量的用时加以考量,是可以变动的,二者的关系只能说是认知风格与学习效率可能存在较为密切的关系,场独立型或场依存型的人学习效率更高,却不能由此推论出认知风格是因,学习效率是果,学习效率的高低一定是由不同的认知风格引起的。
除了以上变量间的种种关系,在心理学实证研究尤其是实验研究中,习惯上把变量划分为自变量和因变量。自变量和因变量的关系如同数学中的y= f(x)函数方程,自变量是x,因变量是y,无论从逻辑上还是语言习惯(语义)上看,自变量与因变量之间的关系似乎就是因果关系,但事实并非如此。自变量与因变量之间是何种关系,取决于自变量是存在变量还是引发变量。若自变量是存在变量,自变量与因变量之间一般是相关关系。例如,研究性别对信息加工速度的影响,从表面上看,是因为性别的差异而导致了加工速度的不同,二者应属于因果关系,进一步分析却发现,性别是研究中已经存在的、不可改变的变量,作为存在变量,研究者不可能对性别加以操纵、随意改变,因此性别与信息加工速度的关系实质上是相关关系,即信息加工速度与性别之间可能存在着密切的关系,男性或女性的加工速度更快。若自变量是引发变量,自变量与因变量之间一般是因果关系。例如,研究光照强度与工作效率的关系,从语义上看,光照强度与工作效率之间是相关关系,但进一步分析却发现,光照强度是研究中可以变化的变量,作为引发变量,研究者可以对光照强度加以操纵、随意改变,而工作效率会随着光照强度的变化而变化,因此二者之间实质上是因果关系,即光照强度可能是造成工作效率差异的重要原因。因此,从可操作性的角度划分变量,自变量与因变量之间的关系既可以是相关关系,也可以是因果关系。
在心理学实证研究中,所有的研究设计都有着共同的逻辑起点——变量,本质上都是为了考察变量之间的关系。在进行研究设计前,研究者的首要任务就是要弄清楚研究中的变量及变量类型,即有多少个变量,哪些是存在变量,哪些又是引发变量;在此基础上,才能明确研究的目的是考察变量间的相关关系还是因果关系。而变量间不同的关系类型又决定了研究设计的类型与相应的统计方法。
(一)相关研究
心理学实证研究中若只有存在变量,则一般属于相关研究,研究的主要目的是为了探讨存在变量之间的相关关系。以“智力对不同性别儿童学习成绩的影响”研究为例,其中有智力、性别与学习成绩三个存在变量。为了探讨三个变量之间的相关关系,研究者在研究设计时首先要明确变量的变动类型,即是类型变量还是连续变量,因为不同变量的变动方式不同,不同的变动方式又会导致不同的数据模式,进而需要采用不同的统计方法确定三者之间是否存在关联。
本例中,性别属于类型变量,可以采用自然确定的方法分为男、女两个水平;智力和学习成绩既可以是类型变量又可以是连续变量,作为类型变量,智力可以按照一般标准区分出低常、中常、超常三个水平,学习成绩也可以按照一般标准区分出好、中、差三个水平,而作为连续变量则可以把所有被试的智力测验得分和学习成绩看作是一个呈正态分布的数据连续体而不需要进行水平划分。由此而造成的统计方法也有所差异。若三个存在变量都是类型变量,需要采用χ2检验的统计方法进行列联相关分析;若性别与智力是类型变量,学习成绩是连续变量,或性别与学习成绩是类型变量,智力是连续变量,则需要采用F检验的统计方法加以考察。假设只探讨智力与学习成绩之间的关系,若二者都是类型变量,需要采用χ2检验进行二列或点二列相关分析;若其中一个是类型变量,另一个是连续变量,需要采用t检验;当二者都是连续变量时,则可以采用皮尔逊积差相关(r)或一元回归(连续变量在三个及以上时用多元回归)的统计方法。
(二)因果研究
心理学实证研究中若只存在引发变量,则一般属于因果研究,研究的主要目的是为了探讨引发变量之间的因果关系。以“汉字颜色和字体对阅读效率的影响”研究为例,颜色、字体和阅读效率(以单位时间内的阅读成绩为考量指标)都是在研究过程中由研究者施加的、可以发生变动的变量,因而都是引发变量,其中颜色和字体由研究者主动操纵,是自变量,阅读效率因颜色、字体的改变而可能发生变化,是因变量。与相关研究一样,为了考察自变量与因变量之间的因果关系,研究者在研究设计时首先也要明确变量的变动类型以满足不同统计方法的需要。但与相关研究不同的是,研究者在研究设计时还要明确设计的类型,因为在相关研究中只有被试间设计,而在因果研究中既有被试间设计又有被试内设计,还有混合设计,被试间设计又可分为完全随机设计和随机区组设计,不同的设计类型也需要采用不同的统计方法。
在因果关系研究中,都需要对自变量进行水平划分,因而无论自变量原本是类型变量还是连续变量,最终都需要划分为不同水平而成为类型变量。本例中,颜色和字体属于类型变量,可以根据需要分成若干水平,例如把颜色划分为红、黄、蓝、白、黑五个水平,把字体划分为宋体、楷体、隶体三个水平;阅读效率既可以是类型变量也可以是连续变量,作为类型变量,阅读效率可以按照一定的标准划分为高、中、低三个水平,作为连续变量则可以把所有被试的阅读成绩看作是一个呈正态分布的数据连续体而不需要进行水平划分。由此而造成的统计方法也各不相同。若三个都是类型变量,无论采用何种类型的研究设计,都需要采用χ2检验的统计方法进行分析。当颜色和字体是类型变量,阅读效率是连续变量时,若采用被试间设计(完全随机设计和随机区组设计),需要采用F检验的统计方法进行非重复测量多元方差分析;若采用被试内设计,需要采用F检验的统计方法进行重复测量多元方差分析;若采用混合设计,组间变量需要采用非重复测量多元方差分析,组内变量则需要采用重复测量多元方差分析。假设只探讨汉字颜色对阅读效率的影响,若二者都是类型变量,各种研究设计都需要用χ2检验进行分析。若颜色是类型变量而阅读效率是连续变量,当采用完全随机设计时需要用独立样本t检验;采用区组设计时需要用配对样本t检验;采用被试内设计时需要用F检验进行重复测量方差分析;采用混合设计时则是组间变量用非重复测量方差分析,组内变量用重复测量方差分析。
在心理学实证研究中,明确研究中涉及到的变量及变量类型是一个核心问题,是能否顺利进行各种实证研究的前提条件。本文从稳定性的角度把变量划分为存在变量和引发变量两种类型,既克服了以往有关自变量、因变量划分上存在的理解歧义,又能很好地分析出不同变量之间的关系类型,从而为根据变量间的不同关系类型进行研究设计和数据统计奠定了基础。需要指出的是,虽然心理学实证研究的本质是考察变量间的相关关系或因果关系,并根据变量间的关系类型划分为相关研究和因果研究两种类型,但在实际的研究中,变量是多种多样的,如何确定变量间的关系以及选择相应的研究类型,除了依据现有的判断标准外,还要根据实际需要,对研究结果作出合乎逻辑或习惯的解释。以文中“智力对学习成绩的影响”研究为例,虽然两个变量之间并不符合因果关系的判断标准,本质上是相关研究,但习惯上还是倾向于对研究结果作出因果关系而不是相关关系的解释,即由于智力差异的原因而导致了不同的学习成绩这一结果。因此,诸如此类的问题需要在实际研究中谨慎对待。
[1]莫雷,王瑞明,陈彩琦,等.心理学研究方法的系统分析与体系重构[J].心理科学,2006,29(5):1026-1030.
[2]解学慧.心理测量本身及其在应用中的问题[J].心理科学,2007,30(2):422-424.
[3]Bullock,H.E.,Harlow,L.L.,& Mulaik,S.A..Causation issues in structural equation modeling[J].Structural Equation Modeling,1994,1(3):253-267.
B841
A
2095-0683(2011)02-0160-03
2011-01-01
安徽省教学研究项目“新课改背景下高师心理学教学改革研究”(2007jyxm303);教育部人文社科研究青年基金项目“青少年情绪弹性的理论与实证研究”(09YJCXLX010)
张 敏(1975-),男,安徽寿县人,淮北师范大学教育学院副教授,博士。
责任编校 刘正花