个人环境匹配创造力量表(PEFSC)的修订

2019-02-25 11:57吕三三洪
心理研究 2019年1期
关键词:效度信度测验

吕三三洪 明

(1湛江幼儿师范专科学校,湛江 524084;2岭南师范学院教育科学学院,湛江 524048)

1 问题提出

一直以来,世界各国都很重视创造性人才的培养和开发,我国也不例外。创造力研究的重要目标之一就是尽可能地培养和提升学生的创造力,而这在一定程度上依赖于创造力的测评。因此,如何测量和评价学生的创造力成为研究者和教育者关注的重要问题。20世纪50年代至今,欧美国家创造力评价和测量的研究取得重大突破,成果丰硕。评定创造力的方法有创造力测验、创造力实验、作品分析法以及主观评定法等,而创造力测验逐渐成为其中最重要的方法之一。

国内外开发的创造力测量工具主要从创造性思维能力、创造性人格和创造力成就三个方面测量创造力(贡喆,刘昌,沈汪兵,2016)。无疑,这些创造力测量工具在推动创造力研究方面曾发挥过巨大作用,但随着时间的推移和时代的发展,这些测量工具的弊端和局限性日益显露出来。一般学者都赞同,创造力绝非由人格特质、思维习惯或能力、个体所处环境单独决定,而是由各种因素交互作用决定的。Csikszentmihalyi(1999)认为,创造力来源于个体、场以及领域的交互作用。 Sternberg和 Lubart(1996)认为创造力包括智力、知识、思考方式、人格、动机以及环境6个要素。Runco(2007)强调人与环境的交互作用对创新绩效的重要影响。再加上到目前为止,学界对创造力的定义还存在较大分岐,没有形成一个统一的公认定义。因此,无论从创造力基本理论还是从创造力测量的角度,采取多种测验同时施测应该是较为稳妥的策略(Cropley,2000)。而目前国内外已有的创造力测量工具绝大部分只是测量创造力的某一方面,关键是,这些工具只是从个体自身角度测量创造力,没有从个体与环境及其交互作用角度来测量创造力。

选取几类有一定重合度并且确保能够分别测量创造力不同方面的测验也许能在一定程度上弥补以往创造力工具测量单一性的缺陷(Pinheiro &Cruz,2014),但如果能将反映创造力的几个必要因素整合在一个测验中显然要更好一些。 以个人环境交互作用为基础的创造力理论有两类:其一是个人环境匹配创造力理论;另一是个人环境失配创造力理论,也称作创造力差异性理论,意即个人与环境间的最佳差异水平能激发创造力。单调模型支持了个人环境匹配创造力理论。Sen,Acar和 Cetinkaya(2014)在整合性创造力测验编制方面作出了贡献,并在一定程度上代表了未来创造力测验的方向。他们认为,创造性活动中的个体和环境从来就不是孤立存在的,个体和环境的交互作用才是影响个体创造力的实质要素。他们以上述个人环境交互作用的第一类理论为基础,编制了个人环境匹配创造力量表 (Person-Environment Fit Scale for Creativity,PEFSC),试图从个人和环境两个方面同时测量创造力。该量表包括个人和环境两大因子,每个因子各7个项目,共14个项目。作者以土耳其学生为被试对该量表进行了检验,结果表明该量表具有较高的信效度,是测量创造力的有效工具。该量表具有以下优点:从个人与环境两个维度同时测量创造力比只从个人方面测量创造力更有效;该量表可帮助研究者检验个人-环境匹配理论是否优于差异性理论;该量表可提供个人与环境对学生创造力的相对影响力信息,从而为教育干预、课程设置和调整指引方向。但是,该量表的信效度还需要以不同文化背景下更多样的人群为对象进行验证和修订,以增加该量表的可靠性和价值。就笔者查阅到的文献看,到目前为止,国内还没有人对个人环境匹配创造力量表(PEFSC)进行引进和修订。一个测验应该对所有适用者公平,即属于不同组别中的个体在测验上的得分具有等同的可比性,但由于中西方社会及文化背景的差异,直接使用国外的量表可能导致测验或者项目出现偏差(韩丕国,武云鹏,高峰强,2014;肖影影,毕重增,狄轩康,2013;Rego et al.,2011)。 一般不宜将仅以国外被试为基础编制的量表直接拿到国内来使用,因此,笔者拟以中国大学生为被试对PEFSC进行修订和本土化,以便为国内创造力研究者提供适合中国国情的新颖有效的创造力测量工具。

2 研究方法

2.1 对象

样本1:在粤西某高校随机抽取大学生220人施测,回收有效问卷202份,有效回收率91.8%。男生93人,女生109人。大一43人,大二56人,大三62人,大四41人。专业涉及小学教育(38)、生物(31)、学前教育(41)、英语教育(22)、中文(20)、化学(35)、艺术(15)等,用于对量表进行初步修订。

样本2:在广东湛江、江苏南京、江西南昌分层随机抽取大学生被试800人施测,回收有效问卷732份,有效回收率91.5%。男生328人,女生404人。大一201人,大二192人,大三187,大四152人。 专业涉及学前教育(83)、英语教育(66)、小学教育(68)、汉语言文学(59)、历史(48)、社工(64)、康复治 疗(56)、生 物 (57)、 数 学 (73)、物 理(45)、化 学(71)、艺术(42)等,用于对量表进行正式修订。 一半样本用于探索性因素分析,另一半样本用于验证性因素分析,其它统计分析采用全部732份问卷。

2.2 工具

2.2.1 个人环境匹配创造力量表(PEFSC)

该量表英文版由Sen,Acar和Cetinkaya(2014)编制,包括个人和环境两因子,每个因子各7个项目,共14个项目。采用李克特5点评分,从“完全不符合”到 “完全符合”分别计1-5分。原量表具有很高的内部一致性信度和良好的结构效度。内部一致性信度:个人维度(0.88),环境维度(0.84),总分(0.92)。 结 构 效 度 :χ2=175.54,df=69,χ2/df=2.544,RMSEA=0.066,CFI=0.960,TLI=0.947,SRMR=0.038)。对英文版原量表(14项目)进行翻译和回译,对部分项目进行文字表达方面的修改,形成个人环境匹配创造力量表(PEFSC)中文版第一稿。同时对英文版初始量表(30项目,这些项目附在Sen等发表的文章后面)进行翻译,以备项目成对替换之用(简称备用项目库)。

2.2.2 威廉斯创造力倾向量表(效标)

该量表由林幸台、王木荣依据Williams编制的创造力组合测验修订而成,包括冒险性、好奇性、想象力和挑战性4个维度,共50个项目,是国内外公认的具有良好信效度的量表(舒曾等,2016)。采用李克特5点评分,从“完全不符合”到 “完全符合”分别计1-5分,得分越高,说明创造力倾向越明显。

2.3 统计方法

采用SPSS 22.0进行数据录入和统计,对数据做描述统计、相关分析和探索性因子分析。用AMOS 22.0对数据进行验证性因子分析。

3 结果

3.1 初步修订结果

3.1.1 项目-维度总分相关分析

项目总分相关分析计算的是各个项目与其对应的分维度总分的积差相关系数。根据Tuker的理论,项目和分量表的相关应在0.3-0.8之间,这样的项目才能保证量表具有令人满意的信度和效度。由于本次初测调查的样本相对较小,可能有所偏差,决定对相关值小于0.5的项目进行替换,以避免样本偏差造成误差,从而保证整个测验的信效度。替换项目来源于上述备用项目库,遵循意义接近,成对替换的原则。结果表明,所有14个项目与维度总分的相关都大于0.5且显著,都应予以保留,详见表1。

3.1.2 信度检验

信度分析考察的是项目删除后的分量表信度系数的变化情况。如果项目删除后分量表信度系数变小,则说明该项目所欲测量的行为或心理特质与其他项目是同质的,应予以保留;反之,应考虑删除相应项目。

经过计算,量表的内部一致性α总分0.867,个人 0.800,环境 0.789。 在个人维度 7个项目中,删除后量表信度系数提高的项目0个;在环境维度7个项目中,删除后量表信度系数提高的项目0个,说明所有项目都应予以保留。

表1 项目与维度的相关(n=202)

3.1.3 项目共同性、因素负荷及探索性因子分析

吴明隆(2010)认为,共同性若低于 0.20,因素负荷值低于0.45,则项目可考虑删除。中文版第一稿量表 14 个项目的共同性在 0.377-0.595 之间,因素一因子负荷值在0.576-0.767之间,因素二因子负荷值在 0.565-0.768 之间。

第一次因素分析:

巴特利特(Bartlett’s)球形检验χ2(91)=972.364,KMO=0.862,p<0.001,说明该样本适合进行因素分析。主成分法(PC)抽取固定2因子,共同解释48.873%的变异。14个项目的共同性均高于0.3。旋转结果表明,因素一因素负荷高于0.45的项目8个(12,1,3,7,9,13,6,11),因素二因素负荷高于0.45的项目6个(14,2,8,4,5,10)。 Q11(0.576,0.563)在两个因素上负荷都较高。

第二次因素分析:成对替换遵循与原项目对意义接近的标准进行。

首先,用Q25(即使我的想法受到挑战和质疑我也会坚持己见),Q26(人们欣赏我的观点,即使我的观点与他们的不同)成对替换Q11,Q12(原题号不变,以下同)后进行因子分析,结果如下。

巴特利特球形检验 χ2(91)=891.191,KMO=0.824,p<0.001。 所有 14 个项目的共同性均高于0.3。主成分法抽取固定2因子,共同解释46.483%的变异。旋转结果表明,因素一因素负荷高于0.45的项目 7 个(14,2,8,4,10,5,26),因素二因素负荷高 于 0.45 的 项 目 7 个(3,1,7,9,13,6,25)。 Q5(0.587,0.478)在两因素上负荷都较高且不能归入原量表的个人维度。

因此,用Q31(在做出重大决定时我敢于冒险),Q32(我所处的环境对不确定的事物比较包容)成对替换Q5,Q6进行第三次因素分析。巴特利特球形检验χ2(91)=926.635,KMO=0.823,p<0.001。主成分法抽取固定2因子,共同解释46.759%的变异。所有14个项目的共同性均高于0.3。旋转结果表明,因素一因素负荷高于 0.45 的项目 7 个(Q1,Q3,Q7,Q9,Q13,Q25,Q31),因素二因素负荷高于 0.45 的项目 7 个(Q2,Q4,Q8,Q10,Q14,Q26,Q32)。 最终保留的项目对为 7 对,其中5对是原英文正式量表中的项目,另外2对是补充替换的项目。将所有项目重新编号,详见表2。

初步修订后的个人环境匹配创造力量表中文版第二稿(包括个人、环境两个维度,7对14个项目)的内部一致性 α 总 分 0.858,个人 0.799,环境0.822。

3.2 最终修订结果

3.2.1 信度分析

信度是考察量表性能的重要指标,指的是测验结果的一致性或稳定性,量表的信度愈高表示其测量标准误愈小,即考察测量的可靠性。本研究采用α系数法探索问卷的内部一致性信度。信度分析结果表明,本量表的α系数为0.881,个人与环境维度的α 系数分别为 0.793,0.838。

重测信度又叫稳定性系数,能反映测验分数的稳定程度。选取本研究正式施测样本中某学院某专业一个班的67名学生,间隔一个月后进行重测,计算两次测量结果的相关性。总量表的重测信度为0.911,个人和环境维度的重测信度分别为0.840,0.831。

3.2.2 内容效度

内容效度指测验或量表内容或题目的适切性与代表性,即测验内容能否反映所要测量的心理特质,能否达到测量的目的或行为构念。最常用的评估方法是专家判断法。本量表经过3位英语教师进行共同翻译,并且经过多位心理学专家 (1位心理学教授,2位心理学博士)审定,认为该量表具有良好的内容效度。

3.2.3 结构效度

结构效度是指测量工具能够测得一个抽象概念或特质的程度,亦即实际的测验分数能在多大程度上解释某一心理特质(邱皓政,2009)。

3.2.3.1 探索性因素分析

本研究将正式测验中732份有效问卷随机对半分成两份数据,每份包含366份问卷,选取其中一份作探索性因素分析。结果表明,PEFSC中文量表第二稿 Bartlett’s 球形检验达到了显著水平(χ2(91)=1580.016,p<0.001),KMO值为 0.937,说明该样本适合进行因素分析。根据该量表的理论和结构设计,对该量表抽取2个因素,解释总变异的59.033%。所有14个项目的共同性均高于0.3。对各项目采用主成分分析(PC)和最大方差(Varimax)旋转求出最终的因素负荷矩阵(见表2)。

表2 旋转后因素负荷矩阵(n=366)

结果表明,14个项目的因素负荷均大于0.60且能很好的归入到中文量表的个人或环境维度。

3.2.3.2 验证性因素分析

根据探索性因素分析的结果,本研究采用AMOS 22.0软件对正式测验随机抽取的另一半样本,即366份问卷进行验证性因素分析,以极大似然法对模型的拟合指数进行检验。根据模型拟合良好的标准(温忠麟,侯杰泰,马什赫伯特,2004),即 χ2/df小于 5,GFI、AGFI、NFI、TLI、IFI、CFI都大于 0.90,RMSEA小于 0.08,模型拟合良好。 个人环境匹配创造力测量模型见图1,模型拟合结果见表3。由表3可知,数据和模型拟合很好,表明PEFSC中文量表具有良好的结构效度。

3.2.3.3 聚敛效度和区分效度

聚敛效度(CV)指测量相同潜在特质的项目或测验应属于同一维度,并且项目或测验间所测得的测量值之间具有高相关(Hair et al.,2014)。

在分析CV之前,须保证各维度的测量模型与数据拟合。表4结果显示,各维度模型与数据拟合良好,CV的第一个指标因素负荷量λ值,各项目在对应维度上的值均大于0.7(第7个项目除外),并且显著(p<0.001)。 根据某些学者的观点,AVE 大于 0.5,CR 大于 0.6,表明 CV 良好(Bacon,Sauer,& Young,1995;Fornell & Larcker,1981)。

区分效度(DV)指与测量不同特质的工具呈低相关,亦指测量同一潜在特质的各维度间应呈低相关或有显著的差异(吴明隆,2013)。

表3 大学生个人环境匹配创造力测量模型的拟合指数(n=366)

表4 聚敛效度及各维度模型的拟合指标(n=732)

就DV的第一个指标卡方差值来说,两维度间达到显著,即可认为两维度间有DV。就CI来说,无论百分位Bootstrap CI还是偏差校正Bootstrap CI均不包括1,即可认为两维度的关系具有DV(Bagozzi,Yi,& Phillips,1991; Torkzadeh,Koufteros,& Pflughoeft,2003);就 AVE 与r2的关系来说,AVE大于相应的r2,说明量表具有DV(见表 5)。

3.2.4 效标效度

效标效度是指测验分数与作为效标的另一独立测验结果之间的一致性程度(江怀,2011),一般用本测验与效标测验去测同一被试得到的两组分数的相关系数表示。若两者相关程度高,则说明本测验具有较高的效度。

本次研究选取正式施测样本中某师范学院某专业一个班的64名学生,同时施测威廉斯创造力倾向量表,计算两量表测量结果的相关性。结果表明,本量表总分及个人、环境两个维度与威廉斯创造力倾向量表总分的相关系数分别为 0.920、0.813、0.789,说明本量表具有良好的效标效度。

表5 卡方差异值及Bootstrap置信区间(n=732)

4 讨论

4.1 PEFSC英文版翻译和初测

两名大学英语教师与研究者本人将原英文版个人环境匹配创造力量表翻译成中文,要求尽量做到直译,以保证最大程度上遵循原意。另一名大学英语教师将中文量表再回译成英文。随后四人一起对照中英文条目反复讨论、推敲,最后确定了量表的中文条目,形成PEFSC中文版第一稿。

采用PEFSC中文版第一稿对粤西某高校大学生202人施测。项目-维度总分相关分析结果表明,所有14个项目与维度总分的相关都在0.5以上且达到显著水平,项目与构念间的关系符合经典测验理论(Classical Test Theory,CTT)的标准,没有不适宜的项目。量表的内部一致性信度在0.789-0.867之间。所有14个项目中,删除后量表信度系数提高的项目0个,说明所有项目都应予以保留。量表14个项目的共同性在0.377-0.595之间,因素负荷值在0.565-0.768之间。根据因素分析结果,分别用Q25,Q26 成对替换 Q11,Q12,用 Q31,Q32 成对替换Q5,Q6。成对替换不仅使量表在结构上更好,有更高的结构效度,而且在项目内容上更符合中国国情和当代大学生对创造力的认识。中国正处于大众创业,万众创新的时代,作为国家未来中流砥柱的大学生更不例外。国家已出台多种措施激励国人创新创业,国人创新创业的热情空前高涨。比较而言,国人特别是大学生在敢于创新,坚持创新方面比较欠缺(王立高,2016),通常表现为瞻前顾后,畏首畏尾,热情有余,后劲不足,遇到些许困难就容易打退堂鼓。笔者随机访谈了53名大学生,其中有近75%的人证实了这种表现。可以认为,Q31(在做出重大决定时我敢于冒险)和Q25(即使我的想法受到挑战和质疑我也会坚持己见)比Q5和Q11能更好的测量出当代中国大学生的创造力。第三次因素分析结果表明,14个项目的因素负荷均高于0.45且能很好地归入原量表个人或环境维度。最终保留项目对7对,个人和环境维度各7个项目,形成中文版量表第二稿。该量表的内部一致性α总分是0.858,个人是0.799,环境是 0.822。

总之,初步修订后的个人环境匹配创造力量表(PEFSC)具有良好的内部一致性信度和结构效度。

4.2 PEFSC中文版的正式施测(信效度检验)

采用PEFSC中文版第二稿对732名大学生进行施测,对量表进行信效度检验。信度分析结果表明,本量表的α系数为0.881,个人与环境维度的α系数分别为 0.793,0.838。 吴明隆(2010)认为,心理量表总量表的信度系数如果在0.80以上,分量表(或各维度)的信度系数在0.70以上,表明量表可靠;反之,如果分量表(或各维度)的系数低于0.60或总量表的系数低于0.80,则说明量表有问题。可见,修订后的个人环境匹配创造力量表无论从各维度看还是从整体上看信度α系数都令人满意,项目内部一致性程度高,量表可靠。

探索性因素分析结果表明,PEFSC中文量表第二稿14个项目的因素负荷均大于0.45且能很好的归入到中文量表的个人或环境维度。用不同样本分析的结果再次证实了初测中项目替换的必要性和有效性。验证性因素分析结果表明,个人环境匹配创造力测量模型拟合良好,量表的聚敛效度和区分效度均良好。个人和环境两维度的相关较高(0.71)主要是因为本量表是自陈式的,实际上测量的是主观知觉到的创造力的个人和环境方面,而并不一定是一种客观的存在。对环境的主观知觉与个人的知觉特点和建构风格有关,因此两个维度相关较高。PEFSC中文量表总分、两个维度与威廉斯创造力倾向量表(CAP)总分的相关很高且显著,意味着修订后的个人环境匹配创造力量表具有良好的效标效度。原作者用伦科(Runco)的创造力测验作为效标,证实了PEFSC具有良好的效标效度。本研究采用CAP作为效标是因为它被证实为测量创造力的有效工具而且测量的是个体知觉到的创造力。本研究再次验证了PEFSC具有理想的效标效度。

PEFSC原英文量表经过多次修订验证后形成PEFSC中文量表最终版,笔者将其名称确定为大学生个人环境匹配创造力量表(PEFSC-R)。修订后的量表达到了心理测量学的要求,具有良好的信效度,可以作为测量中国大学生创造力的有效工具。PEFSC中文版包括个人、环境两个维度,7对14个项目,每个维度7个项目。

5 结论

本研究可得出如下结论:中文版个人环境匹配创造力量表(Person Environment Fit Scale for Creativity,PEFSC-R)具有良好的信效度,可以作为测量中国大学生创造力的有效工具。

猜你喜欢
效度信度测验
平衡损失函数下具有两水平共同效应的信度模型
净保费在平衡损失函数下的回归信度估计∗
问卷是否可信
——基于体育核心期刊论文(2010—2018年)的系统分析
Beep test评估11~15岁少年游泳运动员有氧能力的效度研究
谈高效课堂下效度的提升策略
巧用模型法提高科学课堂教学的效度
两个处理t测验与F测验的数学关系
数字测验
你知道吗?
语言测试效度研究的另一视角:考试的因子结构研究