解晓龙 魏沁柯
(1.绍兴文理学院 人文学院,浙江 绍兴 312000;2.绍兴文理学院 社会行为与发展科学研究中心,浙江 绍兴 312000)
近年,随着我国社会平均教育水平的提高,研究生群体的规模也在迅速增大。在获得高学历的同时,该群体也正承受着高起点、高期望和人数增多而机会减少的竞争压力。研究生作为教育系统中一个较高层次的群体,其心理健康程度不仅关系着自身的成长成才,而且对整个社会的和谐稳定、健康发展也有着重要影响。由此,研究生的心理健康问题越来越引起全社会的重视。这一领域也受到研究者的广泛关注,相关实证研究的数量越来越多,范围也在不断扩大。
笔者在本研究文献搜索的过程中发现,自90年代中期我国有关研究生心理健康的研究才开始出现,2000年以后逐渐增多。其中在实证性质的调查研究中,多数研究者使用的调查工具是症状自评量表(Symptom Checklist 90,SCL-90),也由此得出了有效的数据和结论。但由于发表时间、调查地域和抽取样本等客观条件的不同,即便是采用同一测量工具,调查结果往往也存在明显差异。单个不同研究的结果往往存在三种类型,比如毛富强,李振涛,王建华(2003)[1]、熊燕,于祥成,胡义秋等(2007)[2]、林青,郭俊慧等(2010)[3]、张辉,牟宏晶(2010)[4]、周萍,付茜等(2011)[5]调查的结果较为乐观,研究生群体心理健康状况良好;杜婷(2005)[6]、吴珏(2012)[7]等调查的结果一般,研究生群体心理健康呈一般水平;柳晓林,许瑞罡(2007)[8]、黄慧兰,刘新民(2009)[9]等调查的结果较为严重,研究生心理健康存在不容忽视的问题。同时单就本研究中遴选到的76篇文献中,研究生心理健康调查结果SCL-90平均总得分高于全国成人常模的有39篇;低于全国成人常模的有37篇。所以从总体来看,研究生群体心理健康的一般性状况究竟如何,无从得知;其群体内差异更是无从谈起。已有研究模棱两可的结果与结论,将可能影响到研究生心理健康教育工作的针对性和目的性。
元分析(Meta-analysis)是以综合已有的发现为目的,对众多单个研究结果进行综合的统计学分析[10]。其本质是一种定量化的文献综述方法[11],能针对同一问题的大量研究结果进行综合分析与评价,从而概括出研究结果所反映的共同效应,即普遍性的结论。就先前谈到的研究生心理健康相关研究结果不一致的情况,也有研究者看到了其中的矛盾,并做了元分析研究。刘云等人(2007)对研究生SCL-90测试结果做了元分析,得出了研究生群体与全国常模以及研究生男女之间不存在显著差异的结论[12]。本文拟在刘云等人研究的基础上对近10年以SCL-90为调查工具的有关研究生心理健康的调查研究做一个元分析,目的是与前述元分析研究结果做对照,进一步厘清研究生心理健康状况。此外,本研究还拟进行该群体与多个常模一般层面和群体内性别、年级等亚组层面的元分析,以期获得更为客观、准确、丰富的研究结论,为了解与改善研究生心理健康状况提供科学依据。
以中国学术期刊网络出版总库(CNKI)作为文献检索平台,检索条件为:主题——“研究生”“心理健康”“心理问题”等;模式——“模糊匹配”;范围——“跨库检索”。初步搜索到相关实证性文献436篇,其中包括10篇硕士论文。在此基础上遵循以下标准对查找到的文献进行筛选:1.调查采用SCL-90量表为工具;2.SCL-90量表计分采用的是1~5分制计分,且报告了9个因子的平均分与标准差;3.文献中对比分析了研究生群体内外的状况,至少是分析了研究生心理健康的整体状况。根据以上标准最后得到关于研究生SCL-90心理健康的实证研究76篇,其中包括10篇硕士论文,最大样本量9522人,最小样本量52人,76篇文献总样本量达到65833人。纳入文献的具体情况见表1(第3页)。
第一,将76篇文献的80组数据作为实验组,与全国成人常模、青年常模和大学生常模比照,进行研究生总体心理健康水平的元分析;第二,将31篇文献40组数据中的女生作为实验组,男生作为对照组,进行男女性别差异的元分析;第三,将21篇文献32组数据中的研究生新生作为实验组,高年级研究生为对照组,进行新老生差异的元分析;第四,将33篇文献36组数据中的硕士研究生作为实验组,博士研究生作为对照组,进行研究生类型差异的元分析;第五,将6篇文献16组数据中的贫困研究生作为实验组,非贫困生作为对照组,进行家庭经济状况差异的元分析。
1.计算步骤及计算公式
(1)单项研究效应量
将76篇文献中SCL-90各个因子的平均分数转化效应量d。每一篇文献将得到9个因子效应量及其平均值共10个效应量。单项研究效应量计算公式:
M1和M2分别为所抽取的样本平均数,S1和S2分别为样本标准差的估计量,n1和n2分别为实验组和对照组的样本量,d为样本效果大小指标。
以SCL-90中的躯体化因子与全国常模的对比为例,本研究所纳入的第46项研究[7]的样本量为3282,结果表明研究生群体躯体化因子的平均得分为1.40,标准差为0.35;而作为对照组的全国成人常模的样本量为1388人,平均得分为1.37;标准差为0.48。将以上数值代入上述公式中得出效应量d为0.04。按照此方法依次计算出其余79组数据与全国常模相比的效应值。
表1 76篇文献的基本情况
编号作者发表年份调查区域样本量整体结论编号作者发表年份调查区域样本量整体结论1周 华2018黑龙江1006优于全国常模39刘素花2013河南273优于全国常模2王国领2018河南270劣于全国常模40李旭珊2013北京1950优于全国常模3郭慧梅2017上海350劣于全国常模41李江华2013江西709劣于全国常模4刘亚真2017河南441劣于全国常模42张海杰2013河北486劣于全国常模5黄金玲2017北京59劣于全国常模43张建平2013新疆182劣于全国常模6叶子青2017福建1363优于全国常模44王洪恩2013山东608劣于全国常模7赵 丽2017河南580优于全国常模45刘 勉2013广东1168优于全国常模8潘兴丽2017山东130劣于全国常模46吴 钰2012重庆3282优于全国常模9崔明明2017黑龙江80劣于全国常模47徐洪吕2012云南163优于全国常模10吴佳莉2017江苏289优于全国常模48蔡琼霞2012上海346优于全国常模11练 雯2017广东1949优于全国常模49李楠楠2012广东258优于全国常模12吴金庭2017安徽408优于全国常模50卢绍君2012辽宁191劣于全国常模13何婉文2016广东122劣于全国常模51刘素花2012河南273优于全国常模14王 瑶2016黑龙江432劣于全国常模52马喜亭2011北京483劣于全国常模15王海星2016四川2935优于全国常模53王云霞2011山西800劣于全国常模16张慕薇2016吉林258优于全国常模54姜松梅2011安徽512劣于全国常模17鲁 娟2016上海1193优于全国常模55李 金2011重庆1130优于全国常模18李 晶2016辽宁78劣于全国常模56唐延科2011江苏371优于全国常模19赵树明2016吉林441优于全国常模57张艳春2011全国238优于全国常模20米振宏2016山东780优于全国常模58黄钧裕2011广东345优于全国常模21王处渊2016北京163优于全国常模59孙 丽2010安徽736劣于全国常模22张 静2015江苏9522劣于全国常模60李富业2010新疆1765优于全国常模23薛亚兰2015辽宁52劣于全国常模61金晓凤2010浙江406劣于全国常模24张 琦2015湖北412优于全国常模62解 薇2010北京424劣于全国常模25张晓琴2015江苏2010优于全国常模63张 辉2010黑龙江133优于全国常模26唐晓义2015安徽40劣于全国常模64王玉秀2010浙江358劣于全国常模27杨 娟2015湖南59劣于全国常模65李 瑾2010四川1637劣于全国常模28杨 玉2015山东974优于全国常模66谢恩杰2010浙江158劣于全国常模29李棕松2015吉林326劣于全国常模67任 瑛2010山西234优于全国常模30李 巍2015重庆258劣于全国常模68苏日娜2010内蒙古406劣于全国常模31陆竞文2014安徽737劣于全国常模69朱俊波2010重庆600劣于全国常模32谢晓庆2014湖北653优于全国常模70许 敏2009山西579劣于全国常模33武 琳2014辽宁2547优于全国常模71黄慧兰2009安徽231劣于全国常模34付颖利2014吉林5886优于全国常模72黄永飞2009江西442劣于全国常模35郝 雁2014陕西1245优于全国常模73陈 维2009贵州450劣于全国常模36李俊芝2014河南499优于全国常模74杜艳丽2009多地116劣于全国常模37吴春燕2014江西100劣于全国常模75方 伟2009广东614劣于全国常模38吴宜虹2014重庆2854优于全国常模76温 斌2009江苏1275优于全国常模
注:只标记第一作者
(2)平均效应量的点估计
以每一篇文献被试样本的大小作为权重计算出每个因子的平均效应量D。
D为平均效应量,Ni为第i个样本的实验组与对照组的容量之和(n1+n2)。
本研究将实验组80组数据分别计算出效应量d后,代入求D值的公式,便得出平均效应量为0.01。
(3)合并效应量置信区间估计
K为纳入研究的个数。
例如,将躯体化因子各个研究的效果量d以及80项数据(K=80)的平均效果量D,代入上述公式中,可以得到总体效果量方差Sδ及95%置信区间(95%CI)估计,分别为0.09和(-0.08,0.28),从而得出实验组与对照组的差异效果检验结果。
2.计算工具
使用Excel 2003与SPSS17.0进行数据的管理与运算。
研究生总体平均效应量点估计(D值)及区间估计(95%CI)计算结果见表2(见下页)。效应量的大小一般没有统一标准,习惯上根据Cohen(1969)把效应量(绝对值)分成的“小效应”(D<0.2);“中效应”(0.2
为了验证经验性的结论,还需进一步计算平均效应值的95%置信区间(95%CI),一方面可以假设检验,另一方面可以估计总体参数。CI的范围越窄,用样本指标估计总体参数的可靠性越好,反之其可靠性就越差。同时由于研究中采用了标准化均数差来合并效应量(Standardized Mean Difference,SMD),故通过判断CI区间是否包含“0”来判断研究是否存在统计学意义,即其95%的CI区间若包含了0,等价于P>0.05,效应不显著,差异无统计学意义;若其上下限不包含0,等价于P<0.05,效应显著,有统计学意义[17]。
表2表明:我国研究生SCL-90与全国成人常模、青年常模相比的因子平均效应量为0.08、0.04,处于低效应水平,各因子的区间估计结果也不显著,差异无统计学意义;研究生与大学生常模相比平均效应量为-0.33,处于中等效应水平,区间估计结果不显著但区间分布呈偏态,接近显著。结果显示研究生群体心理健康水平优于大学生群体,另外在强迫和偏执因子上研究生显著优于大学生,具有统计学意义。
1.男女研究生与硕博研究生亚组
男女研究生、硕博研究生合并效应量及95%置信区间结果见表3(见下页)。判断标准同上。
表3表明:男性研究生心理健康水平总体上优于女性,达到中等效应水平,具体在强迫、人际敏感、抑郁、敌对、偏执和精神病性等多个因子上男性研究生都有显著优势;另外,女性研究生在强迫、焦虑、恐怖和精神病性因子上的健康水平显著低于全国常模,而男性研究生则无此类情况。博士研究生心理健康水平总体上优于硕士研究生,中等效应水平,具体在强迫、人际敏感和偏执因子上优势显著,且有统计学意义,但硕士生在这些因子上与全国常模无显著差异。
表2 研究生总体SCL-90合并效应量(D值及95%CI)
项目研究生vs全国常模研究生vs青年常模研究生vs大学生常模D95%CID95%CID95%CI躯体化0.01(-0.08,0.28)0.08(-0.43,0.60)-0.14(-0.63,0.35)强迫0.10(-0.51,0.71)-0.04(-0.68,0.60)-0.35▲(-0.64,-0.06)∗人际敏感-0.15(-0.64,0.34)-0.33▲(-0.82,0.15)-0.44▲(-0.89,0.01)抑郁0.12(-0.43,0.67)0.004(-0.53,0.54)-0.34▲(-0.89,0.21)焦虑0.20(-0.35,0.75)0.14(-0.44,0.71)-0.20(-0.66,0.26)敌对0.01(-0.42,0.44)-0.06(-0.50,0.38)-0.34▲(-0.72,0.04)恐怖0.20(-0.23,0.63)-0.02(-0.45,0.40)-0.22▲(-0.61,0.17)偏执-0.002(-0.45,0.44)-0.16(-0.85,0.35)-0.54▲(-0.94,-0.14)∗精神病性0.19(-0.20,0.58)0.06(-0.38,0.50)-0.37▲(-0.78,0.04)平均0.08-0.04-0.33▲
注:▲为中等及以上效应水平;*为p<0.05,结果差异显著,具有统计学意义
表3男女、硕博研究生SCL-90合并效应量(D值及95%CI)
注:▲为中等及以上效应水平;*为p<0.05,结果差异显著,具有统计学意义
表4新老、贫困非贫困研究生SCL-90合并效应量(D值及95%CI)
注:▲为中等及以上效应水平;*为p<0.05,结果差异显著,具有统计学意义
2.新老与贫困非贫困研究生亚组
新老研究生、贫困与非贫困研究生合并效应量及95%置信区间结果见表4(见上页)。判断标准同上。
表4表明:高年级与新生、贫困生与非贫困生心理健康水平分布无显著差异;具体因子上,新生在恐怖和精神病性因子上劣于全国常模,达到中等效应水平;贫困生与非贫困生在敌对因子上差异显著,且具有统计学意义,但贫困生在这一因子上与全国常模持平。
总体上看,我国研究生SCL-90与全国成人常模、青年常模相比的因子平均效应量为0.08、0.04,处于低效应水平,这与之前的一项元分析研究结论相符合[12]。研究与大学生常模相比平均效应量为0.33,研究生群体的心理健康水平要优于大学本科生,且为中等效应水平,这一情况的出现可能是研究生相对于更为年轻的大学生来说,经历更为丰富,似乎显得更为老练。随着年龄增加和人生阅历的不断丰富,有些心理问题会逐渐消失或自然减弱,环境适应能力更强[18]。
从9个因子的平均效应量来看,除焦虑、恐惧和精神病性3个因子的效应值接近0.2,处于低等水平,其余因子效果量都处于极低水平,而偏执因子的效应值低到几乎可以忽略。因此综合近年来发表论文的结果,我国研究生群体的心理健康水平总体上来看与全国成人常模分布相当,没有表现出群体的特殊性。有的调查得出“我国研究生心理健康问题非常严重”的结果可能是存在样本、地域差异或其他因素的影响造成的。诚然,研究生学习、工作、生活上存在一定压力,加之连年扩招,就业形势日趋严峻。研究生所面临的压力有所增大。但另一方面,由于当今社会信息畅通,大多数研究生当初报考之时,他们已经了解研究生学习、生活的状态,以及将来就业形势的严峻性。现今的研究生变得越来越务实,能主动根据形势的变化调整自己的期望,以积极的心态应对变革的社会,心理的冲突自然会少很多[12]。本研究中,研究生的焦虑、恐怖和精神病性因子略高于全国成人常模,且存在相对轻微的差异。这些症状可能是由于研究生往往要面对科研、毕业论文、恋爱、就业等方面的压力所引起的[19]。此外,研究生校外兼职比例高,时间长,这加剧了日常生活紧张程度[20],也容易产生心理问题。
从研究生性别来看,男女生之间D值平均差值为0.22,且男生优于女生,属于中低效应。一方面男女生之间心理健康差异没有外界猜测的那样显著;另一方面男生的心理健康状况的确优于女生,尤其在强迫、人际敏感、抑郁、敌对、偏执和精神病性等多个因子上,女研究生劣于全国常模,达到中低水平显著。对于女研究生目前堪忧的心理状况,有研究基于社会性别的理论视角解读其在学业、就业、婚恋等方面所遭受的压力[21]。该群体忧郁症、情绪障碍、自杀比例高等心理问题日渐严重,政府、高校以及社会组织应当引起高度重视,对其采取必要的心理疏导措施[22]。同时,有学者呼吁要尤其关注女研究生们由于年龄原因所面临着的许多实际问题,比如婚恋、生育等[23]。
从研究生类型上看,博士生与硕士生之间D值平均差值为0.24,博士生群体优于硕士生,属于中低效应水平。在强迫和人际敏感因子上,博士生优于硕士生且达到中等显著水平,在检验中得以验证,差异具有统计学意义。这一情况的出现可能是由于博士生经历较为丰富,抗压能力明显优于硕士生;另外博士生属于更高教育水平的群体,就业压力相对较小;还有许多博士生都有过工作经历,在经济状况上相比硕士生更为宽裕。另外,本研究中博士生的样本量相对较小,是否会造成结果偏差,值得商榷。
高年级研究生与新生之间D值差值为0.06,属于低效应水平;从研究生新生与高年级研究生差异较显著的敌对因子来看,可能主要是新生存在适应上的问题。研究生的学习生活一般以课题组为小单元,人际接触面相对较小,年龄分布比较离散,生活阅历不一样,导致他们之间的交流和沟通相对较难,更容易产生敌对情绪。
从贫困生与非贫困生的群体差异来看,其之间D值平均差值为0.09,非贫困生心理健康状况略优于贫困生,但在敌对和偏执因子上的效应量值为中低水平,差异显著。贫困生较容易显示出敌对的情绪和心理。放弃本科毕业找工作的机会,这对于经济相对困难的研究生来说,是一个重大抉择,同时读研又给他们带来更大的压力与考验。经济上的窘迫容易造成自卑与孤僻心理,对周围人往往存在戒心,对别人无心的举动容易产生过于激烈的情绪和行为反应。高校有关部门一方面在物质方面应该给予贫困生必要的帮助,减轻其生活压力;同时也应该关注这个群体的内心世界,重点放在健康人格和情绪调节的教育上。
1.我国研究生的SCL-90结果与全国成人常模、青年常模并无显著差异,研究生群体心理健康状况优于大学生群体,差异为中等效应。
2.男性研究生心理健康水平优于女性,博士生优于硕士生,且居于中等显著水平;高低年级以及贫困、非贫困生之间的心理健康水平不存在显著差异,但个别因子的差异达到中等效应。