李子龙 李益 王瑞明
摘 要 提升心理学实验外部效度与便利性的需求使得心理学研究呈现出在线化的趋势。线上心理学实验具备实时获取数据、真实性强、样本量大的优点,然而线上实验工具多集中于web端,缺乏移动端的心理学实验工具,因此本研究开发了基于微信小程序的在线实验工具,通过基于flanker范式及其变式的认知控制实验验证微信小程序的可靠性。结果发现,微信小程序复制的三种认知控制成分都表现出了经典的flanker效应;安卓手机与苹果手机的表现存在差异;低性能手机与中高性能手机的表现也存在差异。其中值得注意的是,认知控制成分之间的关系符合理论共识。总而言之,微信小程序作为心理学线上实验工具是可靠的,但是要注意设备类型与性能的影响。
关键词 在线行为实验;心理学研究工具;微信小程序;认知控制
分类号 B849
DOI:10.16842/j.cnki.issn2095-5588.2024.02.006
1 引言
心理学研究关注内部效度与外部效度,前者意味着结论的可靠性,后者则意味着结论的推广性。线下实验室能够很好地保证研究结论的可靠性,但是却因为被试数量、代表性以及实验条件的严格控制导致结论的推广性不足,这就促使心理学实验从线下向线上延伸。线上心理学行为实验具备实验效率高、样本多样化、数据处理准确和避免主试和被试效应等优点,因此有许多心理学实验者尝试进行在线心理学研究。互联网对于心理学而言,不仅是一个新的研究对象,也是一个可广泛应用的研究工具(Birnbaum, 2000)。
用于设计线上心理学研究的工具和类似产品重点集中在PC端,国内外热门的在线心理学研究工具主要是基于浏览器的web编程框架和需要下载安装包的实验软件, 如PsyToolkit (Stoet, 2017)、Gorilla (www.gorilla.sc) (Anwyl-Irvine et al., 2020)、jsPsych(www.jspsych.org) (de Leeuw, 2015)。国内自主研发的心理实验软件主要和心理实验教学相关,如中国科学院心理研究所的云端心理实验室(伍美群, 郑剑虹, 2016);CETS心云实验教学系统、PsyLAB、Psytech3.0、PsyKey等产品(赵俊华等, 2019)。简而言之,目前在线心理学实验工具基于浏览器,基于移动端的实验工具比较匮乏。经过搜集、梳理和挖掘,我们发现了一些能够进行在线行为实验的IOS应用程序,比如StimuliApp、pace of life等(Marin-Campos et al., 2021; Stieger et al., 2018),然而这些产品主要是研究者用于开展自己的研究课题,并不是普适性的心理学实验工具。尽管如此,在线研究仍然处于蓬勃发展阶段,比如在线认知训练(申婉丽等, 2019)与使用在线测验法研究统计的个体差异(刘琦, 卢张龙, 2023)。
微信小程序的产品概念正好填补了心理学研究在线化的需求现状。微信官方数据表示,截至2022年11月,微信小程序日活跃用户突破6亿。微信小程序是一种不需要下载安装即可使用的应用,用户“扫一扫”或者搜一下即可打开应用。小程序拥有和Native App几乎一样的功能和形式,可以胜任开发者的诸多需求(刘红卫, 2016)。微信小程序还具备极高的便利性,可以收集到更真实、更详细的大量数据,为心理学行为研究在线化提供新的平台。经过搜寻,我们发现了一款微信小程序tcLab。tcLab可以在線收集心理学量表和线上行为数据,允许主试设计与发布实验,也允许被试完成实验。截至2023年2月,tcLab上已经累计了2004名研究者和23122名被试,上线实验任务8230个。然而这款小程序并未详细说明计时准确性和计时精度,所以其行为数据的有效性与可靠性存疑。虽然tcLab存在不足,但是仍然证明了微信小程序作为移动端心理学实验工具的潜力。
为了验证小程序作为心理学实验平台的可行性,我们选择了认知控制相关的实验任务。认知控制是几十年来认知心理学和认知神经科学的热点研究领域(Sun et al., 2019)。认知控制,也称执行控制,是根据某一特定要求对相关信息进行灵活性加工,并抑制无关信息的机制或系统(Diamond et al., 2007)。认知控制功能不仅直接影响个体各种认知行为的表现与结果,也关系到个体的社会性发展与心理健康 (de Zeeuw et al., 2012; Disner et al., 2011; Waters et al., 2012) 。
认知控制中存在某些成分(Bialystok, 2009),其中较为关键的有抑制成分和转换成分(Sun et al., 2019),不同的认知成分其内在的作用机制各不相同(范小月等, 2012; 刘聪等, 2016)。抑制是指个体对某些可能出现冲突的刺激克服习惯的倾向反应动作并做出符合当前刺激的行为的能力,是认知控制的核心成分。抑制能力包含多个认知加工过程,Bunge等将抑制能力作了更加细致的划分,认为抑制可以分为干扰抑制和反应抑制(Bunge et al., 2002)。干扰抑制是指当出现多种刺激时,个体集中注意力于有关刺激上,同时忽略与目标刺激竞争的刺激;反应抑制则指向被试的行为层面,需要个体压制易于表现出来的习惯性反应。转换又称认知灵活性,是指在多种刺激出现时,灵活且迅速地切换判断角度或者方式从而做出符合新规则的行为的能力。认知灵活性高的个体具有更强的问题解决能力和人际交往能力(姚海娟等, 2008)。转换成分帮助人们重新组织原有的行为过程,并产生新的行为去适应外部环境和内部想法的变化,因此在理解并形成新的知识和技能的过程中起着重要作用。
在抑制成分的认知研究中,多使用flanker任务和flanker变式任务进行测量。Flanker任务也称侧抑制任务,由Eriksen等在1974年提出(Eriksen & Eriksen, 1974),常被用来测量认知控制能力。被试在该任务中需要尽可能忽略周围符号的影响并对中间的符号进行反应,符号方向一致的刺激更容易引发被试的优势反应,因此在中间符号和周围符号方向一致的条件下,被试的反应时更快。认知控制的三种成分:干扰抑制、反应抑制与转换控制可以使用经典的flanker任务及其对应的两种变式进行测量(Sun et al., 2019)。
手机端的心理学实验平台虽然具有独特优势,但缺乏可靠的心理学实验工具,因此本研究力图验证使用微信小程序作为心理学实验工具的可行性与可靠性。首先在研究1中,我们开发并上线微信小程序,复刻了经典的flanker范式及其变式,收集被试的反应时和正确率,并且保证反应时计时具备毫秒级的精确性。研究2是验证微信小程序平台能够复现flanker效应,并且探讨设备类型和设备性能的影响。研究3进一步探讨不同认知控制成分之间的关系,验证来自微信小程序的实验结果是否符合已有的理论共识。本研究假设微信小程序的三种认知控制任务都可以重复出flanker效应,但是苹果手机与安卓手机之间存在差异,并且不同性能的手机收集数据的效果也可能存在差异。此外,本研究还假设三种认知控制成分的效应量之间存在不显著的相关,但是由于抑制控制与干扰控制同属于抑制成分,所以抑制控制与干扰控制之间的相关性高于抑制与转换成分之间的相关性。
2 研究1:基于微信小程序的心理学在线实验平台开发与上线
2.1 注册账号
用户进入小程序首页之后点击首页的注册按钮,获取微信的默认头像,然后会被询问是否同意获取手机品牌、设备型号、网络状态等信息,之后进入信息完善界面,填写姓名、年龄、利手和性别等人口学信息。该小程序除了收集人口学变量之外还收集了被试的手机型号信息与性能信息。获取手机设备类型的实现方法为经被试知情同意后,使用wx.getSystemInfoAsync接口提取被试登录微信小程序的设备型号、操作系统、网络状态和设备性能等信息。将获取成功的系统信息中brand和model值作为设备型号,根据不同的设备型号区分安卓和苹果两种机型。将获取成功的系统信息中benchmarklevel值作为设备性能的水平,1以下表示性能未知,25~34为高档,21~24为中档,3~20为低档。该分类标准直接来自微信官方制定的设备性能标准(https://developers.weixin.qq.com/minigame/dev/guide/performance/perf-benchmarkLevel.html)。
微信官方分析了市面上超过99%的用户的手机性能,根据CPU、GPU、内存等硬件因素对不同型号的手机评分与分档,涵盖超过8000款设备。微信官方还调查了苹果手机与安卓手机中不同的档位分布。官方文档显示,苹果手机高中低三档的分布为6.60%、15.20%;安卓手机高中低三档的分布为33.40%、34.50%与32.10%。性能分布来自微信官方提供的文档(https://developers.weixin.qq.com/minigame/dev/guide/performance/perf-mesure.html)。
Benchmaeklevel值以及分档都由微信官方提供,并且一直用于指导小程序开发者进行性能优化,因此使用Benchmaeklevel值对设备硬件性能进行计分以及分档是目前最全面、权威与可靠的方法。
2.2 角色页面
用户角色分为被试和主试两个身份,两个角色在查看数据和管理被试费方面拥有不同的操作权限,并且各自的“我的”页面呈现不同的入口。被试成功注册后,系统为每个用户自动生成随机的ID号。被试可以自行查看完成的实验和被试费状态,添加主试微信领取被试费。主试可以查看任务信息、被试的注册信息及被试费发放状态。
2.3 刺激呈现
被试阅读完实验指导语后进入实验运行环节,实验刺激按照打乱后的顺序依次呈现。实验刺激以对象数组的形式保存在js文件中,包括刺激内容、刺激条件(一致、不一致)、刺激颜色、正确答案、点击反应和反应时等主要属性。小程序调用setTimeout函数控制实验刺激或者空屏呈现的时间间隔,使用promise对象控制实验刺激定时呈现后的后续事件。
2.4 反应记录
由于微信小程序的使用习惯是在单个手机屏幕上完成所有的操作,因此这里的实验范式在用户交互上做出改动,实验刺激位于屏幕中央,两边灰色区域作为被试的反应区域,左右区域分别使用左右箭头作为指示标志,即“ ”符号表示左键,“”符号表示右键。
在练习实验中,被试看见实验刺激并做出点击屏幕的动作后,系统进行反馈。首先是屏幕两侧灰色按钮消失,屏幕正中央出现反馈信息,如果被试点击了正确的按钮,屏幕中央呈现“正确”提示,如果被试点击了错误的按钮,屏幕中央呈现“错误”提示。如果被试在规定时间内没有点击灰色按钮区域,屏幕中央则出现“未做出反应”的提示。
在正式实验中,小程序对被试的反应和反应时都进行了记录,但不呈现任何反馈。当被试出现点击动作后,小程序调用Date.now函数记录被试从刺激出现到做出反应之间的时间间隔——精确到毫秒,并保存至任务信息的对象数组,立即随机进入下一个试次。如果被试在2000ms内未做出任何反应,小程序自动进入下一个试次。被试完成了该任务的所有试次后,小程序计算执行任务的总正确率并保存,最后访问uploadData云函数,将任务信息上传至云数据库datas集合,首次完成的记录上传至money集合。
3 研究2:基于微信小程序的心理学线上实验平台的可靠性验证
3.1 被试
线上一共招募到151名大学生被试,年龄在18~28岁(M=20.74,SD=1.802),43%为男性,57%为女性,89.4%为右利手,10.6%为左利手。剔除无反应试次,保留正确率在75%以上的数据,删除三个标准差以外的极端数据,共115人完成干扰抑制任务,127人完成反应抑制任务和转换控制任务,共76人全部完成三个认知控制任务。将各个任务下有效被试的反应时作为因变量。
3.2 程序
被试扫描“伴你科研”微信小程序二维码或者搜索“伴你科研”关键字,进入小程序首页,点击注册按钮,确定系统获取微信个人信息和设备信息,随后完善个人基本信息,包括真实姓名、学校/单位、专业/职业、身份证号码、性别、手机号码、支付宝账号,填写完毕后注册成功。之后被试在小程序首页选择一个任务并跳转至实验详情页阅读实验相关说明,包括实验名称、实验过程须知、伦理准则和被试费说明等,点击确定进入实验运行页面。系统依次呈现指导语,被试点击“阅读完毕”进入练习实验。当被试正确率达到80%以上时,可以点击“继续练习”以进行一次练习实验,或者点击“进入实验”进行正式实验。系统允许被试一直练习,直到确认自己熟悉实验规则后再进入正式实验。作答结束后,屏幕中央显示“本实验已结束”并自动返回小程序首页。各任务流程与手机所呈现的界面见图2。
本研究采用了干扰抑制任务、反应抑制任务和转换控制任务。干扰抑制任务是经典的flanker任务,实验刺激是五个朝向相同或不同的箭头(< < < < < 或 < < > < <),任务包含练习实验和正式实验,练习实验共有六个试次,正式实验共有16个试次,所有试次均随机呈现。在练习实验中,屏幕中央出现“+”注视点,500ms后出现实验刺激,被试看见实验刺激后,需要尽可能迅速且正确地对中间的箭头方向进行反应,屏幕两侧灰色区域为被试做出点击动作的反应区域,箭头向左按左键,箭头向右按右键。若被试做出点擊屏幕的动作,系统提供“正确”或“错误”反馈。反馈信息呈现1250ms后进入250ms的空屏,接下来呈现下一个试次。在正式实验中,被试看见实验刺激立即做出反应后,系统不会出现正确与否或者未出现反应的反馈,其余的实验流程和时间间隔与练习实验一致。
反应抑制任务是flanker的变式任务,流程与干扰抑制一致,区别在于实验刺激变更为两侧三角形或者圆形形状和中央左或右箭头(▲▲<▲▲或●●>●●)。两侧为三角形时,被试做出与箭头方向一致的反应;两侧为圆形时,被试做出与箭头方向相反的反应。转换控制任务采用颜色-形状转换任务(Wang et al., 2007),该任务的实验刺激是五个红色或黄色的圆形或三角形。被试根据线索判断刺激的形状或者颜色:线索为颜色时,红色按左键,黄色按右键;线索为形状时,三角形按左键,圆形按右键。该任务包含练习实验和正式实验,练习实验共6个试次,正式实验共64个试次。在第32试次后安排20s的定时休息,20s倒计时结束后,继续进行剩下的32个试次。在注视点之后呈现线索250ms,其余同干扰抑制任务和反应抑制任务。
3.3 结果
3.3.1 认知控制任务
将任务条件作为自变量,被试在各个认知控制任务上的成绩作为因变量,将反应时进行自然对数转换后放入SPSS 26.0进行配对样本t检验。被试在三种认知控制任务上的数据结果见表1。
配对样本t检验结果发现,在干扰抑制任务中,不一致条件下的反应时显著长于一致条件下的反应时,t(114) = 11.943,p<0.001,Cohen’s d=0.63。在反应抑制任务中,不一致条件下的反应时显著长于一致条件下被试的反应时,t(126)=5.612,p<0.001,Cohen’s d=0.36。在转换控制任务中,不一致条件下的反应时显著长于一致条件下的反应时,t(126)=13.327,p<0.001,Cohen’s d=0.52。实验结果见图3。
被试在三个认知控制任务均表现出flanker效应。这说明微信小程序总体上可以用于收集心理学行为实验数据。为了进一步验证线上实验复刻出经典心理学效应是否受到手机本身因素(如设备类型和设备性能)的影响,接下来分别研究设备类型与设备性能对三个认知控制任务成绩的影响。
3.3.2 设备类型的影响
线上招募的151名大学生被试中,38人使用苹果手机,113人使用安卓手机。正确率在75%以下的被试数据、非移动设备的数据(如平板和电脑)、无反应试次、3个标准差以外的极端数据被删除。干扰抑制任务的有效样本是110人,71.8%安卓机型,28.2%苹果机型;反应抑制任务的有效样本是123人,74.8%安卓机型,25.2%苹果机型;转换控制任务的有效样本是124人,76.6%安卓机型,23.4%苹果机型。
采用两因素混合设计方差分析。被试间变量是设备类型,包括安卓和苹果两个水平。被试内变量是任务条件,包括一致和不一致两个水平,因变量是反应时。将反应时取自然对数放入SPSS 26.0进行2(任务条件:一致、不一致)×2(设备类型:安卓、苹果)的重复测量方差分析。事后比较采用Bonferroni法校正。安卓机型和苹果机型的不同认知控制任务的反应时见表2。
方差分析结果表明,在干扰抑制任务中,干扰抑制条件的主效应显著,干扰抑制任务不一致条件下的反应时显著长于一致条件下的反应时(F(1,108)=121.92, p<0.001,η2=0.53);设备类型的主效应显著,安卓设备的反应时显著高于苹果设备的反应时(F(1,108)=7.69, p=0.007,η2=0.07);干扰抑制条件和设备类型的交互作用不显著(F(1,108)=2.81, p=0.097,η2=0.03)。结果见图4。
方差分析结果表明,在反应抑制任务中,反应抑制条件的主效应显著(F(1,121)=18.37, p<0.001,η2=0.13);设备类型的主效应显著,安卓设备的反应时显著高于苹果设备的反应时(F(1,121)=7.51, p=0.007,η2=0.06);反应抑制条件和设备类型的交互作用不显著(F(1,121)=0.38, p=0.537,η2=0.003)。
在转换控制任务中,转换控制条件的主效应显著(F(1,122)=170.23, p<0.001,η2=0.58);设备类型的主效应不显著(F(1,122)=1.60, p=0.209,η2=0.01);转换控制条件和设备类型的交互作用显著(F(1,122)=9.12, p=0.003,η2=0.07)。具体而言,简单效应检验结果表明,安卓手机在一致条件和不一致条件下的反应时差异显著(F(1,122)=107.47, p<0.001,η2=0.468);苹果手机在一致条件和不一致条件的反应时差异显著(F(1,122)=84.25, p<0.001,η2=0.41)。总的结果发现整体上安卓手机的反应时比苹果手机的长。在干扰抑制任务和反应抑制任务中,设备类型与条件没有表现出显著的交互,而转换控制任务中出现了明显的交互,即苹果手机在不同条件下收集到的反应时差异比安卓手机的大。
然而苹果手机与安卓手机硬件性能水平不同,专注高端市场的苹果手机表现更好可能与其较高的手机硬件性能相关。微信官方提供的性能分布中,苹果手机的高性能机型占比为78.20%,而中低档机型加起来只占21.80%,安卓手机在不同性能档位之间的分布则比较均匀,低中高三档依次为33.40%,34.50%与32.10%。所以苹果手机与安卓手机的差异到底是来自硬件性能还是软件层面的操作系统不能确定。因此接下来我们分离硬件性能与操作系统的影响,以进一步分析苹果手机与安卓手机所收集的数据的差异的来源。我们首先统计了本研究中性能为“未知”以外的所有机型的性能分布,结果见表3。
苹果手机中主要是高性能的機型,且分布与微信官方统计的较为一致。为了进一步控制硬件性能的影响,我们只选取了高性能的苹果手机与高性能的安卓手机的数据,然后使用平均反应时与三种不同成分的效应值作为因变量。平均反应时为被试不同试次反应时的平均数。在干扰抑制和反应抑制成分中,效应值为flanker效应值,即不一致试次反应时减去不一致反应时;在转换控制中,效应值为转换代价,即转换试次的反应时减去不需要转换试次的反应时。使用SPSS 26.0进行独立样本t检验,结果见表4。
结果发现,高性能的苹果手机与安卓手机收集到的反应时不存在显著差异(ps>0.05),但是在干扰抑制的效应值上,苹果手机与安卓手机之间存在显著差异(p=0.024)。这说明即使在硬件上都属于高性能手机,苹果手机与安卓手机不同的操作系统也会带来数据收集效果的差异。
以上结果表明不同的设备类型的确影响微信小程序收集线上认知控制任务数据的效果。总体上苹果手机的反应时显著快于安卓手机,而且即使都是高性能手机,安卓手机和苹果手机测量出来的干扰抑制中的flanker效应量也存在差异。因此苹果手机与安卓手机不仅在硬件水平上存在性能差异,在软件层面上也存在差异。
除了手机类型会造成影响之外,同种手机内部也存在不同档位的硬件性能。不同的硬件性能也可能影响数据收集效果,所以接下来我们分析了手机性能的影响。
3.3.3 设备性能的影响
为了控制手机类型的影响,且由于苹果手机的性能分布并不均匀,低性能手机过少,中性能手机的数据则直接缺失,所以去除了所有的苹果手机,本研究只分析了安卓手机的数据。在剔除无反应试次,保留正确率在75%以上的数据,删除3个标准差以外的极端数据之后,不同设备性能的被试量分布见表3中的安卓部分。
采用两因素混合设计方差分析。被试间变量是设备性能,包括高、中、低三个水平。被试内变量是任务条件,包括一致和不一致两个水平。因变量是反应时。将有效数据进行自然对数转换后放入SPSS 26.0,进行2(任务条件:一致/不一致)×3(设备性能:高/中/低)重复测量方差分析。事后比较采用Bonferroni法校正。高、中、低性能设备的不同认知控制任务的成绩见表5。
方差分析结果表明,在干扰抑制任务中条件的主效应显著,干扰抑制任务不一致条件下的反应时显著长于一致条件下的反应时(F(1,71)=60.10, p<0.001,η2=0.46);设备性能的主效应显著(F(2,71) = 6.01, p=0.04, η2=0.15);事后检验结果表明,低性能设备收集到的反应时显著长于中性能设备(p=0.005),显著长于高性能设备(p=0.011),中性能和高性能无显著差异(p=1.00)。干扰抑制条件和设备性能的交互作用不显著(F(2, 71) =0.83, p=0.44, η2=0.02)。
方差分析结果表明,在反应抑制任务中,条件的主效应显著,不一致条件下的反应时显著长于一致条件下的反应时(F(1,80)= 12.85,p<0.001, η2=0.14);设备性能的主效应显著(F(2,80)=3.20, p=0.046,η2=0.07);事后检验结果表明,低性能手机收集到的反应时边缘显著高于高性能的反应时(p=0.054),中性能与高性能无显著差异(p=1.00),中性能与低性能反应时边缘显著差异(p=0.084)。条件和设备性能的交互作用显著(F(2,80)=4.75, p=0.012,η2=0.10)。具体而言,简单效应检验分析结果表明,高性能设备在一致条件和不一致条件下的反应时差异显著(p<0.001);中性能在一致条件和不一致条件下的反应时差异显著(p=0.015);低性能在一致条件和不一致条件下的反应时差异不显著(p=1.00)。
在轉换控制任务中,条件的主效应显著,不一致条件下的反应时显著长于一致条件下的反应时(F(1,83)=91.40, p<0.001, η2=0.45);设备性能的主效应不显著(F(2,83)=2.34, p=0.102, η2=0.05);条件和设备性能的交互作用边缘显著(F(2,83)=2.83, p=0.096, η2=0.055)。简单效应检验表明,高性能设备收集的反应时在不同条件间差异显著(p<0.001),中性能设备的反应时差异显著(p<0.001),低性能设备差异不显著(p=0.102)。
本研究发现不同性能的安卓手机收集到的数据质量是不同的。低性能的手机更加不灵敏,收集到的反应时比中高档的手机更长,而中高档之间没有差异。低性能手机在反应抑制和转换控制任务中没有探测到显著的flanker效应。
综合以上研究,微信小程序采集线上行为实验数据在可靠性方面总体上是可以接受的,只是需要注意手机类型与性能的影响。然而微信小程序收集而来的数据是否能真实反映出研究对象之间的关系,即认知控制不同成分之间的关系如何,研究2无法说明,由此进行研究3。
4 研究3:对认知控制成分关系的验证
4.1 被试
研究2线上一共招募151名大学生被试,从中选择全部完成三个认知控制任务的被试,共76人。剔除无反应试次,保留正确率在75%以上的数据,删除3个标准差以外的极端数据。由于低性能手机在数据收集上并不可靠,此处选择中高性能的手机进行分析,其中65.8%为安卓机型,34.2%为苹果机型。
4.2 程序
同研究2。
4.3 结果
分析不同认识控制成分的flanker效应值,计算方法见研究2。各成分的效应值见表6。
使用JASP 0.17.1进行数据处理,比较认知控制成分之间的相关性差异。皮尔逊相关分析结果表明,干扰抑制成分和反应抑制成分无显著相关(r=-0.17, p=0.148),干扰抑制成分和转换成分无显著相关(r=0.10, p=0.419),反应抑制成分和转换成分无显著相关(r=-0.04, p=0.705)。这种不显著的结果符合三种认知控制成分相对独立的理论共识,但是由于方差分析这类的假设检验在验证零假设方面没有优势,而贝叶斯因子分析在验证零假设方面具有假设检验没有的优势(Kruschke, 2010),所以进一步采用贝叶斯因子分析验证了三种成分的关系。同样使用JASP 0.17.1统计软件进行贝叶斯因子分析,三个H0假设分别为干扰抑制与反应抑制相关系数为0;干扰抑制和转换控制相关系数为0以及反应抑制与转化控制相关系数为0。皮尔逊相关系数和BF10见表7。
贝叶斯皮尔逊相关分析结果表明,干扰抑制成分、反应抑制成分和转换控制成分之间的相关性贝叶斯分析表明各个成分之间的相关均低于1,这支持H0假设,即干扰抑制成分、反应抑制成分和转换控制成分之间不存在明显的相关。这意味着在认知控制过程中的确存在三个分离的认知控制成分。转换控制与另外两个成分的相关系数的BF10低于0.33,这意味着中等程度的证据支持转换控制与干扰抑制、反应抑制之间关系不密切。干扰抑制与反应抑制同属于抑制控制,这说明转换控制与抑制控制关系不密切。而干扰抑制和反应抑制的相关系数的BF10是另外两个BF10的2.03倍与2.59倍,这说明同属于抑制控制的两个成分相关性虽然低,但是比转换控制与抑制控制的相关性高,表明二者同属于转换控制以外的抑制控制成分,这与Bunge对抑制成分的分类观点一致(Bunge et al., 2002)。
5 讨论
本研究探索了微信小程序作为新型心理学在线研究工具的可能性与可靠性,通过复刻认知控制任务发现微信小程序在三个认知控制任务中均表现出经典的心理学效应。苹果手机比安卓手机更加灵敏,中高性能的手机在检测不同条件的差异性方面更稳定可靠,更能测量到心理学效应。本研究关注了线上数据的目标研究对象之间的真实关系,对微信小程序的工具属性在心理学研究中的实际意义展开讨论。
5.1 作为线上心理学实验工具的微信小程序
本研究梳理了在线心理学行为研究的工具现状,发现心理学研究工具大部分集中在PC端安装包和web编程框架,这些工具依赖个人计算机,便捷性有限,并且存在一定程度的使用成本。本研究通过设计、环境搭建和功能开发,最终实际上线基于微信小程序的在线心理学实验工具。经测试,系统界面、功能运行和基础性能表现等处于正常水平,能够满足科学研究的基础使用。
本研究使用腾讯云开发成功搭建微信小程序开发环境,设计小程序的系统架构,针对在线心理学行为研究特点进行开发,实现了主试被试分离、实验发布和数据收集和被试费发放的功能。在运行方面,干扰抑制任务、反应抑制任务和转换控制任务三个行为范式在微信小程序上成功运行,具体而言,打开、跳转、实验运行、记录反应时、保存数据的功能全部成功执行。在刺激呈现方面,小程序使用setTimeout函数使随机化呈现的任务试次按照设置的时间间隔在可接受的区间内稳定出现。在反应记录方面,微信小程序使用Date.now函数记录被试的反应时间,同时对被试的按键动作进行正确、错误和是否做出反应的判断。
总而言之,小程序能够按照主试要求呈现刺激,并且记录被试的反应并收集到毫秒级的反应时,初步达到心理学科学研究的标准。
5.2 微信小程序的可靠性
微信小程序成功复刻干扰抑制任务、反应抑制任务和转换控制任务,都得到了显著的flanker效应,即不一致条件下被试对刺激的反应时显著长于一致条件下的反应时。之后进一步探索了手机系统类型与手机硬件性能的影响。
在手机系统类型方面,不同任务在安卓机型和苹果机型下的表现不一样,总体而言,在苹果手机上采集反应时比在安卓手机上灵敏,更接近线下实验室被试的反应时成绩。进一步去除硬件性能的影响后,对高性能的安卓手机与苹果手机的比较同样发现了差异。苹果高性能手机和安卓高性能手机在干扰抑制、反应抑制与转换控制的总体反应时上没有显著差异,在反应抑制与转换控制的效应值上也没有差异,但是在干扰抑制的效应值上,也就是传统的flanker效应值上,两者存在差异。苹果手机收集到的flanker效应值(102±46.56ms)显著高于安卓手机(52.04±52.89ms)。这种差异说明苹果手机除了平均硬件性能高于安卓机之外,其所搭载的IOS系统也比安卓手机搭载的Android系统灵敏。这与前人研究也一致。Pronk等比较台式机、笔记本电脑、智能手机和平板电脑上的主流web浏览器后发现,使用IOS进行心理测试明显比安卓准确(Pronk et al., 2020)。
本研究还关注了手机性能的影响,结果显示低性能设备的表现没有中性能设备和高性能设备好。中性能手机和高性能手机的表现一样可靠,而低性能手机不仅灵敏性更差,还无法有效测量到反应抑制和转换控制中的flanker效应。因此在使用微信小程序收集科研数据时,推荐使用中性能和高性能的智能手机,并且注意区分数据是来源于安卓手机还是苹果手机。在正式开展实验之前,主试应对数据采集的设备类型、可用型号、网络环境、使用的微信版本等相关信息进行说明,在分析过程中应该采用必要的方法去除手机性能与手机类型对数据结果的干扰。
5.3 小程序反映出的认知控制
本研究除了复现经典范式之外,还验证了微信小程序是否能够得到符合理论预期的结果。本研究发现不同的认知控制成分之间的相关性较低,且均未达到显著,这表明认知控制在个体的认知控制系统中确实存在三个明显分离的认知控制成分,这一结论与线下实验室发现认知控制包含干擾抑制成分、反应抑制成分和转换控制成分的观点相符(Bialystok et al., 2009)。根据贝叶斯因子分析的结果,干扰抑制与反应抑制之间相关程度高于转换控制与抑制控制的相关程度。这一结果支持反应抑制和干扰抑制都属于抑制控制、而转换控制不属于抑制控制这一共识。通过微信小程序得到的结果与学界的共识以及前人结果一致,说明小程序不仅能再现认知控制范式的经典效应,其延伸的结果同样符合认知控制的已有理论。
5.4 研究局限与展望
由于主客观条件的限制,本研究存在以下问题。第一,微信小程序复刻的实验范式有限,无法证明微信小程序适合所有的认知行为实验,比如它不适合对刺激呈现时间要求更高的Attentional Blink任务和Masked Priming任务。第二,刺激呈现与反应时目前的精度为毫秒级,尚未达到微秒级。第三,无法去除来自多任务并行、网络环境及人为因素等方面的影响。未来不仅需要探索其他范式在小程序平台上的可靠性,还应该对计时准确性及其影响因素展开更详细的研究,比如,使用外部计时的光敏二极管等专业硬件测量刺激的持续时间和被试的反应时间,并提供被试反应时的数据分布形态。
参考文献
范小月, 王瑞明, 吴际, 林哲婷(2012). 熟练和非熟练中英双语者不同认知控制成分的比较. 心理科学, 35(6), 1304-1308.
刘聪, 焦鲁, 孙逊, 王瑞明(2016). 语言转换对非熟练双语者不同认知控制成分的即时影响. 心理学报, 48(4), 1-10.
刘琦, 卢张龙(2023). 在线测验法在统计学习个体差异性研究中的应用. 心理技术与应用, 11(6), 376-384.
刘红卫(2016). 微信小程序应用探析. 无线互联科技, 13(23), 11-12.
申婉丽, 张舒涵, 黄小璐, 魏雷, 何清华(2019). 线上认知训练的研究现状与训练效果. 心理技术与应用, 7(11), 671-682.
伍美群, 郑剑虹(2016). 心理学实验教学结合模式的实证研究. 岭南师范学院学报, 37(3), 143-150.
姚海娟, 白学军, 沈德立(2008). 认知灵活性和顿悟表征转换:练习类型的影响. 心理学探新, 28(4), 5.
赵俊华, 王艳, 张梦莹(2019). 心理实验教学系统设计思路与发展探索. 中国教育技术装备, 2019(24), 12-13, 16.
Anwyl-Irvine, A. L., Massonnié, J., Flitton, A., Kirkham, N., & Evershed, J. K. (2020). Gorilla in our midst: An online behavioral experiment builder. Behavior Research Methods, 52(1), 388-407.
Bialystok, E. (2009). Bilingualism: The good, the bad, and the indifferent. Bilingualism: Language and cognition, 12(1), 3-11.
Birnbaum, M. H. (Ed. ). (2000). Psychological experiments on the Internet. San Diego: Academic Press.
Bunge, S. A., Dudukovic, N. M., Thomason, M. E., Vaidya, C. J., & Gabrieli, J. D. (2002). Immature frontal lobe contr-ibutions to cognitive control in children: Evidence from fMRI. Neuron, 33(2), 301-311.
de Zeeuw, P., Weusten, J., Van Dijk, S., Van Belle, J., & Durston, S. (2012). Deficits in cognitive control, timing and reward sensitivity appear to be dissociable in ADHD. PLOS ONE, 7(12), e51416.
Diamond, A., Barnett, W. S., Thomas, J., & Munro, S. (2007). Preschool program improves cognitive control. Science, 318(5855), 1387-1388.
Disner, S. G., Beevers, C. G., Haigh, E. a. P., & Beck, A. T. (2011). Neural mechanisms of the cognitive model of depression. Nature Reviews Neuroscience, 12(8), 467-477.
Eriksen, B. A., & Eriksen, C. W. (1974). Effects of noise letters upon the identification of a target letter in a nonsearch task.Perception & Psychophysics, 16, 143-149.
Kruschke, J. K. (2010). Doing Bayesian data analysis: A tut-orial with R and BUGS (1st ed.). Bloomington : Academic Press, Inc.
Marin-Campos, R., Dalmau, J., Compte, A., & Linares, D. (2021). StimuliApp: Psychophysical tests on mobile devices. Behavior Research Methods, 53(3), 1301-1307.
Stieger, S., Lewetz, D., & Reips, U. (2018). Can smartphones be used to bring computer-based tasks from the lab to the field? A mobile experience-sampling method study about the pace of life. Behavior Research Methods, 50(6), 2267-2275.
Stoet, G. (2017). PsyToolkit: A novel web-based method for run-ning online questionnaires and reaction-time experiments. Teaching of Psychology, 44(1), 24-31.
Sun, X., Li, L., Ding, G., Wang, R., & Li, P. (2019). Effects of language proficiency on cognitive control: Evidence from resting-state functional connectivity. Neuropsychologia, 129, 263-275.
Waters, F., Allen, P. D., Aleman, A., Fernyhough, C., Woodward, T. S., Badcock, J. C., ... Larøi, F. (2012). Auditory hallucinations in schizophrenia and nonschizophrenia populations: A review and integrated model of cognitive mechanisms. Schizophrenia Bulletin, 38(4), 683-693.