王堂生 杨春亮 钟 年
记忆的前向测试效应对老年人学习新事物的作用*
王堂生1,3杨春亮2钟 年3
(1武汉理工大学马克思主义学院, 武汉 430070) (2北京师范大学发展心理研究院, 北京 100875) (3武汉大学哲学学院, 武汉 430072)
为检验前置测试是否可以有效地提升老年人学习新事物的能力, 参与实验的老年人被随机分为有前置测试的实验组和无前置测试的对照组, 在实验1中学习了5列单词, 在实验2中记忆了5列日用品, 在实验3中学习了4段讲座视频。结果表明, 实验组老年人对新事物的记忆成绩均高于对照组的老年人。结论认为, 前置测试能够显著提升老年人学习新事物的能力, 干扰降低与学习参与相结合的“加减”理论能更好地解释提升老年人记忆的前向测试效应。
前置测试, 前向测试效应, 老年人, 学习参与, 干扰降低
当前许多国家正迈入加速老龄化的社会, 60岁以上的人所占人口比例越来越大, 他们的现实状况非常值得关注, 对其认知能力的研究、评估和改善, 则对于国家在涉及该年龄群体的生活质量、社会制度和相应政策等多方面的重要决定具有重要参考价值。
在老年人认知的研究中, 记忆老化可能是至关重要的内容, 其中大部分研究发现是负面的, 如工作记忆资源有限(Whitebourne & Whitebourne, 2010), 老年痴呆风险增高(Hafkemeijer, vander Grond, & Rombouts, 2012), 以及情景记忆(Old & Naveh-Benjamin, 2008)、往事记忆(Piolino, Desgranges, Benali, & Eustache, 2002)、前瞻性记忆(Farrimond, Knight, & Titov, 2003)等方面均存在随着老化而能力下降的现象。
根据既往的研究, 尽管老化对记忆可能有诸多消极的影响, 但也有一些积极的发现, 老年人在语义(Wiggs, Weisberg, & Martin, 2006)、自我经历(Gluck & Bluck, 2007)等方面的记忆力极少下降, 而且并非每一个人在老化进程中都以同样的方式受到影响(Whitebourne & Whitebourne, 2010), 其中令人欣慰的发现是, 记忆训练能够有效改善老年人的认知功能(Craik & Rose, 2012)。
本研究旨在考察前向测试效应是否有助于改善老年人的记忆成绩, 从而为进一步改善老年人的学习和记忆能力奠定基础。
大量的研究表明, 与学习后重学或未做任何事情相比, 对已经学过的信息进行测试有助于编码和提取新信息, 这被称为前向测试效应(forward testing effect, Pastötter & Bäuml, 2014; Yang, Potts, & Shanks, 2018)。正如Yang等人(2018)所总结的那样, 对于不同类型的事物, 例如词汇(Szpunar, McDermott, & Roediger, 2008)、图片(Pastötter, Weber, & Bäuml, 2013)、外语翻译词汇配对(Yang, Potts, & Shanks, 2017)、面孔−姓名配对(Weinstein, McDermott, & Szpunar, 2011)、文本段落(Wissman, Rawson, & Pyc, 2011)、演讲视频(Szpunar, Khan, & Schacter, 2013)、油画绘画风格(Yang & Shanks, 2018), 以及其他学习材料而言, 前向测试效应是一种稳定而可靠的现象。前向测试效应并不仅存在于有教师指导下的学习状态, 并且可推及到自行规划的学习状态(Yang, Chew, Sun, & Shanks, 2019)。
Szpunar等人(2008)进行了一项经典的研究, 发现了对简单事物进行学习时的前向测试效应。他们指导两组被试(大学生)学习5列单词, 每组18个, 被试逐词逐列学习。实验组被试在学习完每一列单词之后都会分别进行临时测试(interim test recall)。控制组的被试则不参加第1至第4列单词的临时测试, 只参加第5个词表的临时测试。实验结果表明, 在第5列单词的临时测试中, 实验组能够准确记住的单词量是控制组的两倍, 这证明了学习简单事物时存在前向测试效应。此外, 在第5列词表的临时测试中, 由于前摄干扰效应(proactive inference, PI), 控制组出现的错误是实验组的十几倍(要求被试回忆第5列的单词时, 他们错误地回忆起了第1至第4列的单词)。关于学习简单事物的前向测试效应最近已有多篇文献发表(如:Nunes & Weinstein, 2012; Pastötter, Schicker, Niedernhuber, & Bäuml, 2011; Weinstein, Gilmore, Szpunar, & McDermott, 2014; Yang et al., 2017)。Szpunar等人(2008)提出干扰降低理论(Release from PI, 前摄干扰的释放理论, 简称干扰降低理论), 旨在解释简单事物学习的前向测试效应。根据该理论的解释, 分列回忆策略实际上改变了目标词汇的回忆背景, 有利于对不同词列进行分隔处理, 降低了前摄效应的干扰。实验组因为进行了临时测试, 该情景记忆使得新事物的记忆具有较少的背景事物, 这可以降低前摄干扰效应, 从而促进了对目标事物的回忆(如第5列中的单词)。
在上述简单事物的学习实验中, 相对于第5列的临时测试, 前4列的临时测试被称为前置测试(Interpolated testing), 它们不仅可以促进对新的简单事物的学习, 还有助于对演讲视频(Jing, Szpunar, & Schacter, 2016)、文章段落(Wissman et al., 2011)等类似的复杂事物的学习。Szpunar等人(2013)曾指导3组被试对4段演讲视频进行逐段学习。实验组被试在学完每一段视频后都进行了临时测试, 另外两组则只在学完最后一段视频后进行临时测试——前3段视频学完之后要么重学一遍(重学组), 要么演算数学题(演算组)。3组被试都可以做笔记, 同时要求他们报告在观看视频时他们的心智是否处于工作状态(on-task), 结果发现实验组对于测试后学习的视频内容记忆成绩非常好, 而演算组和重学组的记忆成绩显著低于实验组, 这证明了复杂事物的学习中存在前向测试效应。Szpunar等人(2013)还观察到实验组比其它小组做了更多的笔记, 而报告的心智游移(Mind Wandering, MW)也更少。对于复杂事物学习的前向测试效应被近期许多研究反复证明(Schacter & Szpunar, 2015; Szpunar, Jing, & Schacter, 2014)。
在简单事物的学习中, 干扰降低理论在很大程度上可以解释前向测试效应。然而, 这种理论难于解释对于复杂事物学习的前向测试效应, 因为对于复杂事物而言, 前摄干扰效应(PI)有限, 前向测试效应似乎不会发生(Wissman et al., 2011)。Szpunar等人(2013)的干扰降低理论认为, 复杂事物学习的前向测试效应是基于这样的事实——前置测试降低了与任务无关的心智游移(MW)。不过, Yang等人(2017)观察到, 在无临时测试时的学习过程中, 被试的学习动力(学习时间)不断下降, 如果插入了阶段性的临时测试, 他们的学习动力可以一直保持。Pastötter等人于2011年发现, 在学习过程中, 学习者对记忆任务的关注有所降低, 但是进行临时测试时这种降低又得以恢复。所有这些发现都支持学习参与(learning engagement, LE)理论, 即对复杂事物学习的前向测试效应是指在周而复始的学习过程中, 前置测试使学习参与的降低得到了回升, 这有助于新的复杂事物的学习。
总而言之, 人们对于不同类事物的学习都表现出稳定而可靠的前向测试效应。简单事物学习的前向测试效应可能是因为前置测试降低了记忆的前摄干扰(PI), 复杂事物的学习的前向测试效应则可能是因为前置测试增强了学习参与(LE)的动机。有一点很重要, 就是要注意两种机制(降低干扰和增强参与)并不相互排斥, 两种机制都可能对简单事物和复杂事物学习的前向测试效应具有促进作用。此外, 前置测试对学习过程中的心智游移(MW)现象也可能具有降低作用。
前向测试效应是否可以被推论到老年人?尽管老年人的记忆增强机制可能与年轻人存在差异, 但是有更多的理由预测前置测试可以作为一种有效的弥补策略有助于老年人学习和记忆新的信息。本研究假设:在即将开展的3个实验中, 无论是对简单事物的学习还是对复杂事物的学习, 前置测试均会显著提高老年人对新的材料的记忆成绩, 即:前置测试会促进老年人对新的学习材料的记忆成绩(假设1), 但其驱动机制并不局限于前摄干扰效应的释放和降低作用(假设2)。
已经有若干相关的研究支持肯定的假设, 前向测试效应在其中获得了稳定而可靠的证据。Pastötter等人(2013)已经证实前向测试效应可以推论到大脑创伤病人, Pastötter和Bäuml (2019)也将前向测试效应推论到中老年人对新的简单事物的学习中, 主要探索了前置测试通过降低中老年人记忆的前摄干扰而促进了新的简单事物(4至8个字母的德语名词)的学习, 不过对于涉及复杂事物学习的动机参与(LE)、心智游移(MW)等心理作用机制则没有进行探索。而与本文研究假设相反的推测是, 前向测试效应无法将这种结果推论到60岁以上的老年人群体中, 既包括对简单事物又包括对复杂事物的学习。在简单事物学习方面, Aslan和Bäuml (2015)就儿童对简单事物的学习的前向测试效应的研究似乎为这种相反的推测提供了证据。他们发现, 对于年轻人和大龄儿童来说, 临时测试基本上可以降低前摄干扰, 但是对于低龄儿童来说, 临时测试不能降低前摄干扰。Aslan和Bäuml (2015)认为, 低龄儿童学习简单事物时之所以没有前向测试效应可能是因为低龄儿童难以控制PI。与低龄儿童的情况相似, 老年人在抑制PI方面遭遇的困难大于年轻成人(Ikier & Hasher, 2006; Ikier, Yang, & Hasher, 2008)。因此, 有理由推断大龄儿童和年轻成人对于学习新事物的前向测试效应并不能直接推论到老年人。如果老年人在学习复杂事物时存在前向测试效应, 由于老年人在执行不同类型任务时出现的心智游移(MW)较少, 如阅读文章段落时(Krawietz, Tamplin, & Radcansky, 2012), 那么就将使干扰降低理论的解释面临困难, 而老人们对相关任务能够持续保持注意(SART; Jackson & Balota, 2012), 这又使得学习参与理论的解释面临挑战。当然, 这些相反的假设证据相对较少, 并且都是较为间接的推测。
本次实验是一次线上学习, 被试是通过富饶学术1注:Prolific Academic 参见网址https://www.prolific.ac/招募的, 实验者对被试设置了如下的条件限制:母语为英语, 年龄超过60岁, 国籍为英国, 当前居住地为英国。在富饶学术的44327个人中有127个人符合条件。
样本的大小是根据Yang等人(2017)实验4中的效应量(Cohen’s= 1.12)决定的, 样本量要求在每组的14个被试中观察到显著的前向测试效应(= 0.05; power = 0.80)。为了平衡实验材料, 最终每组被试的样本数确定为15个。共招募了30名老年人(17名为女性, 13名男性), 被随机分入两组, 一组为实验组, 一组为对照组), 每组15人。有3个被试报告曾经罹患过精神类的疾病(临床诊断), 实验组有1名抑郁症患者, 对照组有1名抑郁症患者和1名抑郁焦虑混合症患者。排除这3名被试的数据不影响整体结果的模式, 所以本文保留了他们的数据。此外还对被试其他的人口统计学数据(年龄、教育程度和健康状况)进行了调查。在实验最开始, 实验者明确地告诉被试不要做笔记以辅助他们的记忆。在实验最后, 所有的被试被要求报告是否做了笔记以辅助他们的记忆。所有的被试都报告没有记笔记。
主要的刺激事物是5列18个单词的字符串, 是从Yang等人(2017)的实验4中获取的。按照拉丁方设计的方法确定呈现给被试的单词的顺序。
被试被告知他们要逐一学习5列单词, 他们的任务是尽可能多地记住这些单词, 最终会有一个总的测试。此外他们还被告知, 每一列单词学习完之后, 需要做1分钟的数学题, 之后计算机会随机决定是否让他们回忆(即测试)刚刚学习的那列单词, 不然的话就要再花一分钟的时间做数学演算题。实际上, 临时测试是提前决定好了的。实验组每列测试做完就会做一个临时测试(interim test recall, 即当列测试), 而对照组则在前4列单词学习之后都做数学题, 只有第五列单词学习之后才做一个当列测试。实验流程图见图1。
在每列单词呈现时, 单词是一个一个呈现在屏幕中央的, 一个单词呈现2秒钟供被试记忆, 单词与单词之间间隔500 ms。每列单词学完之后, 两组被试都要做一分钟的数学题(例如45 + 62 = ?)。在临时测试时, 被试回忆当列单词的时间不做限制。5列全部学习完毕后, 两组都做一个最终的总体测试(final test recall), 他们被要求对5列所有的单词尽可能多地进行回忆。所有的测试没有时间限制, 也没有对错反馈。
被试在年龄、教育程度和健康等人口学变量的均值和标准差见表1。统计结果显示, 两组之间的年龄、教育、健康水平等方面无显著差异(s > 0.05)。
图1 前向测试效应的实验流程
注:实验组(又称测试组)的每一列事物学习之后即进行当列测试, 对照组(又称演算组或重学组)在前几列事物学习之后进行演算或者重新学习等其他任务。实验组和对照组最后一列学完后均进行当列测试, 然后进行总体测试。
图2 A: 临时测试在5列中的回忆成绩B: 5列临时测试中的前摄干扰 C: 最终测试中回忆起的每列的单词量(实验1)
注:误差条代表± 1个标准误
表1 实验1实验组和对照组被试在控制变量上的组间差异
图2A展示了两组被试临时测试的回忆成绩数目。对实验组组内重复测量的方差分析揭示出, 在临时测试中对单词的正确回忆量随着列数的增加而显著减少,(1, 14) = 3.80,= 0.07, ηp² = 0.21, 说明插入的临时测试没能完全阻止老年人随着学习列数的增加而对新的事物的回忆减少的趋势。最关键的是两组之间第5列当列测试的成绩差异。实验组(= 5.87,= 1.21)在第5列大约回忆出了两倍于对照组(= 3.20,= 2.01)的单词数目, 平均相差2.67个单词, 95% CI为[1.02, 4.32],(28) = 3.31,= 0.003, Cohen’s= 1.21, 表明前置测试促进了老年人对新的事物的学习。
图2B展示了临时测试的前摄干扰效应(interim test PI, 例如, 当要求回忆某列单词时, 被试错误地回忆起了之前某列的单词)。对实验组第2~5列的组内方差分析显示, 前摄干扰效应随着列数变多而加重,(1, 14) = 8.15,= 0.01, ηp² = 0.37, 表明前置测试不能完全防止前摄干扰效应对老年人的影响。特别值得注意的是, 对照组(= 3.40,= 1.59)出现了大约3倍于实验组(= 1.20,= 1.21)的前摄干扰效应, 相差大约2.2个错误的单词, 95% CI为[1.14, 3.20],(28) = 4.26,< 0.001, Cohen’s= 1.56, 表明前置测试部分地阻止了前摄效应对老年人的干扰。
图2C展示了最终的回忆量。在最终的测试中, 实验组的成绩(= 19.73,= 7.24)显著地超过了对照组(= 13.00,= 6.95), 平均相差6.73个单词, 95% CI为[1.43, 12.04],(28) = 2.60,= 0.015, Cohen’s= 0.95.
尽管临时测试不能完全阻止老年人学习新的事物时随着数量的增多而记忆成绩逐下降的趋势, 但是临时测试中的前置测试显著地增强了老年人学习和记忆新事物的效果, 这表明学习新事物的前向测试效应同样适用于老年人。与前人有关年轻被试的实验结果不同的是, 临时测试不能完全消除前摄干扰效应对老年人的影响, 尽管它们非常可观地阻止了前摄干扰效应对老年人记忆的损害。
本实验在实验1研究设计的基础上进行了3个扩展。第一, 实验1显示, 相对于在列与列的学习之间插入演算, 插入临时测试促进了老年人学习新事物的能力。实验2则在对照组的前4列学习之后插入重学而非演算, 第5列与实验组同样是临时测试。第二, 在实验2中, 我们对被试的基本认知能力进行了测试, 以便确定在第5列临时测试时, 实验组获得更好的回忆成绩是基于前4次的临时测试而非其他因素。第三, 为了将前向测试效应实验的记忆任务更接近日常情境, 学习材料分别尝试了面孔−姓氏配对, 面孔−城市名配对, 结果在预实验时都出现了地板效应, 于是采用超市购物的事物, 预实验表明不存在地板和天花板效应。
通过实验者熟悉的老人招募社区的老年被试, 主要在武汉的两个居民小区内进行招募。样本量的大小取决于实验1的效应量(Cohen’s= 1.21), 要观测到前向测试效应的显著水平(= 0.05; power =0.80)至少需要每组12个样本。为了平衡所学习的事物出现的顺序, 我们每个组配置了15个被试。33个60岁以上的老年人参与了本实验, 有一个老年人在实验期间放弃了实验, 最终获得了32位被试全部的实验数据, 其中有24位是女性。他们被随机分配入两组, 实验组16名, 对照组16名。有一个被试报告曾经罹患过抑郁症(经过临床诊断), 加入或排除她的数据不会改变整体结果的模式。所有的被试母语为中文, 他们逐一在安静的环境下进行测试, 并且每个完成实验的老年人获得了50元人民币的报酬。
从百度文库2参见https://wenku.baidu.com/view/9ef45d97915f804d2b16c1f0.html中选取了50个常见超市商品的图片(例如苹果、牙刷、香波)作为主要的刺激项。这些项目被随机分配为5组, 每组10个。每项图片下面用2~3个汉字指明商品的名称。采用拉丁方设计的方法平衡了实验材料对被试呈现的顺序。
在实验之初, 所有的被试报告了他们的年龄、性别和受教育年限。然后他们被要求报告是否罹患过精神疾病, 如果是, 还要报告精神疾病的种类。他们还被要求从1(完全不好)到5(非常好)分级评价一下他们自己的健康状况。
随后, 实验者要求被试想像一下他们正准备去超市购物, 随后会给他们提供5个购物清单, 希望他们尽可能多地记住。其他的实验指导和程序与实验1一样。不同的是, 本实验的对照组为重学组, 在学习第1列到第4列的物品清单时, 每学完一列, 做1分钟的数学题, 然后重学一遍(实验组为测试组, 每学完一列, 做1分钟的数学题后进行当列测试)。每个物品逐一呈现, 每次呈现2秒。在完成最终测试之后, 所有的被试都要进行一个词汇认知能力的测试, 并且通过数字广度任务测试其工作记忆能力(working memory capacities, WMC), 以及通过认知加工任务测试其认知加工速度。
词汇任务
词汇任务来自于韦克斯勒成人智力量表(WALS; Wechsler, 1981), 在其汉化版本(龚耀先, 1992)里总共选取了20个二字词组成词汇表。实验者按照随机的顺序读出某个词汇, 要求被试在词汇表中找出该词并解释其意义。找不到该词, 得0分; 如果成功找到该词, 得1分; 能够正确地解释词义, 再得1分。满分40分。
数字广度任务
WMC通过数字广度来进行测试(GrÉGoire & van der Linden, 1997)。
认知加工速度任务
认知加工速度任务中, 被试被要求尽可能快而准确地判断两串数字是否完全一样(王大华, 申继亮, 彭华茂, 唐丹, 张凌, 2005)。在每一次判断任务中, 屏幕上会出现两串数字, 每串数字由9个数字组成。如果9个数字完全相同, 则要求被试选择“一致”按键, 如果有1个数字不同, 则选择“不一致”按键。总共有18次任务判断。
被试人口学变量和基本认知能力等控制变量的均值和标准差见表2。统计结果显示, 两组之间的年龄、教育、健康水平、词汇能力、工作记忆、加工精度和速度等方面均没有显著的差异(s > 0.05)。
表2 实验2实验组和对照组被试在控制变量上的组间差异
图3 A: 临时测试在5列中的回忆成绩 B: 5列临时测试中的前摄干扰 C: 最终测试中回忆起的每列的物品量(实验2)
注:误差条代表 ± 1个标准误
图3A展示了实验组的回忆成绩。对实验组组内重复测量的方差分析揭示出临时测试的正确回忆量随着列数的增加而显著减少,(1, 14) = 17.87,= 0.001, ηp² = 0.56。实验组的被试在第5列的当列测试中(= 5.13,= 1.41)回忆出了两倍于对照组(= 2.38,= 1.63)所回忆出来的物品量, 平均相差2.76个物品, 95% CI为[1.64, 3.88],(29) = 5.03,< 0.001, Cohen’s= 1.80。
图3B展示了临时测试的前摄干扰抑制效应。对实验组第2~5列的组内方差分析显示, 前摄干扰效应随着列数变多而加重,(1, 14) = 20.70,< 0.001, ηp² = 0.60. 在第5列的临时测试中, 对照组(= 3.06,= 2.11)也出现了大约3倍于实验组(= 0.93,= 0.96)的前摄干扰效应, 相差大约2.13个物品, 95%CI为[0.91, 3.35],(29) = 3.57,= 0.001, Cohen’s= 1.30。
图3C展示了最终的回忆量。在最终的测试中, 实验组的成绩(= 21.80,= 4.86)显著地超过了对照组(= 16.13,= 5.26), 平均相差5.68个物品, 95% CI为[1.95, 9.45],(29) = 3.11,= 0.004, Cohen’s= 1.12。
针对日常情境中的物品记忆而言, 前置测验同样显著地增强了老年人学习和记忆新的事物的效果, 比多学一遍的效果还要好。这又一次证明记忆的前向测试效应对老年人学习新事物有着重要的促进作用。当然, 随着所要记忆的内容的增多, 老年人的回忆成绩随着列数增多而显著下降, 实验组插入的临时测试虽然部分阻止了前摄干扰的作用, 但是无法阻止记忆效果逐列下降的总体趋势。
实验1和2表明, 前置测试能够提高老年人对新的简单事物的记忆, 所以说老年人对简单事物的学习中存在前向测试效应。在实验3中, 我们将检验前向测试效应是否可以推及到老年人对复杂事物的学习, 从而验证老年人对复杂事物的学习是否会存在前向测试效应。
被试主要来自于江汉油田老年大学, 此外还在湖南湘潭市某社区进行了招募。共有52位老年人(年龄为60岁及以上)自愿报名参加。其中3人因未在24小时之内返回参加基础认知能力测试而放弃, 余下的49人(38名男性)参加测试。他们被随意分为2个小组, 25人组成实验组, 24人组成对照组。所有的人均未参加实验2。他们同样被测试了人口统计数据和基础认知能力。所有被试的第一语言为汉语, 分别在一隔音房间受试, 测试完后每人获得50元人民币(或等值物品)的补贴。
基本的刺激物为采集自NetEase公开课网站(http://open.163.com/movie/2015/2/s/8/MAH8PH40M MAKPPCAS8.html)关于医患沟通心理学的演讲视频。该演讲被分为4个段落, 每段时长4分钟。为简单起见, 每一段由15个短句构成。每一个句子含一个重点单词作为测试知识点。
样本的大小是根据Szpunar等人(2013)实验2中的效应量(Cohen’s= 1.06)决定的, 样本量要求在每组的24个被试中观察到显著的前向测试效应(= 0.05; power = 0.95)。在实验的初始阶段, 被试报告了人口统计信息。然后, 指导他们学习4段演讲视频。告知他们第4段视频后要对所有4段视频进行最后测试, 而且计算机会自行决定在学习完每一段后是否要给他们进行一段测试并做30秒的数学演算题。如果是, 他们要就刚学习的视频段做填空测试; 如果不是, 他们要重新学习该视频段。事实上, 实验组在学习每一段后都会进行临时试验, 而对照组对1~3段进行了重新学习, 只对第4段进行临时测试。在临时测试时, 对刚才学习的段落的文字陈述出现在屏幕上, 共包含15个句子, 每一句留一空格(如:在医疗纠纷中, 医生认为他们应首先____自己)。要求被试在相应的空格中填写自己的答案。对每一个问题的回答没有限定时间, 如果不知道正确答案, 允许不填空格。每次临时测试之后, 被试都会收到正确的反馈, 并重新显示题目(在医疗纠纷中, 医生认为他们应首先应自己)。正确答案用红色标示, 并用下划线标注, 被试有60秒的时间学习正确反馈, 逐段学习1~3段视频, 并用30秒演算一些数学题。对照组则再次学习刚刚学过的视频, 该段视频的文字陈述(含相同的15个句子)还要特别为他们显示150秒, 15个重要目标句子用红色标示, 并标注下划线, 提示被试哪些单词会在最后测试时测试。对照组对第4段视频进行了与实验组相同的测试、反馈查看和数学演算。
完成第4段测试后, 两组都进行了最后的测试, 要求被试回答20道填空题, 1~4段视频中各选5题。所有题目都显示于同一屏幕。我们只选择了20题, 而非全部60题, 因为在预研究时一些被试告诉实验员他们希望缩短实验时间。被试基本上都在24小时内返回并完成了认知能力的试验, 这与实验2的被试相同。
被试人口学变量和基本认知能力等控制变量的均值和标准差见表3。统计结果显示, 两组之间的年龄、教育、健康水平、词汇能力、工作记忆、加工精度和速度等方面没有明显的差别(s > 0.05)。两位对实验目的并不了解的实验助理对被试的记忆测试进行了评分。一位实验助理对被试所有的记忆测试进行评分, 另一位实验助理只对第4段视频的临时测试进行评分。他们的评分(两位助理对所有被试第4段视频的临时测试的评分)高度一致:他们评分的95.9%是相同的。两位助理评分有差异的项目由实验者再次评分。
表3 实验3实验组和对照组被试在控制变量上的组间差异
对于1~3段视频的测试, 实验组的回忆率分别为9.00 (= 2.42), 9.08 (= 3.09), 7.76 (= 2.52)。两组被试对第4段视频临时测试的成绩意义重大(参见图4A)。在第4段视频的临时测试中, 实验组(= 6.32;= 3.11)的回忆率达到对照组 (= 3.50;= 2.17)的两倍, 平均相差2.82个项目, 95% CI为 [1.28, 4.36],(47)= 3.68,= 0.001, Cohen’s= 1.05, 由此可见前置测试可显著提高老年人对新的复杂事物的学习。如图4B所示, 在最后总的测试中, 实验组的成绩(= 15.84;= 2.29)也优于对照组(= 12.21;= 3.87), 其差别为3.633个项目, 95% CI为 [1.81, 5.45],(47) = 4.02,< 0.001, Cohen’s= 1.14。
图4 A:第4段视频临时测试成绩. B: 最终测试成绩(实验3)
注:误差条代表 ± 1 个标准误.
该实验结果表明, 关于复杂事物学习的前向测试效应也可以推及到老年人。由于复杂事物的学习不可能像简单事物的学习那样存在前摄干扰项目, 所以实验3只比较了临时测试成绩和最终总测试成绩的差异。此外, 耐人寻味的是, 实验组第二段视频的临时测试成绩并不比第一段临时测试的成绩差, 不过自第二段视频的学习之后, 其后临时测试的正确率呈现出明显的不断下降的趋势, 这与前两个实验是一致的。这说明老人的记忆负荷在实验设置中应当得到充分的考虑, 且需要得到相应的理论解释。
总而言之, 无论是简单事物还是复杂事物, 学习新事物的前向测试效应都可推及到老年人。产生这种结果的原因可能是前置测试引发了不同的心理作用机制, 对于学习新的简单事物而言, 可能主要是由于前置测试避免了前摄干扰(PI)的建立, 对于学习新的复杂事物而言, 可能主要是由于前置测试在学习过程中缓解了学习参与的下降趋势, 最终共同导致了老年人学习新事物过程中前向测试效应的出现。
具体而言, 本研究实验1证明了在老年人学习简单材料的过程中进行临时测试, 能有效降低前摄记忆项目的干扰作用——降低了大约3倍的前摄干扰效应。为了证明对于前摄干扰效应的抑制不是由于临时测试的重复学习而带来的记忆效果, 实验2的对照组老年人在每一列记忆项目之后都进行了重复学习, 结果证明前置测试对老年人记忆新物品仍然更具有促进作用, 实验组(即测试组)保持了相对于对照组抑制3倍前摄干扰效应的效果。
虽然近些年来前向测试效应被广泛印证, 但此前的研究大多局限于大学生(Yang et al., 2018; Chan,Meissner, & Davis, 2018), 前向测试效应是否可以推及60岁以上的老年人这一问题, 在本研究展开时, 没有任何针对这一特定年龄群体的报告见诸文献。本研究的主要目的是:验证是否可以利用前置测试作为弥补策略来提高老年人(60岁以上)对新的信息的学习。如前文所述, 对简单事物和复杂事物学习的前向测试效应可能通过两种机制来驱动:干扰降低和学习参与。实验1和实验2对老年人学习简单事物的前向测试效应的干扰降低机制进行了检验, 发现干扰降低理论只能部分解释老年人学习新的简单事物的前向测试效应:本研究实验1和实验2的实验组记忆成绩显示, 老年人即便是进行了前置测试, 也无法阻止记忆成绩逐渐显著下降的趋势。而Szpunar等人(2008, 实验4)的研究显示, 只要是插入了临时测试, 前期的学习材料就不会对后期记忆的成绩有任何影响——每一列的正确回忆数量保持高度一致, 并且前摄干扰基本上不存在。这意味着对于实验1和实验2对照组中的老年被试而言, 其学习和记忆新事物出现成绩逐步下降的结果, 其原因肯定不仅仅是前摄干扰, 所以有理由推测, 干扰降低理论无法完全解释老年人学习新事物时的前测促进作用。为了验证这一点, 实验3将前向测试效应这一效果推及到老年人对复杂材料(演讲视频)的学习过程中, 在这种被普遍认为前摄干扰有限、主要只存在实验组和对照组在记忆效果上的差别的情况下, 实验组的回忆率几乎达到对照组的2倍, 这就进一步证实了还需要用其他的理论而非仅仅用干扰降低理论对老年人记忆前向测试效应进行有效解释。
本研究3个实验的前向测试效应不能完全用干扰降低理论来解释, 这很可能与被试的年龄因素有关。根据Aslan和Bäuml (2015)的发现, 学习的前向测试效应无法推及到低龄儿童, 原因在于对低龄儿童而言, 无论有没有临时测试, 都无法降低被试学习和记忆新的事物的前摄干扰。虽然老年人与低龄儿童有所不同——前向测试效应也可以促进老年人对新事物的学习, 但即便是插入了临时测试, 也无法阻止老人学习新事物时回忆成绩逐渐下降的趋势。很显然, 干扰降低理论无法解释所有年龄阶段的学习者的前向测试效应, 尤其是低龄儿童和老年人。
前人的研究普遍认为, 对于复杂事物的学习而言, 前摄干扰不会发生(Wissman et al., 2011), 所以关于学习复杂事物的前向测试效应的另一种解释是:前置测试可降低与任务无关的心智游移(MW, Szpunar et al., 2013)。有研究表明在老年人身上出现的MW比年轻人要少(Krawietz et al., 2012), 年龄的增长与MW的降低具有正相关(Seli, Maillet, Smilek, Oakman, & Schacter, 2017)。本研究结果表明前置测试可以显著改善老年人对复杂事物的学习效果, 所以就很难将复杂事物学习的前向测试效应仅仅归因于MW的下降。
此外, 虽然有些研究发现老年人关于MW情节的报告的频率要低于年轻人, 但是对于老年人而言, 某些MW行为指数更高(Zavagnin, Borella, & de Beni, 2014)。根据Jordano和Touron (2017)的研究, 老年人受到任务相关MW的影响要高于年轻人, 他们发现老年人比年轻人更容易受到动机的影响, 还发现其动机强度与无意MW呈负相关。由此可见, 前置测试的促进作用很可能与老年人学习复杂事物的动机密切相关, 即老人学习动机越强, 则无意MW越低, 同时任务相关MW会越高, 本研究中的前置测试可能抑制了无意MW, 但更有可能是抑制了任务相关MW。根据Yang等人(2019)的研究, 在学习过程中前置测试能够改善被试的学习参与状况, 有利于参与程度的加强, 本研究中老年人参与3个实验的记忆数据有力地支持了学习参与(LE)理论对前向测试效应的解释。
学习参与理论能够解释前向测试效应的诸多现象。第一, 前置测试可以促使人们比控制组的人花更多的时间去对新信息进行编码(Yang et al., 2017)。第二, Pastötter等人(2011)发现:对于控制组的脑电波而言, 在几个词列的学习过程中α波有明显的加强, 而对于实验组则没有这种加强, 这说明临时测试改变了所学事物的背景(目标搜索的范围), 这就重置了对随后要学习的事物的记忆编码, 使其编码的效率与前面的词列一样。第三, 临时测试至少在短期内可以促进学习和改善记忆, 甚至单元与单元之间事物的种类发生了改变时也有这种促进作用(Yang et al., 2019), 这就使得动机层面的解释更有说服力。
当然, 学习参与理论对前向测试效应心理机制的解释还正在发展过程中。Weinstein等人(2014)提出:临时测试可以使被试产生对实验过程的预期, 从而增强人们对新信息编码和提取的动机。Cho, Neely, Croco和Vitrano (2017)提出:前置的临时测试中编码和提取的失误使人们产生不满意感, 这促使被试在后续临时测试中对编码和提取付出更多的努力。
综上所述, 本研究结论认为, 只有将干扰降低理论和学习参与理论结合起来, 综合考虑被试记忆能力的特点, 才能更为有效地解释老年人学习和记忆过程中的前向测试效应, 本文将之称为前向测试效应的“加减”理论。
首先, 结合引言所述老年人记忆能力的特点和干扰降低理论, 实验组老年被试对新材料的记忆成绩(实验1)较好, 可能是因为前置测试的情景记忆减少了回忆新事物的背景项, 所以前摄干扰的降低部分促进了老年人学习新事物的前向测试效应, 但是由于老年人的情景记忆普遍有所下降, 所以即便是插入临时测试, 也无法完全阻止老年人学习新事物时回忆成绩逐列下降的总体趋势。也就是说, 老年人情景记忆能力的普遍“减”退和对学习新事物的干扰项的“减”消共同影响着实验1老人最终的记忆成绩。
其次, 虽然老年人的前瞻性记忆有所下降, 但是前置测试可能简化了他们对目标事物进行编码和提取的背景, 前瞻性记忆的负荷降低, 增强了他们学习参与的信心和动机, 最终改善了他们日常生活中的前瞻性记忆(实验2)。但是由于老年人前瞻性记忆的能力普遍有所下降, 所以即便是插入临时测试, 也无法完全阻止老年人记忆新事物时回忆成绩逐列下降的总体趋势。也就是说, 老年人前瞻性记忆能力的普遍“减”退、记忆背景项的“减”少和学习参与动机的增“加”共同影响着实验2老人最终的记忆成绩。
最后, 只有将干扰降低理论和学习参与理论结合起来, 才能充分解释老年人学习复杂材料过程中的前向测试效应(实验3)。按照干扰降低理论, 学习复杂材料的前向测试效应是因为心智游移的降低, 但是如前所述, 老年人与任务无关的心智游移较少而与任务相关的心智游移较多, 这使得干扰降低理论的解释遇到了困境。不过, 根据Jordano和Touron (2017)的研究发现, 与任务相关的心智游移的触发因素为与年龄相关的刻板印象, 这些有关老化的消极刻板印象使老年人将注意力集中于有关自我评价威胁的学习环境。在实验3中, 一方面临时测试的“随机性”降低了老年人面临自我评价的威胁, 从而降低了与任务相关的心智游移, 另一方面前置测试又激发了他们的学习参与性, 因而测试成绩要比仅仅伴随着与任务相关的心智游移的状态时更好。也就是说, 前置测试一方面促进了老年人在记忆过程中的学习参与, 另一方面抑制了对新事物学习具有干扰作用的心智游移, 从而共同提高了对新的复杂事物的记忆成绩。
根据本文提出的“加减”理论可以推测, 文化因素、老年刻板印象的启动等因素都会影响到临时测试对老年人学习新事物的效果。Levy和Langer (1994)的研究发现, 对老年人消极的刻板印象影响着老年人的记忆成绩。由于中国文化中有关老化的消极刻板印象较少, 所以记忆成绩比美国的老年人要好。本研究限于篇幅, 虽然实验被试包括了不同文化下的老年人, 但是没有深入探讨文化和自我评价的因素(老年刻板印象)对前向测试效应的影响, 这将会在以后的研究中进一步展开。
本研究对于老年人学习和记忆的前向测试效应的研究推进, 有望用来改善老年人因年龄增长而产生的记忆下降问题。有研究者(Kielar, Shah-Basak, Deschamps, Jokel, & Meltzer, 2019)发现原发性进行性失语症患者失去了说话或理解语言的能力, 是因为大脑的某些区域出现了功能缺陷, 而这些区域在核磁共振(MRI)影像学上尚未显示出结构损伤, 所以推断可能是大脑功能性的缺陷而非结构性的障碍导致了老年痴呆症状。也就是说, 老年痴呆患者根源在于日常生活中功能发挥的失常而非大脑结构性病变, 本研究给该问题带来了新的解决途径:将阶段性回溯的学习模式作为老年人的记忆训练策略, 弥补他们的认知功能劣势, 从而有望延缓乃至预防老年痴呆症的发生和发展。
致谢:感谢在本文研究中积极参与的所有老人和实验助理, 包括但不限于王艳、杨帆、成方琪、刘宇晋、刘重阳等人。感谢评审专家对本文写作提出的每一个意见和建议, 他们的悉心指导使得本文的质量得到极大的提升。
Aslan, A., & Bäuml, K.-H. T. (2015). Testing enhances subsequent learning in older but not in younger elementary school children.(6), 992–998.
Chan, J., Meissner, C. A., & Davis, S. D. (2018). Retrieval potentiates new learning: A theoretical and meta-analytic review.(11), 1111–1146.
Cho, K. W., Neely, J. H., Crocco, S., & Vitrano, D. (2017). Testing enhances both encoding and retrieval for both tested and untested items.(7), 1211–1235.
Craik, F. I. M., & Rose, N. S. (2012). Memory encoding and aging: A neurocognitive perspective.(7), 1729–1739.
Farrimond, S. J., Knight, R. G., & Titov, N. (2003). Prospectiveremembering and aging.(7), 769–769.
Gluck, J., & Bluck, S. (2007). Looking back across the life span: A life story account of the reminiscence bump.(8), 1928–1939.
Gong, Y. X. (1992).Hunan Map Press.
[龚耀先 (1992).. 湖南地图出版社]
GrÉGoire, J., & van der Linden, M. (1997). Effect of age on forward and backward digit spans.(2), 140–149.
Hafkemeijer, A., van der Grond, J., & Rombouts, S. A. R. B. (2012). Imaging the default mode network in aging and dementia.(3), 431–441.
Ikier, S., & Hasher, L. (2006). Age differences in implicit interference.(5), 278–284.
Ikier, S., Yang, L. X., & Hasher, L. (2008). Implicit proactive interference, age, and automatic versus controlled retrieval strategies.(5), 456–461.
Jackson, J. D., & Balota, D. A. (2012). Mind-wandering in younger and older adults: Converging evidence from the sustained attention to response task and reading for comprehension.(1), 106–119.
Jing, H. G., Szpunar, K. K., & Schacter, D. L. (2016). Interpolatedtesting influences focused attention and improves integration of information during a video-recorded lecture.(3), 305–318.
Jordano, M., L., & Touron, D. R. (2017). Stereotype threat as a trigger of mind-wandering in older adults.(3), 307–313.
Kielar, A., Shah-Basak, P. P., Deschamps, T., Jokel, R., & Meltzer, J. A. (2019). Slowing is slowing: Delayed neural responses to words are linked to abnormally slow resting state activity in primary progressive aphasia.(6), 331–347.
Krawietz, S. A., Tamplin, A. K., & Radvansky, G. A. (2012). Aging and mind wandering during text comprehension.(4), 951–958.
Levy, B., & Langer, E. (1994). Aging free from negative stereotypes: Successful memory in china among the american deaf.(6), 989–997.
Nunes, L. D., & Weinstein, Y. (2012). Testing improves true recall and protects against the build-up of proactive interference without increasing false recall.(2), 138–154.
Old, S. R., & Naveh-Benjamin, M. (2008). Differential effects of age on item and associative measures of memory: A meta-analysis.(1), 104–118.
Pastötter, B., & Bäuml, K.-H. T. (2014). Retrieval practice enhances new learning: The forward effect of testing.(4), 1–5.
Pastötter, B., & Bäuml, K.-H. T. (2019). Testing enhances subsequent learning in older adults.(2), 242–250.
Pastötter, B., Schicker, S., Niedernhuber, J., & Bäuml, K.-H. T. (2011). Retrieval during learning facilitates subsequent memory encoding.(2), 287–297.
Pastötter, B., Weber, J., & Bäuml, K.-H. T. (2013). Using testing to improve learning after severe traumatic brain injury.(2), 280–285.
Piolino, P., Desgranges, B., Benali, K., & Eustache, F. (2002). Episodic and semantic remote autobiographical memory in ageing.(4), 239–257.
Schacter, D. L., & Szpunar, K. K. (2015). Enhancing attention and memory during video-recorded lectures.(1), 60–71.
Seli, P., Maillet, D., Smilek, D., Oakman, J. M., & Schacter, D. L. (2017). Cognitive aging and the distinction between intentional and unintentional mind wandering.(4), 315–324.
Szpunar, K. K., Jing, H. G., & Schacter, D. L. (2014). Overcoming overconfidence in learning from video-recorded lectures: Implications of interpolated testing for online education.(3), 161–164.
Szpunar, K. K., Khan, N. Y., & Schacter, D. L. (2013). Interpolated memory tests reduce mind wandering and improve learning of online lectures.(16), 6313–6317.
Szpunar, K. K., McDermott, K. B., & Roediger, H. L. (2008). Testing during study insulates against the buildup of proactive interference.(6), 1392–1399.
Wang, D. H., Shen, J. L., Peng, H. M., Tang, D., & Zhang, L. The model of educational effect on old adult's cognition.(4), 511–516.
[王大华, 申继亮, 彭华茂, 唐丹, 张凌. (2005). 教育水平对老年人认知能力的影响模式.(4), 511–516]
Wechsler, D. (1981).Oxford, England: Psychological Corp.
Weinstein, Y., Gilmore, A. W., Szpunar, K. K., & McDermott, K. B. (2014). The role of test expectancy in the build-up of proactive interference in long-term memory.(4), 1039–1048.
Weinstein, Y., McDermott, K. B., & Szpunar, K. K. (2011). Testing protects against proactive interference in face-name learning.(3), 518–523.
Whitebourne, S. K., & Whitebourne, S. B. (2010).. USA: John Willey & Sons.
Wiggs, C. L., Weisberg, J., & Martin, A. (2006). Repetition priming across the adult lifespan – The long and short of it.(3-4), 308–325.
Wissman, K. T., Rawson, K. A., & Pyc, M. A. (2011). The interim test effect: Testing prior material can facilitate the learning of new material.(6), 1140–1147.
Yang, C. L., Chew, S. J., Sun, B. K., & Shanks, D. R. (2019). The forward effects of testing transfer to different domains of learning.(5), 809–826.
Yang, C. L., Potts, R., & Shanks, D. R. (2017). The forward testing effect on self-regulated study time allocation and metamemory monitoring.(3), 263–277.
Yang, C. L., Potts, R., & Shanks, D. R. (2018). Enhancing learning and retrieval of new information: A review of the forward testing effect.(8), 1–9.
Yang, C. L., & Shanks, D. R. (2018). The forward testing effect: Interim testing enhances inductive learning.,(3), 485–492.
Zavagnin, M., Borella, E., & de Beni, R. (2014). When the mind wanders: Age-related differences between young and older adults.54–64.
Forward testing effect on new learning in older adults
WANG Tangsheng1,3, YANG Chunliang2, ZHONG Nian3
(1School of Marxism, Wuhan University of Technology, Wuhan 430070, China) (2Institute of Developmental Psychology, Beijing Normal University, Beijing 100875, China) (3School of Philosophy, Wuhan University, Wuhan 430072, China)
As the population of a society ages and evolves, the cognitive capacity and life-long learning ability of older adults is extremely significant. The current study aims to investigate whether interpolated testing can effectively improve the abilities of older adults to learn and retain new information. In other words, this study targets to verify whether the forward testing effect (FTE) can be applied to older adults comparing to the younger participants in previous research. Previous research on younger adults and older children (rather than younger elementary school children) indicates that the FTE in learning of single items is primarily due to the release from proactive interference (PI). Research on younger elementary school children indicates that they cannot reduce PI; thus, they do not have FTE in their early years as they are just learning. However, this finding cannot explain why people have the FTE during complex learning, which is also attributed to the reduction of mind-wandering (MW). Other research demonstrates that learning engagement plays a role to make a great difference between PI and MW amongst older and younger adults. Will older adults (aged over 60) experience FTE when learning simplified things? How about complex materials?
The current study conducted three experiments to research the above questions progressively. All participants (older adults) were randomly divided into two groups using a computer. The tested group was then given interim tests, and the other (control) group went without any test until the last list or segment. Finally, both groups took a memory test on the things they have encountered through the learning process. The size of these groups was determined according to the effect size in previous studies. The number of participants in each experiment was 30, 32 and 49. In experiment 1, both groups were given five lists of words. The test group was given an interim test after studying each of the five lists, whereas the control group was required to solve the math problem after studying each list, where they only took an interim test on list 5. In experiment 2, the participants had five lists of common supermarket items to learn. The test group was also given an interim test after studying each of the five lists. However, the control group only had to restudy lists 1–4, and then, they were given an interim test after studying the fifth list. In experiment 3, the participants were instructed to study a four-segment lecture video where the instructions and experimental procedures were the same as those in experiment 2. All the participants in the three experimentsmentioned above were over 60 years of age.
The result of experiment 1 shows that the test group recalled approximately twice as many correct words as the math group in the list 5 interim test. The result indicates that interpolated tests facilitate older adults’ learning of new single items. For the test group, the repeated measures ANOVA, with lists 2–5 as the within-subjects variable, showed that PI linearly increased across lists. This finding indicates that interim tests could not completely prevent the build-up of PI across lists for older adults. Notably, the math group experienced approximately three times as much PI as the test group in the list 5 interim test. The result indicates that interim tests prevent the build-up of PI for older adults. In Experiment 2, the test group recalled approximately twice as many correct words as the restudy group in the list 5 interim test. The repeated measures ANOVA showed that, for the test group, PI linearly increased across lists 2–5 interim tests. The restudy group committed approximately three times as much PI as the test group in the list 5 interim test. The result of Experiment 3 shows that the test group recalled approximately twice as many correct items as the restudy group in the Segment 4’s interim test. This finding reveals that interpolated testing enhances the learning ability of older adults for new complex materials.
The results show that interpolated testing effectively enhances older adults’ learning and retrieval of new information. The test groups scored higher than the math and restudy groups in learning of single items and complex materials. The results support an integrated theory of interference reduction and learning engagement, which can comprehensively explain the FTE difference amongst younger children, older children, younger adults and older adults. Therefore, we can use FTE as a effective method to modify the learning and memorising condition of older adults.
interpolated testing, forward testing effect, older adults, learning engagement, interference reduction
2019-08-16
* 中央高校基本科研业务费专项资金资助(项目批准号: 2020VI022; 2019NTSS28)。
杨春亮, E-mail: chunliang.yang@bnu.edu.cn
B842; B844