董旻晔 ,贾芷莹 ,董圣洁 ,施贞夙, ,李国红
1. 上海交通大学公共卫生学院,上海200025;2. 上海交通大学中国医院发展研究院卫生技术评估研究所,上海200025;3. 上海唯晶信息科技有限公司,上海 200025
超过30%的中国大学生存在心理障碍,大学生自杀和伤害他人的行为大多与心理危机有关[1]。学校是学生活动的主要场所,危机干预预防和处理工作的开展,有赖于学校心理健康服务人员。然而,他们往往缺乏必要的应对危机问题的专业知识和能力[2],无法及时有效地向主动寻求帮助或需要帮助的学生提供服务[3]。一项针对全国1 117名学校心理健康服务人员的调查[4]显示,24.3%的高校心理健康服务人员和38.9%的中小学心理健康服务人员未在国内专业机构学习过心理健康相关理论课程。在我国心理健康服务人员中,自评胜任特征水平达“比较符合”的人不足半数,占比仅为44.8%[5]。
基于情境学习理论和在线模拟技术开发的情境互动在线课程对于提高学习者危机干预技能具有良好的效果[6]。在线学习平台记录的大量学习行为数据也为学习效果评估和技能发展策略制定提供了更多的数据支持。然而,纸笔测验、自我报告问卷等传统测验方法较难真实地反映学习者在模拟环境下对技能的掌握情况。研究认为,学习者在学习过程中为了解决问题而进行的一系列操作和行为也是一种学习表现[7],而不同学习者解决问题的策略是不同的[8]。与完全独立于学习系统外的测验(如前后测)不同,序列模式挖掘(sequential pattern mining,SPM)是专门利用从教育环境(如Moodle学习管理系统)收集的日志数据(log data)来发现、分析教学过程的一种数据挖掘方法[9]。可通过对学习过程的分析,识别不同学习者的学习行为模式。
因此,本研究以对心理健康服务人员进行情境互动式心理危机干预在线培训为例,探索SPM方法在心理卫生领域的应用。利用在线学习平台记录的学习日志数据对其进行学习行为模式的分析,并结合活动图(activity diagram)对学习路径进行可视化,分析导致不同学习绩效的关键因素,从而提出具有针对性的危机干预技能发展策略。
研究对象为参与心理危机干预在线课程的有效学习者,共计104名上海市心理危机干预示范点的心理健康服务人员。分析相似群体的学习行为,可以得到较为长期的、稳定的特性,综合反映一个群体的特征[10]。由于参与学习的心理健康服务人员在年龄、性别、专业背景的分布上存在不均衡,因此本研究以最终的学习绩效作为不同群体的分组标准。
根据学习效果多元评价得到学习者危机干预六步法单项技能得分[6],并结合熵值法[11]计算得到危机干预综合技能评价得分(K)。以K得分前27%的学生作为高绩效组(high-performance group,HG),后27%作为低绩效组(low-performance group,LG),中间的46%作为中绩效组(medium-performance group,MG)[12]。分组后各组K得分情况如表1所示。
表1 3组绩效组综合技能评价得分(K)Tab 1 Comprehensive learning performance scores of three groups
数据来源于学习者的操作日志数据,存储于Moodle学习平台的MySQL数据库中,日志数据记录了学习者所有信息和操作行为,包括学习者标识符(user ID)、标识每次点选操作的事件标识符(event ID)、标识不同课程集数的课程标识符(course ID)、在所有关键节点上的选择情况(item code)及对应的时间戳(timestamp),分别保存在不同的关系型数据表中。
危机干预六步法是一种实用的系统式框架,可在实施危机干预时,用于指导危机评估、干预的策略和步骤[13]。课程共有5个完整的危机干预任务(5集),均依据危机干预六步法框架进行设计。来访者的危机事件包括人际关系、学业问题、亲人过世、家庭结构改变以及被诊断重大疾病。
学习者通过角色扮演,以咨询师的身份与来访者互动,对来访者进行危机干预。在每个咨询的关键节点,设置3~4个不同得分的可供选择的响应策略,对应咨询师不同的语言或非语言行为,进而触发来访者不同的反应(如哭泣、生气等)。当学习者在实施危机干预的过程中表现过差,超过事先设定的容忍度,即可能造成来访者情况恶化,课程会为学习者提供特定的反馈,并要求其重新返回指定位置进行学习。一旦学习者完成了整个咨询进程,即来访者的危机状态解除,表示学习任务结束,记为一次完整的学习记录。
1.4.1 频繁序列集生成 为了适应算法,需对日志数据进行记录筛选及格式转化。筛选需要的字段及记录形成导航数据(navigation data),并按课程使用Python将导航数据转换为作答序列的横表格式,其中TRUE表示在某时间戳上用户点选了该项,FALSE表示未点选。该表数据用于适应SPM分析,产生不同学习绩效分组的学习者各自的高频序列集合。
1.4.2 SPM SPM可以从学习者序列数据中寻找特定群体的频繁子序列,分析不同学习绩效的学习者的学习行为模式并提出解决策略[14]。本研究中采用广义序贯 模 式(generalized sequential pattern,GSP) 算 法 对学习者的学习行为模式进行分析。分别计算每1集中3组不同学习绩效水平的学习者的频繁序列集合。支持度(support)是指支持该序列模式的学习者人数的百分比[15],如某序列的支持度为0.5,即表示50%的学习者的学习序列中出现了该序列。GSP算法将超过预设最小支持度(minimum support)的序列识别为频繁序列。由于课程的每1集均为一个独立的问题解决过程,因此以集为单位,为不同学习绩效水平的学习者设定1个相应的最小支持度,使各集间的高频序列数相近,以生成频繁序列集。
1.4.3 活动图绘制 根据统一建模语言(unified modeling language,UML)绘制活动图[16],对不同学习绩效群体的危机干预实施路径进行可视化,直观地描述学习者模拟实施1次危机干预的过程,从而对影响学习绩效的关键节点进行分析。
1.4.4 数据处理 利用DBeaver 4.3.0数据库管理工具对MySQL 5.3.8数据库进行访问、记录筛选和数据处理;在Jupyter Notebook 6.0.2(Python 3.6.5)程序中调用pandas、numpy、csv模块进行数据格式转换;采用RapidMiner 9.0软件进行序列模式挖掘分析。
纳入分析的心理健康服务人员共计104人,年龄为(36.07±7.35)岁,工作年限为(11.52±7.66)年。其中,女性占90.38%(94/104);33.65%(35/104)的心理健康服务人员拥有心理咨询师资质;2.88%(3/104)的心理健康服务人员学历为专科学历,76.92%(80/104)为本科学历,20.19%(21/104)为硕士研究生学历;27.88%(29/104)的心理健康服务人员专业背景为心理学,62.50%(65/104)为教育学,9.62%(10/104)为其他(包括临床医学、语言学、公共卫生、电气技术)。
通过MySQL语言对log data进行记录筛选,生成作答序列导航数据(表2)。并通过Python对其进行格式转换,生成作答序列导航数据横表(表3)。
表2 作答序列导航数据(示例)Tab 2 Navigation data (examples)
表3 作答序列导航数据横表(示例)Tab 3 Horizontal format of navigation data (examples)
以横表格式的数据作为算法输入数据。生成的频繁序列集(示例)以及各集学习者的高频序列集包含的序列数分别如表4和表5所示。
表4 学习者高频序列集(示例)Tab 4 Learners′ sequential patterns (examples)
表5 各集不同学习绩效学习者高频序列集合中的序列数Tab 5 Frequent pattern numbers in each episode of different performance learners
由表5所示,由于A集和D集学习者的高频序列数较少,因此当最小支持度设为0.7时可获得与其他集次相近的高频序列数。根据预设标准确定各集的最小支持度,生成各学习绩效水平组的频繁序列并进行计数。在5集课程中,3组不同绩效特征的学习者高频序列的数量排序均为:高绩效组>中绩效组>低绩效组。
根据危机干预六步法,将整个危机干预过程划分为6个部分。以第1集(A)小学危机干预为例,根据学习者对干预策略的选择,绘制不同绩效学习者在干预关键节点的学习路径活动图,如图1所示。
图1 不同绩效群体学习路径活动图Fig 1 Activity charts of learning paths of different performance groups
由图1所示,高绩效组学习者在实施危机干预时有多种任务解决路径,结合其具有最多的高频序列,说明高绩效组具有最多样化的学习路径,并且最终都顺利完成了整个危机干预咨询进程,因此可以达到较好的学习绩效。与高绩效组相比,中绩效组的学习路径中缺少“12”这一关键节点及前后路径,在确认安全这一步骤中学习者所掌握的知识和技能出现断层,导致整个危机干预进程不完整。此外,中绩效组在“8”“18”“22”(分别对应危机干预六步法的确定问题、提供支持和制定计划3个步骤)这几个关键节点的可用路径较少,也是导致其整个危机干预进程完整性较差的原因之一。因此,虽然中绩效组最终完成了危机干预任务,但其绩效表现仍有进步的空间。而低绩效组的学习路径,仅有2条高频序列,可能是由于学习者业务能力及专业知识较为薄弱,因此在进行确定问题这一步骤后,无法继续向下进行,最终导致咨询进程的失败。以上结果表明,针对不同学习绩效的学习者,应根据其学习特点制定相应的技能发展策略。
序列模式分析最早应用于分析消费者的超市购物篮数据[17],后被广泛应用于电子商务、生物信息、在线学习、网页点击流等诸多具有典型序列特征数据的领域[18-19]。近年来,越来越多的研究开始探索临床教育与模拟技术、在线学习的结合,而通常采用的评估方式仍为传统的纸笔测试[20],其可用于测量和评估,但对能力发展的借鉴意义较为有限。本研究中,不论是在线学习过程还是危机干预六步法均具备一定的顺序模式,除了培训前后的知识测试,利用海量的学习行为数据,对参与危机干预六步法学习的心理健康服务人员的学习结果进行分析,可以从过程角度对学习者的学习情况进行评估并制定有效的改进策略。
本研究采用GSP算法对不同学习绩效的学校心理健康服务人员的学习过程进行SPM分析,结合对学习路径的可视化结果,发现不同学习绩效的心理健康服务人员在频繁序列集及学习路径上存在显著的差异。高绩效组学习者的频繁序列集有最多的序列数,且在顺利完成整个咨询进程的基础上,高绩效组学习者具备多样化的学习路径,从而可以为有效解除来访者的危机状态提供更多的可能。
从任务解决角度来看,可能是由于高绩效组学习者在工作经验和专业知识方面具有更好的优势,从而可以在规定的时间内成功解除模拟来访者的危机状态。从课程学习角度来看,可能是由于高绩效组学习者通过对情境中不同危机干预策略的选择,领悟到自己实践中是否也存在同样的问题,并在此基础上探索不同的危机干预策略,最终解除来访者的危机状态。
高频学习序列集合可以代表某个群体内大多数学习者的学习趋势特点,这些特点会受到学习者本身认知结构、学习风格、个人特质的影响,因此对不同特点的学习者的序列模式进行分析可以帮助培训者深入了解不同学习特征学生的学习路径和问题解决策略,从而采取有针对性的措施实现低绩效学习者向高绩效学习者、“新手向专家”的转变。
Shih等[14]通过分析任务游戏应用程序的日志数据,探究高绩效和低绩效的学生行为模式的区别。Taub等[21]开发了一个学习环境,探索了高绩效和低绩效学习者的学习序列情况。这些研究通过对不同特征群体的学习者的序列进行分析,从而提出针对性的改进策略。相比于比较学习前后相关指标的传统评估方式,对过程性的行为分析,能更好地发现学习者及培训内容本身的缺陷,对于相关技能的发展更具参考意义。
对于参与本次学习的学校心理健康服务人员来说,比较不同绩效组学习路径图的差异可以发现,在危机干预进程中,几个特定的节点及其所对应的危机干预六步法步骤,尤其是确认安全与否是决定危机干预成功与否的关键因素。对于学校心理健康服务人员来说,明确处于危机当中学生所面临的问题、保障其人身安全并与其建立良好的沟通关系非常重要。因此在后续的学习和培训中,需要在这几项步骤上予以重点关注。在课程和培训设计时,需要在危机干预六步法上给予更多的反馈,从培训者的角度帮助学习者克服弱点;对于学习者自身而言,在今后遇到相似问题时,也可以有意识地避免出现相同的错误,从而实现相关技能的提高。