邓庆东 付立军 杨亮 范玥 程璐璐
摘 要:随着新高考改革选科选考方案的实施,中学生尤其是高中生要增强对个人兴趣、能力、学术潜力以及专业与职业方向的综合认识,学校也要加强对学生学涯测评的引导,提升测评精准性。传统模型测评的问卷模式反映了学生的部分特征,同时经典测评问卷模式受被测试者主观情绪影响和解读认识上的差异,可能伴随部分主观上的误差。对此,文章提出一种融合学生无感行为理念的测评方法,并基于文本分类技术及日志处理等手段,对学生无感行为进行分析并与传统经典测评相融合,解决了传统经典测评模型的主观性强、测评维度单一等问题。还基于微信公众号平台,内嵌开发了融合无感测评理念的在线测评系统,在北京市某中学上线并经过一年多的应用实践检验。结果表明,该方法有效地提高了学生的认知,并且在学生发展指导中心对学生个性化指导方面,起到了创新性的作用。
关键词:新高考;无感测评;学涯测评;选科选考
中图分类号:TP399 文献标志码:A 文章编号:1673-8454(2021)22-0023-05
一、引言
2019年6月,国务院办公厅印发的《关于新时代推进普通高中育人方式改革的指导意见》,强调开展不同形式的学生发展活动,加强学生的学涯规划指导。这是继2014年9月《国务院关于深化考试招生制度改革的实施意见》[1]提出后,对学生发展和学涯规划的又一次深入推动。伴随着教育的创新改革,学涯规划的关键——学涯测评获得越来越多的重视,测评推动着学生、家长、教师、学校各方,通过多种途径提升学生对学涯的认知与实践。如何帮助学生选择备考科目、专业方向,指导学生学涯规划活动,成为学校教育指导的重要内容[2]。有效的综合测评模式,将助力于学生学涯认知和学校学涯规划指导。
传统经典测评模型,如MBTI测评模型[3]通过选择题的方式,为用户展示测评结果。然而,模型测评的方式存在一定的局限性,测评者可能出于其他心理而选择一些非实际情况的答案,使得测评结果有一定的偏差。随着“互联网+”的推进,大数据和人工智能技术与行业结合应用不断深化,本文在传统经典模型测评基础上,基于微信公众号内嵌开发测评系统,通过文本分类、日志分析技术,以无感测评的方式分析提取学生无感行为数据,构建学生在新高考环境下推荐选科、选专业的新型测评模型。同时结合学生成绩等进行验证,在综合多方面因素的基础上,使测评结果更具真实性、客观性。
二、国内外研究现状
随着教育体系和计算机技术的发展,领域间交叉日益密切,其中研究学生个性化测评方面主要有以下几种:MBTI(Myers-Briggs Type Indicator)职业性格测评由Myers和Briggs母女以心理学家荣格的心理类型理论为基础编制的一个人格自陈量表[3]。这种量表方法比较原始,但是奠定了职业测评方向的基础。加拿大西蒙弗雷泽大学的Virtual-U教学平台[4]可以对学生的测验进行管理和评价,这种方式是对学生的测验进行数字化管理,但评价维度过于单一。之后,张艳霞[5]等通过讨论构建和使用数据表征来刻画学生特点和偏好。李爽[6]等通过行为序列分析学生在测评平台上的连续动作,这种方式一定程度上反映了学生的行为,不过该测评只是分析行为和成绩之间的关系,不适用于新高考环境下选课和专业选择方面测评的情况。滑卫军[7]提出新高考环境下应用脑AT技术测评工具和校企联盟的方法,为中学生选科目、选专业提供帮助,此方法有一定效果,不过测评周期过长,且没有有效利用网络平臺获取学生的高校专业、未来职业的平台数据痕迹再做分析。此外,部分教育工作者运用统计学方法,统计测评者的行为特点数据,并分析最终记录的结果,为测评者进行测评规划。
三、无感测评实现的技术方法
无感测评主要是将学生在测评平台上对“职业案例”模块的浏览情况、收藏行为以及学生成绩等多元化数据作为测评指标,通过文本分类技术对所实验的数据进行分类,挖掘分析浏览情况和收藏行为数据所反映出的学生的能力、性格或兴趣倾向等。该实现过程包括数据获取、分类算法的研究与选取、分类模型优化等几个步骤。
1.数据获取
采用Scrapy爬虫框架[8]采集公开的职业招聘案例数据为数据集,根据职业方向划分为建筑类、财务/行政类、销售/市场类、计算机类、工程技术类、公务员、通信类、酒店旅游类、传媒文化类、艺术设计类、化工环保类、生物制药类、生产制造、贸易/物流类、保险类、证券类、农业类、医疗类、法律类、教育类和金融类共21类,共计11000余条数据。职业案例主要包括:任务职责、职业技能、知识背景、从业资格、常用工具等。职业案例的节选数据如表1所示,包括案例标题和案例详情模块。
2.分类算法的研究与选取
分类算法的选择或融合常基于分类数据的结构。本文需要的数据集中每份职业招聘数据均包括案例标题和案例详情,而这种文档有一定的特征,即大部分标题是对正文的高度概括,通过标题可以直接确定其分类;而有些标题则略为含糊,需要结合文档详情确定最终分类。
本文参考并改进吴汉瑜等[9]人提出的CNN_BiLSTM_ Attention混合分类模型,提出基于注意力机制的双CNN+BiLSTM分类算法,注重标题与职业招聘详情部分的融合加权分类。对每条职业案例标题与详情通过Word2vec模型训练为词向量,分别对案例标题与详情语料中每个词潜在的语义向量进行卷积[10]与最大池化[11],最大池化后的特征向量输入到BiLSTM,获取上下文语义信息[12],得到标题和案例详情隐藏状态向量后,通过注意力机制分别为案例标题与详情这两部分处理结果配置对应权重,最后通过softmax函数计算文本类别概率,分类模型如图1所示。
其中卷积神经网络融合双向长短时记忆网络(CNN+BiLSTM)模型不仅可以考虑上下文信息,还可以提取局部特征,有效防止关键信息丢失。同时,为了奖励作为正确分类文档的线索部分,引入标题与详情级别的注意力机制,该机制在标题与详情内容两部分分别经过CNN+BiLSTM模型处理之后,分配不同的注意力分布概率值。
首先,用一个非线性激活函数获取标题向量或者详情向量的深层语义向量:
ui=tanh(WSy(3)
i +bs)公式(1)
其中y(3)
i 是标题或详情向量,bs是注意力机制的偏置参数,使用公式(2)获取标题与详情的注意力向量:
ai=公式(2)
其中,us是一个随机初始化的在训练中学习的上下文向量,通过公式(3)求得整篇文档的向量表示:
v=aiy(3)
i 公式(3)
在这最后的向量中,本文使用softmax计算职业案例Q的分类标签y,分类器利用隐藏状态c*作为输入:
(y│Q)=softmax(W(Q)+b(Q))公式(4)
=argmax(y│Q)公式(5)
损失函数如下:
J(θ)=-tilog(yi)+λ||θ||2
F公式(6)
其中t∈Rm是one-hot表示,y∈Rm代表估计每个类别的概率(m是目标类别的数目),表示一个L2正则化参数。
3.分类模型优化
本文分类模型最终的分类,使用softmax函数实现对职业案例数据进行计算。针对算法模型在训练的时候有可能出现过拟合的情况,为了避免这种情况的发生,我们使用L2正则化策略[13]和Dropout策略[14]。
(1)L2 正则化策略
为了提高本平台模型的广泛适用能力,我们使用L2正则化策略进行激励。本平台模型参数选择 λ=2 时候的正则化项,因此本融合算法的目标函数如下:
f(Θ)=L+∑θi公式(7)
对模型参数进行优化,其中模型参数说明如表2所示。
(2)Dropout策略
本文在算法模型的全连接层后融入Dropout机制,可在训练时去掉一些特征,过程如下:①保证输入层与输出层神经元个数不变,临时随机去除部分隐藏层中的神经元。②将输入层经过调整后的网络进行前向传播,再把获取的损失结果通过调整后的网络反向传播。③恢复步骤①中被临时去除掉的神经元,未被临时去除的神经元此时已被更新。不断重复执行这一过程,从而达到削弱网络模型隐藏层之间的作用,以此来防止算法过拟合的情况,经过Dropout机制优化的网络变化如图2所示。
四、融合无感行为的新学涯测评方案设计
为了解决中学生学涯测评选科、选专业难的问题,本文提出基于微信公众号平台先用经典的MBTI职业性格测评得到个性化推荐的职业类别信息,之后融合学生无感行为理念的测评方法,来解决传统经典测评模型的主观性强、测评维度单一等问题。
1.无感测评的设计
本文提出的无感测评指的是在测评的过程中测试者没有明显感知在进行测试环节,之后对于测试的结果数据进行挖掘分析得出测试评价。本文设计通过采集学生在本测评系统中职业案例等模块产生的浏览记录[15]、收藏行为以及个人成绩等多元化数字痕迹数据综合作为测评指标。对于浏览记录方面,通过系统埋点与日志采集以及数据分析技术得出中学生感兴趣的职业类别和不同类别的访问频率,再结合测评者可能有的收藏行为,基本得出其职业兴趣类别。此外,职业类别和高校专业、高校专业和基础学科之间存在一定联系[16],所以学生成绩可以作为无感测评的参考标准。无感测评流程如图3所示。
2.融合无感测评与经典MBTI模型的综合测评
一般来讲,相比于了解高校开设专业的情况,中学生更了解身边人从事的职业情况,因此学生可以先从职业开始了解,通过职业关联对应专业,通过专业锁定选科。职业一般和高校专业密切关联,从而抽取出职业大类关联的一级高校专业,而专业又与九大基础学科进行知识关联,进而能通过传统经典测评获取测评者擅长的高校专业类和基础学科,其中专业和职业之间知识关联[16]部分内容如表3所示。
专业和学科之间的知识关联部分内容如表4所示。
MBTI经典测评结果的推荐同样是职业,因此与前面提到的引导中学生从职业模块开始收集无感测评相切合,MBTI经典测评和无感测评均收敛聚焦于职业,MBTI测评推荐的职业类别结果如图5(a)所示,与无感测评模型分析收集的职业类别有重叠,本文采用基于权重的统计学方法计算排序。同一测评模式下的重复职业类别直接累加统计,经典测评推荐结果和无感测评收集分析结果重要度比重各占50%,最终结果按照加权累加的方法由高到低进行排序,经过表3和表4所描述职业与专业、专业与学科之间的知识关联,可以推出适合学生的选科和选专业列表。图4是系统的测评模型融合设计图。
通过融合无感测评,解决了经典测评模型测评维度单一等问题。此外,联合学生的学习成绩,一方面有效利用学生成绩提高模型的推荐准确度;另一方面,通过学生成绩验证本文提出的综合测评模型的准确性,两者相辅相成。
五、新学涯测评系统的应用实践
本项目应用在北京市某重点中学,采用上述融合无感测评模型,用于辅助中学生的学涯规划指导工作。其中主要的测评分为经典模型测评、职业案例浏览、个人成绩管理三大块。为了将本文的测评模型得到实际应用,使用配套研发的“学涯测评系统”为学生提供服务,其测评界面如图5所示。
六、研究结论
在本文配套的学涯测评系统中,通过将经典测评模型与无感测评模型相融合,并实际应用于北京市某重点中学学涯规划指导中,使得学生對自我认知、职业的认识以及高校专业的了解有了显著提升。同时这种融合的测评模型相对可靠地刻画了学生的能力特征与兴趣倾向,有效克服了传统经典测评的局限性,较为精准地为中学生在新高考环境下推荐个性化选科、选专业。借助移动微信公众平台,使得学生打破时空限制,有更多时间和机会进行无感测评,无论对学生个人学涯规划,还是学校的培养教育均有十分重要的作用。
参考文献:
[1]刘宝剑.关于高中生选择高考科目的调查与思考——以浙江省2014级学生为例[J].教育研究,2015,36(10):142-148.
[2]林德全.新高考选考科目嬗变的多维审视[J].湖南师范大学教育科学学报,2019,18(6):40-46.
[3]Myers I B,McCaulley M H,Quenk N L,et al.MBTImanual: A Guide to the Development and Use of the Myers-Briggs Type Indicator Instrument,3rd Edition[M].Palo Alto:Consulting Psychologists Press,1998:285-324.
[4]吕啸,余胜泉,谭霓.基于发展性评价理念的网络教学平台学习评价系统设计[J].电化教育研究,2011(2):73-78.
[5]张艳霞,孙洪涛,李爽,等.数据表征学习过程及其应用——学习分析数据集国际研究综述[J].中国电化教育,2015(9):85-93.
[6]李爽,钟瑶,喻忱,等.基于行為序列分析对在线学习参与模式的探索[J].中国电化教育,2017(3):88-95.
[7]滑卫军.新高考改革背景下高中生涯规划教育的实践探索——以北京市H中学为例[J].教育理论与实践,2019,39(14):7-9.
[8]Kaiying D,Senpeng C,Jingwei D.On optimisation of web crawler system on Scrapy framework[J].International Journal of Wireless and Mobile Computing,2020,18(4): 332-338.
[9]吴汉瑜,严江,黄少滨,等.用于文本分类的CNN_ BiLSTM_Attention混合模型[J].计算机科学,2020,47(S2):23-27+34.
[10]Kim Y.Convolutional neural networks for sentence classification[C]∥Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing.Doha,Qatar:Association for Computational Linguistics,2014:1746-1751.
[11]Collobert R,Weston J,Bottou L,et al.Natural Language Processing(Almost) from Scratch[J]. Journal of machine learning research,2011(12):2493-2537.
[12]国显达,那日萨,崔少泽.基于CNN-BiLSTM的消费者网络评论情感分析[J].系统工程理论与实践,2020,40(3):653-663.
[13]吕国豪,罗四维,黄雅平,等.基于卷积神经网络的正则化方法[J].计算机研究与发展,2014,51(9):1891-1900.
[14]Zhang Y D,Pan C,Sun J,et al.Multiple sclerosis identification by convolutional neural network with dropout and parametric ReLU[J].Journal of computational science,2018(28):1-10.
[15]姚攀,马玉鹏,徐春香.基于ELK的日志分析系统研究及应用[J].计算机工程与设计,2018,39(7):2090-2095.
[16]赵宁宁.高中学生选科与高校招生专业类相关性探讨[J].考试与招生,2019(11):8-12.
(编辑:李晓萍)