郗闽
关键词: 学生教学; 认知诊断; 贝叶斯网络; 结构学习; 层级关系; 分类性能
中图分类号: TN711?34; TP393 文献标识码: A 文章编号: 1004?373X(2018)24?0079?03
Research on BN?based generalized cognitive diagnosis model for students
XI Min
(Xian Aeronautical University, Xian 710077, China)
Abstract: In allusion to the disadvantage that only score values are given for measurement and diagnosis of students′ psychological change and generalized cognition, and different knowledge structures with the same score value cannot be explained in the traditional teaching, the Bayesian network (BN) is introduced into the generalized cognitive diagnosis of students on the basis of the fact that, as for the current task of student cognitive diagnosis, information feedback of student test results is more important. The Bayesian structure learning is conducted for the data obtained from the test, so as to obtain hierarchical relationships between attributes. The BN network classifier is constructed to classify the students′ cognitive states. A verification was conducted for the constructed BN?based generalized cognitive diagnosis model of students. The results show that the obtained hierarchical relationships between attributes are reasonable, the classification performance is good, and the model has a broad application prospect.
Keywords: student teaching; cognitive diagnosis; Bayesian network; structure learning; hierarchical relationship; classification performance
在教学与学生考试评估中,评估结果的分数值并不能揭示隐藏其背后的认知过程与结构信息,而评估通常的主要任务为反馈信息[1],以有利于对学生思想政治教育的促进。针对此缺点,本文构造了基于BN网络的学生广义认知诊断模型,将贝叶斯网络(Bayesian Network,BN)引入学生广义认知诊断中。在此主要进行了两方面的研究,分别为测验所得数据进行贝叶斯结构的学习得到属性间的层级关系与构建BN网络分类器对学生认知状态进行分类,从而更好的为教育服务。
1.1 认知诊断
新一代健康教育理论的核心:认知诊断虽处于发展初期,但已成为国内外心理研究的热点[2]。在教育中,期待得出学生认知过程中的具体信息,以指导不同学生有针对性的学习。认知诊断最早可追溯至20世纪六七十年代,提出为掌握而学的布鲁姆认为测验不仅要提供筛选功能,更能提供具体信息,以提高测验效度[3]。基于心理学模型,认知诊断采用心理学的各种方法分析测验任务中所涵盖的技能、知识等分量,从而获得模型并进行设计测验。最终采用测量模型获得测量数据,也即融合各种变量于测量模型,并利用统计方法对个体特征进行揭示。
1.2 贝叶斯网络概念
1985年提出的贝叶斯网络(BN)已在机器学习、专家系统与人工智能等领域得到广泛的应用,其是统计学、数据挖掘等多个领域的交叉学科[4]。BN基于概率论图形模式,采用概率分布将不确定性设计成模型以用于分析不确定事物并做出推理[5]。BN包括两部分:条件概率分布(Conditional Probability Distribution,CPT)与有向无环图(Directed Acyclic Graph,DAG),分别表示变量与变量之间的关系。有向无环图又包括测试状态、属性等抽象成的节点与表示节点间相依关系的有向边,条件概率表示节点间的联系程度[6]。图1为BN网络图的一个实例,列表中表示了预测任意实例的概率分布。式(1)为贝叶斯定理,其为贝叶斯网络建立的依据。
[PAiB=PBAiPAij=1nPAjPBAj,i=1,2,…,n] (1)
式中,[A1,A2,…,An]为A的n个不相容状态,且为必然事件;[PAi,PBAi,PAiB]分别为先验概率、条件概率与后验概率。
1.3 贝叶斯网络学习与分类器
1) BN网络学习
BN网络的推论需基于BN网络学习构造的模型。BN网络学习即通过数据以构造其网络,其既可定性又可定量,包括参数与结构学习两个过程[7]。结构学习是构建模型,将数据的因果关系图形化,参数学习则是求得网络结构中节点概率分布。
2) BN网络分类器
BN网络建立后,采用BN公式根据被试学生作答情况进行信息的预测与能力的推断分类。BN分类器选取已知类别的训练样本,通过模式识别判断测试样本所属类别。BN分类器模型可分为朴素、树增广的朴素、增广BN网的朴素BN分类器等。
认知诊断的目的是通过学生的作答情况,以分析其心理状态与知识技能掌握情况。因此,Q矩阵被应用其中。其是测试项目与认知属性的关联阵,是可观察与不可观察间的桥梁[8]。基于事先设定的属性层级关系得到Q矩阵、邻接矩阵,化简得到Qr矩阵,从而基于Dr编写题目进行测试,得到最为接近被试者属性掌握模式以使得BN结构学习结果更加可靠。
本文的属性结构学习采用K2算法,设变量[X1,X2,…,Xn]的完整数据为D,K2算法在被正整数与排序变量所限制的空间中找寻最优模型,其过程为:计算排序中父节点集合为空时的节点结构分数,然后将排序在前的節点组合为其父节点,形成新网络结构并对其进行评分;在评分最高的网络结构中找到该节点的父节点,重复进行该过程,直到找出所有节点的父节点,进而找到属性间的层级关系。认知诊断中的变量包括学生心理状态、知识技能、试题等的认知属性。
在认知诊断中需要依据项目反映情况识别原理[9]。BN分类器基于数据,所有属性均参与分类,且判断对象的类是通过其概率值。因此,其为优良的分类方法,被广泛地应用在医疗、故障诊断等领域。
本文中所用到的分类器为朴素、增广朴素BN分类器,朴素BN模型节点结构为一个父节点、多个子节点,分别为类别与属性变量,表示为C,[X1,X2,…,Xn],即表示学生理想掌握模式类别与题目。分类器原理为基于属性变量值,计算后验概率分布,该组类别则为得到最大的C值[10]。朴素BN分类公式为:
[PCiX=PCiPXj=1nPxjCi] (2)
增广朴素BN模型则是在节点间增加边,以弥补朴素BN模型不符合实际的变量间独立的假设,其分类公式为:
[PCiX=PCiPXj=1nPxjπXj] (3)
分类器性能评价标准为复杂度、简洁度与准确度,本文采用最为常用的准确度对分类器进行评价,准确度的指标有:正确率、错误率、精度与召回率。本文对分类器模型评估采用交叉验证法,包含hold out,K?fold,leave?one?out三种交叉验证方法。本文采用其中10?fold法,数据会被分成10个等级,共进行10次验证,每次取数据集中1个数据集为测试集,9个为训练集。通过题目的细致编制,分析与报告每个学生的掌握情况,并将其分类到特定的模式中。建立BN分类器的步骤为:
1) 标识类与属性变量及其值;
2) 搜集含有一系列属性变量与一个类别变量的数据;
3) 进行BN网络参数与结构学习,从而构造出含有概率分布表与有向无环图的BN网络分类器。
4 实验验证
4.1 属性层级关系
在学生心理状态中选择6个知识点属性,初步设定其层级关系,如图2所示。通过将学生的观察反应模式与属性层级模式作为训练数据集,得到BN学习结果图如图3所示。比较图2与图3可得出,两者结构变化较小,仅在有变化处做出分析可进一步在细节处了解学生心理状态。
4.2 分类器性能评价
为了验证本文所设计的分类器性能,对朴素、增广朴素BN分类器分别运用实证数据进行验证,表1为其分类效果。从表中可看出,两个分类器效果相差较小,分类正确率可以达到88%,分类效果良好,结构简单,因而其为有效的分类工具。
本文针对传统教学中对学生心理变化和广义认知的测量与诊断只给出分数值,而无法对分数值相同的不同知识结构进行解释的缺点,基于目前学生认知诊断的任务更多的是学生测试结果的反馈信息,将具有坚实数学理论基础、数据挖掘理论与算法支持的贝叶斯网络引入学生广义认知诊断中。文中最后对所构造的基于BN网络的学生广义认知诊断模型进行验证,结果表明其得到的属性层级关系合理,分类性能良好且结构简洁,能够较好地应用在认知诊断中,具有广阔的应用前景。
参考文献
[1] 朱天宇,黄振亚,陈恩红,等.基于认知诊断的个性化试题推荐方法[J].计算机学报,2017,40(1):176?191.
ZHU Tianyu, HUANG Zhenya, CHEN Enhong, et al. Cognitive diagnosis based personalized question recommendation [J]. Chinese journal of computers, 2017, 40(1): 176?191.
[2] 毛秀珍.基于属性掌握概率的认知诊断模型[J].四川师范大学学报(自然科学版),2014,37(3):437?443.
MAO Xiuzhen. The attribute mastery probability cognitive diagnostic model [J]. Journal of Sichuan Normal University (Natural science), 2014, 37(3): 437?443.
[3] 王郁.基于HO?DINA模型的学生心理多级评分认知诊断模型研究[J].现代电子技术,2018,41(2):53?55.
WANG Yu. Research on multi?level scoring cognitive diagnosis model for students′ psychology based on HO?DINA model [J]. Modern electronics technique, 2018, 41(2): 53?55.
[4] SINGH P K, CHERUKURI A K. A note on bipolar fuzzy graph representation of concept lattice [J]. International journal of computing science & mathematics, 2014, 5(4): 381?393.
[5] 王郁.基于G?AHM模型的群体水平评估认知诊断模型研究[J].现代电子技术,2018,41(10):105?107.
WANG Yu. Research on group?level evaluation cognitive diagnosis model based on G?AHM model [J]. Modern electronics technique, 2018, 41(10): 105?107.
[6] GLYKAS M. Fuzzy cognitive strategic maps in business process performance measurement [J]. Expert systems with applications, 2013, 40(1): 1?14.
[7] LIU Q, WU R, CHEN E, et al. Fuzzy cognitive diagnosis for modelling examinee performance [J]. ACM transactions on intelligent systems & technology, 2018, 9(4): 1?26.
[8] 丁树良,王文义,罗芬.认知诊断中Q矩阵和Q矩阵理论[J].江西师范大学学报(自然科学版),2012,36(5):441?445.
DING Shuliang, WANG Wenyi, LUO Fen. Q matrix and Q matrix theory in cognitive diagnosis [J]. Journal of Jiangxi Normal University (Natural sciences edition), 2012, 36(5): 441?445.
[9] NIESINK P, POULIN K, ?AJNA M. Computing transitive closure of bipolar weighted digraphs [J]. Discrete applied mathematics, 2013, 161(1): 217?243.
[10] SINGH P K, KUMAR C A. Bipolar fuzzy graph representation of concept lattice [J]. Information sciences, 2014, 288: 437?448.