何梦伊
摘要:高校课程教学评价是评判教师教学成果的一项重要标准,主要用作教师评优和职称评审的工作。然而教学评价中隐藏的学生需求却很少再被拿来作进一步分析,进而推动教学改革。目前大数据情感分析被运用于商品和服务的评价中后,迅速推动了个性化定制服务的发展,帮助企业更深刻地了解客户需求。将情感分析运用于教学领域也将有利于教师更深入地了解学生的需求并在课堂中进行个性化的教学。
关键词:教学评价;情感分析;大数据
1.背景介绍
随着高校国际化的脚步加快,公共英语课程目前在仍然受到各所高校的重視,不断尝试新的教学改革措施,在有限的课时内达到课堂效果最大化,满足学生对大学英语课程的需求。与此同时,由于公共英语针对非英语专业的学生,上课学生基数和课堂规模均相对较大,仅凭借教师个人的力量来实现推动个性化的学习极其困难,因此在教学过程即使教师和学生都非常希望课堂内容能够按需定制,但在实践中这样做的可能性极小。教学评价是学生对课堂内容进行反馈的重要方式之一,是同任课教师进行互动的一种形式,但由于目前教学评价更多的是作为教师考核的指标,里面的内容并没有被深入挖掘,学生真正的需求和学生的学习方式还是没有被仔细的进行分析过。造成这一结果的原因:第一,上课学生基数大、教学评价数量大、难以针对每一条进行量化分析;第二,高校给予公共外语课程教学评价的重视还不足,并没有将其视为课程改革的数据来源。本文旨在解决教学评价存在的这些问题,从而是教师和学校能够通过教学评价充分了解学生对于公共外语课程的需求,推动个性化学习的进度。
2.国内研究现状
目前情感分析方法研究主要应用于理科研究,但在人文社科中尤其是教学领域还极少受到重视。一方面,在人文社科领域使用机器算法相对来说难度较大,即使是相关的研究主要做的还是纯分析,而没有给出教学评价的倾向性和教学效果的相关关系。对教学评价的情感分析和教学成果的相关性研究还处于空白状态,因此这方面的研究显得尤为必要。
3.情感分析语言资源
相比英文文本的词典资源,中文情感分析的词典在体量和质量上都有欠缺。目前使用较多的中文词典是NTUSD(台湾大学提供)和Hownet(知乎网)情感词典。后者拥有更丰富的词汇资源,被选做本研究中情感分析的词库。Hownet对词汇进行了标识来显示其褒贬意义,通过对一条教学评论中关键词汇的权值进行相加,并排除那些不构成词的单个词语,最终得出教学评价的情感倾向。词汇的权值Weight(W)体现词汇本身的倾向,0≥W≥1则词汇显示褒义,W=0则词汇在词典中不存在或者中性,-1≥W≥0则显示贬义。
4.情感分析的方法
目前情感分析的方法主要为两种。一种是依靠机器学习,对情感分类进行文本分类算法。另一种则是基于现有的词典进行分析。相较而言,后者是一种简单直接的方法,更适合做一些简单的情感分析类型。其基本的模式是对本文中的情感进行倾向性分类,从而进行加权求和,根据最后的数值来判断一条评论属于正面评价还是负面评价。 其具体的操作步骤为:1).抽取评价的对象。在评价中提取出学生所评价的内容可以归结为教学中的哪一类;2).对评价对象对应的相容进行评分,来判断其倾向性;3).将一条评价中的所有关键词权值相加,判断整个评论的情感倾向性。在分析过程中,评价对象例如“上课态度”、“讲”、“教学方法”等等会被视为评价的内容,“有激情”、“清楚”、“有逻辑”、“幽默风趣”等词汇会被视为情感词。
5.研究对象
本研究针对大学英语课程的教学评价进行分析,所采集的教学评价来自一个教师所教的10个班级(Class1-Class10),每个班级人数在30-40之间。这样的样本选择目的是在保证教师期末评分标准一致的情况下,教学评价所体现出的情感倾向是否和教学成果相关,探究学生对于课程和教师的认同感是否有助于学生的学习。
6.分析结果
从两个图表所得到的数据我们可以看出,同一名教师所教授的班级对于教师的的授课评价是有差异的,且这一差异在某些班级的对比中显得较为明显。这一差异和每个班级期末考试的成绩在图表显示上存在相关关系。在情感分析图中Class6,Class9,Class10 三个班级所给出的教学评价较高,而这三个班级的教学效果也相对更好,班级期末成绩的平均分数比起其他班级相对高出4-5分。而Class4,Class5,Class8三个班级给出的教学评价分值显然低于其他班级,而这三个班级的平均分数也相对较低。根据这两个图表的比较,我们可以初步得出学生对于教师授课的认可程度以及情感倾向性和教学的效果基本呈一致性。以一个班级为一个整体,整体呈现的情绪氛围越倾向积极和正面,课堂效果相对来说也会越好;相反,如果整体学生对课堂授课和教师的评价倾向于负面或者积极性相对较弱,课堂的效果相应的会差一些。但这一趋势并不绝对,例如Class2班级给出的教学评价不是最高的,但其教学成果却在个个班中排名第一。此外,Class5班级在情感分析中呈现出的情绪分值是最小的,但其最后的成绩在Class4之前。这种结果不一致的原因不是单一的,可能是由于不同班级的基础本身就存在差异,英语基础较好的班级会认为课程偏易,老师的方法不完全对口,但在期末考核中成绩还是较高。
7.研究中的限制和问题
首先,本研究使用的情感词典是Hownet中文词库,其中的词汇是针对所有领域的泛中文情感词汇,并不是专门为教学评价领域建立的情感词典,因此在关键词的识别上难免存在遗漏。同时在情感词典的自动扩充过程中也会存在对程度副词难以辨别的情况。由于对教学评价的情感分析还基本处于空白的状态,建立属于教学相关的词典能够更精确的分析学生的情感倾向性,用来作为评判老师的标准。
参考文献:
[1]李海峰,刘晓磊.基于语义的文本倾向性分析在高校教学评价中的应用[J].科技创业,2011:245-260.
[2]韩照祥,朱惠.高校教学评估的探索[J],大学教育科学,2005(4).
[3]罗芳.意见挖掘中若干关键问题研究[D],武汉理工大学,2011.endprint