基于数据挖掘与情感分析的环境工程研究生评教质量研究

2023-02-10 05:32李秋华倪智力林梓杨李玉瑛
高教学刊 2023年1期
关键词:评教环境工程数据挖掘

汪 涛,李秋华,倪智力,林梓杨,李玉瑛,匡 彬

(五邑大学 生物科技与大健康学院,广东 江门 529020)

随着社会经济的发展,各种各样的环境问题日益凸显出来,例如生物多样性减少、酸雨、水体污染和固体废物污染等。环境工程研究生培养作为解决环境问题的高层次人才培养阶段,其教学质量评价在环境工程研究生课程建设中发挥重要作用。清华大学在20 世纪70 年代成立了我国第一个真正意义上的环境工程专业,随后我国环境工程这门学科开始迅速发展。环境工程研究生的教学课程专业性强,既涉及基础理论课程教学,也涉及应用课程教学,研究生评教过程的专业性特点较为明显[1]。环境工程研究生评教是培养单位构建环境工程研究生教学质量的重要组成部分。评教数据会因为研究生的情绪、习惯和心态等多方面的原因,出现评教结果不准确的情况。为了有效解决数据这一问题,本课题拟对环境工程研究生的教学过程开展基于数据挖掘和情感分析的评教质量研究,以提升评教的有效性[2],从而指导环境工程研究生和导师共同提高教学质量。

一、研究现状

在教育普及的今天,研究生这个群体的规模越来越大,环境工程研究生的教育受到越来越多的关注。以环境工程这个专业为例:有学术型研究生和专业型研究生,在大部分院校,目前这两类研究生的培养方式较为相似。无论是985、211 还是普通的地方性院校,环境工程研究生的教学、评教内容和评教质量等均受到较高的关注。随着环境工程研究生数量的逐年增加,环境工程研究生评教在研究生的教育中占据着越来越重要的地位,环境工程研究生评教质量也越来越受到关注。环境工程研究生评教质量的提高有利于环境工程研究生的发展和导师的教学。目前,研究生评教基本以问卷调查的形式出现,有将文件打印出来通过纸张在线下进行评教,运用网络信息技术在互联网上进行评教,或者通过机读卡进行评教[3]。随着网络信息技术的发展,大部分环境工程研究生的评教是通过互联网实现的[4],如:在某个页面或App 出现提问选项供研究生选择或者判断;还有部分题目是没有选项的,会有一个问题和文本框,这部分题目是需要研究生用自己的语言进行回答的。当然大部分的调查问卷所涉及的内容是比较全面的。

研究生教育是本科生教育的衔接。环境工程研究生与本科生的教育方式是有明显区别的。环境工程本科生的教学往往以通识教育为主,而环境工程研究生的教学以专业教育为主。环境工程本科生的课程更多、更全面,涉及多个学科,更具交叉性;环境工程研究生的课程则较少,与实验相辅相成更具专业性。在环境工程研究生阶段,随着课程的减少,多以做实验为主,造成了重科研轻教学的普遍现象,给评教造成了一些困难。这就要求环境工程研究生既要有动手能力也要有创新能力。除了引导环境工程研究生客观地进行评教外,现在面临的问题就是如何较好地利用环境工程研究生评教系统,使得环境工程研究生评教系统能够物尽其用。科研院校可以采取一些合适的方法、理论、平台和软件等,尽量使得研究生评教变得完善,从而使得基于数据挖掘和情感分析的环境工程研究生评教质量提高。也让环境工程研究生的评教系统更好地为广大高校师生服务。

二、评教影响因素

在现实生活中,环境工程研究生的评教结果往往会受到很多因素的影响。以大部分科研院校为例,对于环境工程研究生教学的课程,学校往往会采取多种方式教学,如:有几百人同时一起上的课,也有十几个人甚至几个人一起上的课。上课人数相差较大对环境工程研究生评教产生了一些影响。其实就算是同样的老师教授同样的课程,由于人数的多或少都会让研究生产生不一样的感觉。无论上课的人数是多是少,其实大部分导师讲的都是相当不错的,往往是因为研究生自己的主观想法而觉得人较多的课,老师讲得好;人较少的课,老师讲得不好或者得出与之相反的结论。这都掺杂了研究生的一些主观想法和情感。除了上课的人数之外,课程的类型也会影响研究生的评教,譬如:环境工程研究生的选修课和必修课。选修课一般是研究生遵循自己的爱好和兴趣而选择的课程;而必修课往往是研究生必须要学的专业课,带有一些强制性,有个别课程是研究生不喜欢的,因此评教分数自然会低。而且,由于环境工程专业的特殊性,往往各大院校在给研究生安排课程时是以专业课为主的,可供选择的其他课程很少。在必修课上,研究生往往表现出较低的积极性;而在选修课上,研究生往往表现出比较高的兴趣。如:环境监测、废水处理、环境保护概论和工程伦理等必修课内容较广、较难环境工程研究生往往表现出比较低的积极性,有的甚至还会产生排斥心理,因此环境工程研究生在评教时更倾向于给选修课的教师更好的评价和更高的分数。同时上课的时间段也会影响研究生的评教质量,譬如:上课时间过早或者过晚甚至临近中午都可能会引起学生的心理波动,进而影响研究生评教质量。上课时长也是影响因素之一,有些课少则一小时多则好几个小时,研究生会产生抵触心理[5]。

除了课程本身的原因,与上课的教师也是息息相关的,如:有些教师比较年长、教学经验丰富、有比较高的学术造诣,但正是由于年长和研究生产生了代沟;有些教师比较年轻,与研究生年纪相差不大,因此能更好地沟通,但教学经验缺乏,学术造诣也不足,这些因素都会在一定程度上影响评价结果。其实这些因素并不能作为环境工程研究生评价导师的参考[6],但往往大部分环境工程研究生会因此进行评教。同时研究生个人的因素也会影响评教质量,如研究生心态是否成熟、判断是非的能力是否不足及是否有正确的价值观等。由于个别研究生存在敷衍的态度,在网络问卷中,有一小部分研究生为了节省时间连题目都不看,只是简单、直接地点击提供的选项而已;对于问答题更是简简单单地写几个字,敷衍过去。更有甚者可能直接找人代为评教。这就使得研究生评教没有发挥出最大的效用,造成资源浪费。因此,更要展开基于数据挖掘和情感分析的环境工程研究生评教质量研究。

研究生评教的科学性、有效性和准确性是保证评教质量的前提,在一定程度上环境工程研究生评教质量的高低是依赖于研究生评教系统的。因此,在评教开始之前就要发现问题,解决问题和制定一套符合实际的标准。

三、数据挖掘

数据挖掘属于计算机科学范畴,有益于了解收集到的数据的特点,包括了聚类、关联等多种分析方法。目前,大部分高校研究生评教系统都没有被好好利用。无论是网上评教的机制还是数据的分析机制都过于简单,环境工程研究生只是简简单单地回答一些被设置好的问题,而学校层面也只是对所得数据进行收集整理然后进行简单分析。事实上,这样的机制并不能完完全全地利用好收集的数据,评教质量也不高,造成了资源的严重浪费。既然进行了研究生线上评教,就要好好地利用这部分资源。充分发挥出基于数据挖掘和情感分析的环境工程研究生评教的优势,使得环境工程研究生评教质量得到实质性提高。当然,在环境工程研究生评教中难免会出现各种各样的问题,也会出现各种各样的“声音”,有利于环境工程研究生评教的,有不利于环境工程研究生评教的。科研院校更要致力于解决研究生评教中出现的各种问题,然后基于数据挖掘和情感分析使研究生评教质量得到提高,进而验证这一研究。

研究生评教旨在建立环境工程研究生与导师之间沟通的桥梁,是想通过环境工程研究生参与评价教师从而使得环境工程研究生与教师进行有效、良好地沟通,更有利于环境工程研究生的学习。促使导师完善并改进现有教学的方法,从而使得环境工程研究生能更好地接受导师的教学方式,取得较好的学习成果。导师可以通过环境工程研究生评教结果而对自己的教学方式和手段进行修改,因此环境工程研究生评教质量的好坏便显得至关重要。环境工程研究生是整个评教的核心,无论是评教系统的设置,还是基于数据挖掘和情感分析的环境工程研究生评教,甚至包括导师和科研院校查看数据、分析结果然后更改教学的方式或方法都是为了让环境工程研究生在评教中反映出教师教学和自身的一些问题,从而使得环境工程研究生能更好地吸收课堂上的知识,有利于各种知识的掌握。

在设置线上的网络问卷时,选择的问题要具有代表性、多元化,不能以偏概全,尽量不要出现只符合少数环境工程研究生诉求的题目,要考虑到大部分环境工程研究生都关心的问题,要基本符合环境工程研究生这个群体整体的诉求;操作系统和评教页面也不应该复杂,评教系统要尽量简单。环境工程研究生评教系统可以采用PHP 语言和C/S 与B/S 结构进行开发,在设置问卷指标时可以询问教师和学生的意见,这样会更合理和人性化。评价体系中应当包括教学的态度、教学的内容、教学的效果及教学的方法,自然也应该包括教师及其课程的信息。环境工程研究生评教结束后,数据收集相关的部门要好好地利用原始数据,即使通过基于数据挖掘和情感分析也可以进行数据的再分析。评教的主体是环境工程研究生、评教的方式大部分采用的是网络在线问卷调查、评教时间大部分是选在学期末。有条件的话可以每个月评价一次或者期中期末一共评价两次,适当缩短评教周期。评教的着重点应该放在师生关系是否融洽,导师的教学方式研究生是否能够接纳等利于环境工程研究生和导师的层面。最后基于数据挖掘和情感分析去分析获得的数据。

显而易见,数据的收集者不可能一条一条的自己分析、计算数据。当通过网络问卷收集完环境工程研究生评教数据之后,要及时对数据进行整理、归纳、分类及统计。然后运用统计学对各个因素进行相关性分析即关注各个因素之间的P 值。如导师年龄和教龄与环境工程研究生评教结果的相关性分析、课程类型和性质与环境工程研究生评教结果的相关性分析、上课时间和时长与环境工程研究生评教结果的相关性分析等、研究生年龄和年级与环境工程研究生评教结果的相关性分析等。由此发现一些规律,得出相关性结果。从数据的角度分析,环境工程研究生评教的结果是比较公平公正和准确有效的。这对导师的教学工作和环境工程研究生的学习及课程设置都有积极的意义。这样才能从根本发现问题、解决问题,使得环境工程研究生及教师从数据的挖掘中受益。

四、情感分析

情感是一种比较特殊、复杂的主观反映,实际上是人的一种感受和表现的过程。情感分析是通过收集评教系统文本框中的数据然后再进行处理、分析的过程。环境工程研究生也是普通人,因此在网络问卷调查中不可避免的会掺杂环境工程研究生私人的情感,而这些情感多多少少会对问卷结果的真实性、有效性和可靠性产生一定的影响。SPSS 具有强大的数据统计功能。当网络问卷调查结束后,先用SPSS 软件对数据进行分析,计算其中位数、极值、均值、标准差、极差和方差等。同时问卷在设置时应涵盖教学的态度、内容、效果和方法这四项。首先要对数据的信度进行检验,如:计算其克隆巴赫系数、标准偏差、偏度和峰度等。其次要进行相关性检验,分析教学的态度、教学的内容、教学的效果和教学的方法这四项之间的显著性P 值,分析他们之间是否有显著相关性。进行情感分析时基本都会运用一些语言工具、数据库等,往往这些语言工具、数据库的出现及编写都耗费了大量的人力、物力和资源等,因此这些语言工具和数据库是具有很高的可信度的,可以选择一个适合实际情况的语言工具和数据库使用。由于资源的有限性,大部分科研院校的评教由研究生学院或者教务处等学校的机构进行承担,这使得可能会出现评教部门呈现出不够专业、思考问题不够全面的问题。因此更要好好地利用基于数据挖掘和情感分析的环境工程研究生评教。

大部分院校研究生评教问卷中最后都或多或少会有文本框,这些文本框往往是让环境工程研究生提出实质性建议。这便给了环境工程研究生更多的评价权利和自由,也更利于学校层面了解环境工程研究生的诉求。文本数据涉及多个方面,同时也有大部分数据信息是不能直截了当看见的,不能只简单的进行分析,在分析时要采用特定的方法、手段分析。对于结果,可以采用SnowNLP 进行分析,除此之外,3GSWLTP,HanLP 等多种分词工具都有一定的可行性涉及了大量的理论和技术,耗费了许多研究人员的心血,可以采用。之所以建议选择SnowNLP 和情感词典的综合运用是因为其准确度是相对较高的。运用情感评分算法,然后用Python 或者java 进行运算。获得的数据要先整理如去掉极值、填补或去掉缺值和删掉孤立点等,然后将所得的数据进行重构继而运用一些工具和模型进行分析计算。

有些时候还可能出现一些毫无价值的数据,如:在文本框中填入无用的符号、数字、字母和错别字,因此数据分析部门还应做好降噪处理。当然情感词典有很多种,如:WordNet、NTUSD、知网的情感词库等。WordNet主要适用于英文的情感分析,中文的话建议使用基于知网的情感词库去发掘评教系统中表达情感的词语。在问卷调查中,情感的表达往往会有一些标志。比如表达情感的词“好”“坏”等;还有程度副词“特别地”“尤其”“不太”“备至”“极其”“不怎样”等;否定词“不”“没有”“未曾”“否认”等;特殊句式;“难道不”等。表达情感的词汇、程度副词、否定词和特殊句式等,在分词工具中得到了关注[7]。这些语言工具和数据库是提高环境工程研究生评教质量不可或缺的一部分。最后基于数据挖掘和情感分析的环境工程研究生评教质量分析的结果最好以图形或者表格的形式出现,方便科研院校的评教部门、教师和学生查看结果;最好还要有导出的功能,方便师生随时随地翻看结果,当然这样也更公平公正。

五、结束语

环境工程研究生评教反馈出某一阶段导师的教学研究生是否能够接受及环境工程研究生是否从中学到想学的知识和技能。环境工程研究生评教受多种因素影响,譬如:课程类型、时长、教师年龄、上课时间和研究生心态等,而且环境工程研究生评教中有许多因素是人为无法控制的。可以运用一些软件,编程语言对数据进行修饰,如去掉极值、填补缺值等进行可靠性分析。

统计数据的部门要利用好环境工程研究生评教这个平台,数据要及时得到反馈。当通过评教系统得到数据后,先通过SPSS 进行简单的分析。然后再进行相关性分析,寻找各个因素之间的相关性。最后利用分词工具、数据库对问卷中文本框中的内容进行情感分析。然后得到基于数据挖掘和情感分析的环境工程研究生的评教结果。导师从中得到实质性建议,适当采用一些适合环境工程研究生教学的方式方法,同时环境工程研究生自身也应该好好学习。希望通过环境工程研究生评教该平台,环境工程研究生能获得更多的专业知识,同时动手能力也有所提高。总的来说,数据挖掘、情感分析在辅助教师和学生时,也在研究生评教质量方面起到重要作用。随着时代的进步,环境工程研究生的培养不能一成不变,同时研究生评教及其结果分析也要与时俱进。只有采用科学的评教方式才能得出准确、可信的评教结果,才能真正地保证研究生评教的质量。本评教为环境工程研究生整个评教系统及研究生的培养提供宝贵建议,更加客观、科学和有效,在研究生教学过程中发挥重要作用。

猜你喜欢
评教环境工程数据挖掘
装备环境工程
探讨人工智能与数据挖掘发展趋势
高校学生评教存在的问题及对策
——以川北医学院为例
探讨环境工程工业污水治理中常见问题
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
环境工程中大气污染的处理措施分析
环境工程的项目管理
学生评教的标准化处理
评教,别忘记站在教师的立场上
关于加强网上评教结果科学性的几点建议