文学课程兴趣影响因素的关联规则分析

2017-04-11 08:08岳俊辉梁宝华
合肥学院学报(综合版) 2017年1期
关键词:置信度关联规则

岳俊辉 , 梁宝华

( 1. 合肥学院 外国语言系,合肥 230601; 2.巢湖学院 信息工程学院,合肥 238000)

文学课程兴趣影响因素的关联规则分析

岳俊辉1, 梁宝华2

( 1. 合肥学院 外国语言系,合肥 230601; 2.巢湖学院 信息工程学院,合肥 238000)

依据问卷调查所得数据,借助 Apriori 算法,筛选影响学生文学课程兴趣的关联规则,结合当前文学教学现状进行规则分析。规则表明:对选读的处理方式、教材选编的时空维度以及评价方式对学习过程关注度等与课程兴趣最为相关。对规则的分析可知,可以利用以对位阅读法处理选读内容、以跨文化交流视野统领教材编写、以形成性与终结性评估相结合的认知诗学路径构建评价体系,来提高学生的课程兴趣。

Apriori 算法;关联规则;英美文学

关联规则挖掘技术用于发现数据库中各属性之间的关联。对于文学课程兴趣,关联规则的问题定义举例如下:是哪些因素在多大程度上影响了学生的课程兴趣呢?与这些因素相关的因素又有哪些呢?本文利用 341 份问卷收集到的数据,采用 Apriori 算法,进行数据挖掘,以期发现影响学生课程兴趣的强关联规则,进而对文学教学提出有效建议。研究成果对于了解影响学生文学兴趣的因子,透视当前文学学科教学现状,促进学科教改具有重要理论和现实意义。

1 关联算法及模型构建

1.1 Apriori 算法

关联规则算法是现代数据挖掘的重要方法之一。关联规则最早由 Agrawal、Imielinski和 Swami 等人提出,其本质就是研究一种现象对另一种现象的产生有多大的影响力。[1]如文献[2-4]都研究了关联规则如何运用于教学评价中。一般把满足设定参数要求的规则称强关联规则。

Agrawal 等人于20世纪90年代提出经典 Apriori 算法,本文借鉴此算法,采取广度优先逐层迭代搜索的方法,先找出频繁 1 项集,再利用频繁 1 项集找到频繁 2 项集,依次迭代,直至找不到频繁项集。Apriori 算法会产生大量候选集,需进行有效剪枝。改进算法[5-6]的一个基本途径是设置合适支持度和置信度作为筛选条件。支持度(Support)即是规则A⟹B的支持度表示项集A与B同时出现的频繁程度,即整个交易集U中A、B同时出现的概率。置信度 (Confidence) 用来确定A出现的事务中包含B出现的概率,即Confidence(A⟹B)=Support(A⟹B)/Support(A)。实施任务前,通常先规划任务路径,建立可行性模型。模型的好坏直接影响挖掘的效果。

1.2 模型构建

为了关联规则挖掘模型分四步着手:数据收集→数据挖掘→规则解释→实践应用。在具体实施过程中,要使挖掘结果更有价值,数据的真实、客观尤为重要。而且原始数据通常不能用算法直接处理,必须根据算法的具体要求,进行必要转换。之后再选取相应规则,进行合理解释。结合历史数据的分析结果及相关经验,指导文学教学未来工作方向。结合文学课程及兴趣取向的特点,初步建构模型,如图 1 所示。

图1 英美文学兴趣关联规则挖掘模型

2 数据搜集和挖掘

2.1 数据搜集

数据搜集邀请了合肥学院、铜陵学院、巢湖学院、安徽理工大学、东华大学、湘潭大学等 6 所高校英语专业的学生参与,共产生有效问卷 341 份。问卷设计涉及文学教学的各个方面。以“教材选用”为主,设置了“教材的偏好”“内容的包含”“文体的类型”“教材的编排线索”等 13 个子问题;其次是“教学方法”,包括“教学方式选择”“教学过程细节”“课堂语言选择”“关注重点”等 8 个子问题;问卷还涉及“阅读体验”“对教材的兴趣及原因”“其他选读作品类型”等 4 个子问题,“评价方式”中涉及“目前采取的评价方式”等 3 个子问题,以及“对课程兴趣”的“感兴趣程度”“不感兴趣的主导因素”等 2 个子问题。然后将数据进行转换,导入到 sql server2010,完成数据准备工作(见表1)。同时通过文献搜索、学生访谈、教师专访等方式获得相关资料,以备参照。

表1 数据预处理结果

2.2 挖掘及规则形成

数据收集后,进行离散化、去噪等预处理,用 VS2012 实现关联规则挖掘。设置最小支持度为 0.2,最小置信度为 0.83 的阈值,可产生 500 多条规则。依照所得百分比来筛选典型的强关联规则,可见在影响文学兴趣的原因中 30.8%认为是教法问题,27.8%认为是教材问题,17.6%认为是考核方式问题。具体挖掘结果如表2所示。

表2 部分挖掘结果

(因篇幅缘故,表中表述在不影响原意的情况下作了简化。)

3 规则分析

3.1 规则 1

规则 1 表明,对传统的教学模式失去兴趣,又关注选读的学生中有 30.8%选择对文学课程有点兴趣,置信度为 0.875。对课本+多媒体辅助的教学模式有兴趣,又关注选读的大概解释和文化内涵的学生中也有 30.8%选择对文学课程有点兴趣,置信度为 0.845。学生最不喜欢的教学模式就是文学史+选读,占 35.7%,最喜欢的是课本+多媒体,占 41.3%。可见教学模式和手段以及处理选读的方法与文学课程兴趣的关系密切,但前两者均不及选读重要。且在所得所有规则中,涉及此项的关联规则有 122 条,达到 39%。

所以,一方面,选读是文学教学的重中之重,占有教材的主要篇幅;另一方面,现代网络视频技术的使用也是盘活课堂教学的重要手段。如此,应怎样处理选读内容呢?首先要利用现代技术手段使文学课堂活起来,通过网络视频、电影、QQ、微信等赋予文学作品以图像和声音,使学生直观感受文学的魅力。其次要重视选读的处理。规则表明,学生更期待选读所蕴含的思想文化内容。所以,语言基本要点不应是选读的重点,而应是语言符号所蕴含的文化、政治、经济、社会等含义。考虑到学生所处的本国文化空间,选读可借鉴萨义德的对位阅读法,比照中外文化意识、原发语境与现实语境的异同,以“中学为体,西学为用”为基本思路,构建意义的拓扑空间,从而激发学生的课程兴趣。

3.2 规则 2

本规则中,选了前三项的人中有 20.1%人选择了最后一项,置信度为 0.865,即教材的内容如果古典和现代的作品相结合,文学和非文学作品相互融合,且侧重选读内容的思想文化内涵,那么就有 86.5%的学生对文学有点兴趣。

在现有传统的教学模式下,教材的优劣或生动程度对课程的教学效果意义重大。通过规则分析可见,在提供的如作家国别分布、流派分布、类型分许、风格分布等选项下都有超过 50%的学生选择包含型的选项。所得涉及教材的 236 条规则中,有 43.5%涉及到文学类型。所以学生的课程兴趣度取决于教材。教材的的内容需要兼收并蓄,不能仅局限于传统的英国文学和美国文学,由此教材应该具有更为宽泛的选编视野。具体如规则所示,首先应拓展作家作品的选编视野,兼顾除英美之外的英语国家,包括加拿大、澳大利亚、新西兰,甚至南非等。重视文学和非文学作品的结合,融合现代和古典作品,应多关注新生文学表现形式,如通俗文学、网络文学等。开放的多维度的跨文化视野在使教材生动有趣的同时,也照顾到当代读者的独特阅读趣味,由此才能提高学生的课程兴趣,帮助他们实现文化思维的融合和跨越。

3.3 规则 3

“对文学课程有点兴趣,不满单一性评价方式,对选读内容有兴趣”的中有23.2%的人表达了对传统评价方式的不满,置信度为86%。其中,最不喜欢的评价方式有53.5%的学生选择了期末考试或课程论文,他们中有75%的学生对课程没有兴趣。可见,学生的课程兴趣很大程度上受到评价体系,尤其是考核方式的影响。

课程评价实际上是对学生在课程中的表现以及实际学习效果的客观勘定。对学生学习过程和效果的评估是课程评价的应有之义。传统的以期末考试片面地强调效果,这种单一效果论忽略了学生对学习过程的付出,因个体学习能力能方面的不同,可能造成学习付出与效果之间的差异,由此也影响了学生的课程兴趣。改变这一现状,提高评价的合理性和科学性刻不容缓。规则表明,学生不满传统的单一评价方式,如期末考试或课程论文,而对弹性评价表现出兴趣。我们建议,应该以认知诗学为指导构建新型的评价体系。苏晓军[7]曾概括 Reuven Tsur 的认知诗学路径包括:(1)对日常的认知过程进行描述;(2)分析诗歌(文学)是如何对日常生活经验进行修正的;(3)研究这种重组和修正的效果。认知诗学符合过程性评价的要求,“寻找其变化修正的模式”。[8]认知诗学有助于建构一个综合的评价体系。“加强形成性评价,对学生学习过程中的成绩,以及反映出来的认知、情感、态度等方面的进步要进行及时地评价”[9]。具体来说,应该进行过程性考核,加强对章节总结及自主学习的阶段性评价。在学期课程长度范围内,记录学生的文学学习质量结果,进行期初、期中、临近期末三个大致阶段的对照评价,评估学生不断修正学习效果的积极性和有效度。

4 结 语

Apriori 算法有助于发现影响学生兴趣的多因素的作用度,表明教学方法、教材编写、评价体系等是影响兴趣的基本方面。对选读的处理,教材选编的时空范围,以及评价体系建构都对课程兴趣影响巨大。我们提出,以对位阅读法处理选读内容,以跨文化交流的视野统领教材编写,从认知诗学路径来建构过程与目的合一的评价体系。由于以上任何一个方面都可以再具体分成若干研究重点,比如教学方法中的教学模式、教学手段等,教材编写方面的文学史和选读的组合比例、批评理论、编写模式、版式等,所以后期研究要关注这些因素的相互作用机制。

[1] 翁敬农. 数据挖掘教程[M]. 北京:清华大学出版社, 2003: 53-61.

[2] 肖志明.关联规则在远程教育教学评价中的应用[J].中国远程教育, 2012(9): 39-42.

[3] 潘庆先 . 关联规则算法的研究及其在教学评价中的应用 [J].烟台大学学报,2010(2):127-131.

[4] 李静.高校教学管理关联规则挖掘系统设计与实现[J].现代教育技术, 2007(2): 45-67.

[5] 颜跃进,李舟军,陈火旺.基于 FP-Tree 有效挖掘最大频繁项集[J]. 软件学报, 2005(2):215-222.

[6] 梁宝华,蔡敏. 正负关联规则挖掘方法的改进及其应用[J].计算机工程, 2010(16):44-47.

[7] 苏晓军. 国外认知诗学研究概观[J]. 外国语文, 2009(2):6-9.

[8] 姜淑芹. 认知诗学视野下的英美文学教学[J]. 外国语文, 2010(5):118-121.

[9] 孟冬梅.激励式立体化英语教学模式的探究与实践[J].外语电化教学, 2015(1):50-56.

[责任编辑:张永军]

An Analysis of the Interest in British and American Literature Based on Association Rules

YUE Jun-hui1,LIANG Bao-hua2

(1. Department of Foreign Languages, Hefei University, Hefei 230601; 2. School of Information Engineering, Chaohu University, Hefei 238000, China )

By using Apriori algorithm, this paper mainly analyzes factors which may influence students’ interest in British and American Literature from perspectives of teaching method, selected readings in textbook and system of assessment. Association rules show that method of interpreting selected readings, timespan and space in selected reading and focus of the objective of the assessment all affect students’ interest in the course. Thus the paper proposes that selected readings should be interpreted from the perspective of post-colonialism, the compiling of textbook based on cross culture, and the system of assessment established by means of cognitive poetics with both formative and summative tools, so as to arouse students’ more interest.

Apriori algorithm; association rule; British and American Literature

2016-09-28

2016-12-20

2015 年安徽省教育厅人文社科重点项目“爱伦·坡小说文本中的权力话语研究”(SK2015A479)资助。

岳俊辉(1977— ),男,安徽淮南人,合肥学院外国语言系讲师;梁宝华(1973— ),男,安徽巢湖人,巢湖学院信息工程学院副教授。

H319

A

2096-2371(2017)01-0133-04

猜你喜欢
置信度关联规则
一种基于定位置信度预测的二阶段目标检测方法
撑竿跳规则的制定
硼铝复合材料硼含量置信度临界安全分析研究
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
数独的规则和演变
系统可靠性评估与更新方法
“一带一路”递进,关联民生更紧
正负关联规则两级置信度阈值设置方法
奇趣搭配
让规则不规则