冯宝鑫,马炳军
(1.广东外语外贸大学 英语语言文化学院,广东 广州 510420;2.阜阳师范大学 外国语学院,安徽 阜阳 236000)
研究表明,近十年(2009-2018)国内有关“诊断性测试”的研究主要聚焦在大学英语教学和职业英语教学上,有关中学的相关测试研究寥寥无几。调查显示,诊断性测试在中学英语教学中的使用多于研究,远未达到普及的地步,网络环境下实施诊断性测试更是寥若星辰。诊断性测试未普及的原因主要包括:诊断性测试不太适合大规模的测试,但小规模的测试效果比较明显[1];测试的数据收集、整理与分析过程,对任课教师的个人能力与精力都具有很大的挑战性。最近的一份《中国互联网发展状况统计报告》显示,内地手机网民规模达到7.53亿,普及率达到55.5%,超过全球平均水平[2]。调查表明,在校大学生的手机持有率几乎是100%,据此,智能手机的普及为“互联网+诊断测试”提供了可行性技术平台。因此,“互联网+智能手机”技术对该平台可以用于优化诊断性测试进行调查、验证和分析。
诊断性语言测试是诊断学生优势和需求的重要工具[3],其目的是帮助学生更好地了解自己的语言优势和不足,从而帮助语言学习[4]。
多年来,研究者对有关诊断性测试的概念、特点以及意义颇有争议。有的学者认为,诊断性测试的主要特点是查缺补漏,强调其功能性和针对性[5];有的学者把诊断性测试的定义模糊化,同时弱化了诊断性测试的功能性和针对性[6];有的学者则将其定义为“甄别测试”[7],主要用于测试学生的强项与弱项[8]。多数学者认为,诊断性测试可以测出学生的问题与成因[9],同时也可以将诊断结果用于研判和了解学生的理解水平[1]。如 Alderson和 Huhta所说,目前真正的诊断性语言测试相对较少[10]。
总之,诊断性测试具有“小规模、高频率、重反馈、讲效率”的特点。移动互联网终端的升级换代非常快,其硬件的提升和系统的升级都会对测试方法、测试手段产生巨大的影响。目前,尚未发现有互联网+智能手机与诊断性测试结合的可行性研究。且最新研究未提及成果转化的问题,即如何将分析出的数据,直观地转化成辅助教师教学的成果。
(1)高校英语专业的师生对诊断性语言测试的使用情况如何?
(2)高校英语专业师生对通过“互联网+智能手机”优化诊断性测试的接受度如何?
参加本次测试的受试者来自安徽省阜阳师范大学,受试人共44人,其中教师组14人(副教授2人,讲师12人),学生组30人,受试者从高年级学生中通过随机抽样产生。教师组平均年龄38.4岁,男女比例为1:6。学生组平均年龄为20.7岁,男女比例1:4。
本研究通过问卷星实施调查,采用李克特量表制作问卷。问卷设计的选项分别从“非常同意到非常不同意”,计分从 A-E(1、2、3、4、5 分),每个问题的选择频数和百分比,见表1。
表1 问卷1-7题教师组(T)和学生组(S)各选项的选择频数(N)和百分比(%)
问卷共十项,包括7个封闭式问题 (单项选择)和3个开放式问题(简答题)。问卷1-5题考查对诊断性语言测试的理解和使用,旨在了解高校师生是否参加过该测试,效果如何以及是否愿意频繁使用。问卷6-10题则关注优化方案,包括对智能手机使用的可接受度和对于手机软件在设计和使用上的期待。在开放式问题中,受试者被允许用中文或英文在简答题中表达自己的观点。答案被输入计算机进行词频分析,词频较高的关键词将会被重点分析。调查共获得有效问卷44份。通过加密功能,只有收到密码的受试者才能通过智能手机打开并填写问卷。这既保证了数据的真实性,又提高了数据收集的效率。
数据分析主要是教师组和学生组数据的对比分析。总分是指每组受试者的相应分数相加得到的分数。“非常同意”得1分,“非常不同意”得5分,那么分数越低,表示认同程度越高。平均分由总分除以样本量得到,反映了某一组的受试者对某一观点的态度。数据的处理结果,见表2。
表2 教师组(N=14)和学生组(N=30)对问卷各题的总分(S)和平均分(P)
对比两组的平均分发现,两组在有效性、使用频次和使用手机作为测试工具的问题上差异较大,对难度和手机APP的接受程度上的差异较小,态度趋于一致。通过两组对比分析发现教师组认为诊断性语言测试是有效的(1.9分),但学生组对此持消极态度,平均分接近4分。
通过表2中两组参与者的平均分可以发现,学生组对诊断性语言测试的理解较差,学生对该测试的接受度较低。而教师组数据显示,了解并接受该测试的教师群体对高频次地使用该测试表示担忧,因为传统的诊断性测试耗时费力。调查显示,在教学中使用智能手机作为教学工具的问题上,教师的态度非常积极,而学生却持中立态度。
问卷中1-7题为师生两类受试样本评估工具的一致程度的百分比(见表2),数据精确到小数点后一位数,四舍五入。学生组数据针对开放式问题的词频分析表明,对于高频次使用诊断性语言测试的弊端,回答中词频最高的单词是:time(17次),这说明师生非常关心频繁的测试会占用大量的时间。关于“课堂上使用智能手机的弊端”,词频较高的是:“game”(22 次)和“control”(20 次)。由此可见,手机的娱乐功能控制成为师生关注的重点。软件设计期望方面,可总结为:具有娱乐软件屏蔽功能,操作页面简单,没有广告,保护隐私,这些建议充分反映了师生的关注点,颇具参考意义。我们要控制每次测试不超过5分钟,做到针对某个具体的知识点进行有效测试。如何让学生在课堂上有序地使用智能手机,有效屏蔽社交和游戏功能是优化方案成功的关键,这些建议对于未来的软件开发是有价值的。
通过问卷调查分析,本研究从现状、设备、动机、频次四个方面得出如下结论。
从现状看,学生对诊断性语言测试的了解程度不高,接受度更低。数据显示,认知状态与可接受性呈正相关,即对测试的理解越多,越容易接受使用测试方法,形成良性循环。因此,教师应加强对该测试的介绍,让学生了解诊断性语言测试的概念。
从设备上看,智能手机在师生中的普及率非常高,已经具备了作为测试工具的基本条件。但在功能上,其社交功能和娱乐功能已成为师生共同关注的问题。在测试过程中开发针对社交软件和娱乐软件的屏蔽功能,简化测试软件本身的操作是非常重要的。
动机方面,教师有较强的使用动机,但影响学生动机的消极因素依然存在。访谈表明,受先验知识影响,学生本身讨厌考试,尤其是频繁的考试。因此,对诊断性语言测试的不了解和偏见极大地影响了该测试的推广。同时,多数同学担心测试数据泄露、测试时间过长等,数据保护和时长控制问题应当引起足够的注意。
在使用频次方面,由于诊断性测试的灵活性和时效性,提高频度是优化评估的关键。因此,如何解决师生对效率的关注,提高一线教师使用诊断性语言测试的频率是优化的重中之重。与此同时,大多数教师愿意尝试用智能手机优化该测试。对于人们普遍担心的手机会分散学生的注意力问题,设计人员在开发软件时需要给出相应的对策,增加社交软件的拦截功能。
总之,调查反映出诊断性语言测试在英语教学的师生中使用情况并不乐观,普遍的情况是师生对该测试模式“不会用、不敢用、不能用”,而传统的测试模式难以解决师生双方的顾虑。诊断性语言测试要想普及,必须进行优化。
测试工具的升级是诊断性语言测试优化的基础。首先,智能手机体积较小,便于学生上课时携带并使用。其次,智能手机具有传感器丰富以及数据传输方式多样的优点,教师可以使用多种形式呈现诊断性测试的内容如设计语音题、看图题等,并通过网络发布、接受、处理测试数据。再次,其具有开发环境成熟高效,数据处理能力较强的优点,可以同时处理大量的数据。此外,智能手机可以处理和呈现图片并播放视频,为数据分析的可视化提供了基础。因此,智能手机具备成为优化诊断性测试的教学用具,测试的形式也可以基于智能手机的特点进行相应的开发。智能手机和互联网技术的新特点新功能,将成为优化的基础条件。
优化的内容即改善“教育数据”的输入、处理、输出、反馈过程。本研究所引述的“教育数据”的概念为其狭义定义,即为“学习者的行为数据”,具体到诊断性测试中,应为“被测试者在测试中使用互联网终端的行为数据”。
教育评价正在从“经验主义”走向“数据主义”,从“宏观群体”评价走向“微观个体”评价,从“单一评价”走向“综合评价”[11]。优化后的分类,将更加具体到个体,进行精确分析。现举例说明传统的数据收集和优化后的数据收集的对比:如对“定语从句”进行多次测试,在初始数据方面,传统模式只能收集学生的姓名、学号,而优化模式可以确认某生对“定义从句”的以往答题情况,进而生成个性化试题。在时间数据和内容数据收集方面,优化模式可以收集每道题的答题时间,以此判断熟练度并对所涉知识点进行归类分析。优化模式还将追踪个体的单项平均分、错误率等具体数据,在这些方面传统模式无法做到。总之,优化模式将使得测试走向个性化,并且将会更加具体地描绘以个体为单位的知识掌握情况。
目前普遍认可的处理方法是由Fayyad设计的“多阶段处理模型”。优化后的数据处理,面对的是互联网终端收集来的大量而全面的数据,因此需要优化的是“数据的筛选”和“相关数据的匹配”,排除对测试目的没有帮助的数据[12]。
高校师范生基本上没有受过数据分析方面的培训,缺乏对复杂的数据进行量化分析和解读的能力[13]。考虑到由于个体差异会导致解读结果的极大不同,我们需要帮助教师把数据可视化。以初高中阶段常见的单项选择题为例,每题有四个选项,有且只有一个正确选项,答对一题的概率是25%,那么选项的干扰程度E:E=N1/N2(N1:某选项的错误人数N2:该题的正确人数)。当E≥1时,相似度很高;当E≥0.8时,相似度较高;当 E≥0.5时,有一定干扰;当E≥0.2时,干扰度很小。据此,系统将可以识别干扰度高的选项,并直接告知教师哪些选项间干扰度较高,需要重点讲解。这样就解决了教师在讲评试卷过程中,仅仅依靠经验或粗略的统计,对不同的题目给予不同的重视程度的现象。
测试工具方面,将传统诊断性测试中使用的纸质版试卷替换成学生自行携带的智能手机,教师通过专门为诊断性测试开发的应用软件(推荐使用Android Studio)进行试题编辑,并在每一课时结束时利用网络发布。测试形式以选择题为主,可出现适当的填空题。简答题的答案难以用互联网终端进行分析。同时,教师应加强思想引导,在鼓励“手机进课堂”的同时,强调课堂纪律。教室可设置网络屏蔽设备,在有需要的时候开放网络,在其余时间屏蔽网络信号,将负面因素降到最小。
测试设计上,做到内容扁平化,只设立一级菜单;测试以选择题为主,方便概率的分析;测试可以增加图片、音频及视频,充分发挥智能手机的优势;测试时间不宜超过5分钟,保证手机的续航能力和学生的注意力;在测试软件运行时自动屏蔽聊天和娱乐功能,一旦学生主动退出答题界面,则系统需要有相应的对策以阻止学生将注意力转移到娱乐软件上,以此将手机测试的弊端降到最小。
在优化的过程中,我们需要建立多个数据库,包括学生数据库——学生英语能力信息卡;测试项目数据库——为每个知识点准备几个问题。教师只需选择考试知识点的名称即可自动显示相应的问题;测试结果数据库——统计每个知识点的错误率,为期末如何更好地进行成绩测试提供建议。在数据分析和优化方面,应该更加具有实用性,为教师的教学改进提供直观的建议而非仅仅提供数据。教师不应成为数据的解读者,而应该成为数据分析成果的使用者。
在优化测试数据的量化分析方面,一是加入鉴别指数法和难度系数法相结合的分析方法,对测试总体进行量化分析,同时加强选项间相似度的量化分析,设置干扰度E,当E≥1时,相似度很高;当E≥0.8时,相似度较高;当E≥0.5时,有一定干扰;当E≥0.2时,干扰度很小。数据可以直观化,即测试系统不用给教师发送枯燥的数据而是直接给教师的教学活动提供指导意见。
研究发现,诊断性语言测试在英语专业没有引起足够的重视。数据表明,高年级学生普遍不了解该测试,而教师在教学中几乎不运用该测试方法。尽管该测试被认为是有效的,但操作上存在诸多困难,难以被高频次应用。因此,利用新平台新技术对诊断性测试进行优化,才能真正促进该测试的普及。研究显示,师生普遍接受把智能手机、互联网技术融入该测试的设想,但关键要解决好娱乐社交功能对教学活动的负面影响。
诊断性语言测试在英语教学中长期处在“明知有用,但不能用”的境地。只有真正解决教师的困难顾虑,提高使用的效率效果,才能促进诊断性语言测试的普及。互联网技术和手机的普及为问题的解决带来契机。在此基础上,我们要进一步深入挖掘诊断性测试与互联网技术的可能性,设计相关的手机软件,在理论与实践的结合过程中不断磨合完善,让诊断性语言测试真正融入教学,辅助教学,促进测试领域的改革。