范永全 李显勇 杜亚军
关键词:自然语言处理;多元考核;OBE;项目驱动;教学改革
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2024)03-0133-03
0引言
随着互联网和社会媒体的快速发展,网络文本呈爆炸性增长,为自然语言处理提出了巨大的应用需求。同时,自然语言处理研究也为人们更深刻地理解语言的机理和社会的机制提供了一条重要的途径,社会对具备自然语言处理能力的人才的需求日益迫切。作为人工智能的支撑技术,自然语言处理(NaturalLanguage Processing,NLP) 在机器翻译、智能客服、信息检索等领域具有广泛应用,需要大量具备NLP技术的人才来推动相关领域的发展[1]。目前,很多高校和科研院所都开设了自然语言处理课程,对“自然语言处理”的教学模式进行探讨[2-6],已成为当前高校计算机和人工智能及相关专业教学体系和人才培养工作中的改革重点。
成果导向教育(Outcomes-based Education) 是指基于学习产出的教育模式[7]。OBE理念强调学生取得的成果,提高学生学习的积极性和主动性,把所学知识转化为实践能力。本文旨在探索基于OBE理论的自然语言处理课程教学改革的途径与实践。通过在现有基础上,引入基于深度学习技术的项目实践,制定以团队授课、多阶段、多元化考核的目标驱动的教学模式,使得学生在掌握理论知识的同时,提升学生的实践能力和创新能力。
1 教学现状分析
西华大学是四川省属重点综合性大学,学院建有“计算机软件与理论”四川省重点学科和“智能技术与系统”四川省高校科研创新团队,长期以来开设研究生“自然语言处理”和“社会网络与计算”课程,培养了不少人工智能方向的高层次人才。随着社会对智能信息处理人才的需求不断增长,对自然语言处理课程的教学改革势在必行。传统的自然语言处理课程教学存在一些问题,如教学内容滞后、教学方法单一等,需要进行改革与创新。
自然语言处理是计算机科学与技术专业大数据与人工智能方向硕士研究生的学科专业课,主要从计算机科学的角度出发,研究用计算机来理解和生成自然语言的各种理论和方法,属于人工智能领域的一个重要甚至核心分支。该课程传统以课程讲授为主,这种教学模式存在理论与实践脱节、教学内容陈旧、教学方法单一等问题。学生往往难以将理论知识应用到实际问题中,导致应用能力不足。具体来说,传统教学模式存在的主要问题分析如下:
1) 课时分配少,研究内容多、授课难度大。自然语言处理课程涵盖了绪论,概率统计与信息论基础、语料库语言学,形式语言与自动机、语言模型、词法分析、句法分析、语义分析,以及包括文本分类、信息抽取、情感分析、问答系统、对话系统、阅读理解等在内的NLP应用,但教学计划只有32课时,难以深入覆盖所有研究内容。
2) 学生基础参差不齐,学习效率低。由于大数据和人工智能的关注热度,有不少学生是跨专业报考计算机与软件工程专业,专业基础和编程能力薄弱,难以在短时间内掌握相关知识。
3) 课程教学与研究实践脱节。由于导师不参与课程教学和考核,授课教师难以顾及每个学生的具体研究方向,课程大作业与导师方向没有关联,导致大作业没有针对性而同质化。
针对以上问题,笔者为自然语言处理课程引入OBE教学模式,紧紧围绕“ 以学生为中心、产出导向、持续改进”进行教学设计,建立一套有效的教学方案与考核评价体系。
2 基于OBE 理念的课程教学改革
OBE 教学模式通过培养学生的学习能力、创新能力、团队协作能力以及分析问题、解决问题的能力来提高教学质量,以培养对社会有用的创新型技能人才。具体来说,通过以下几个方面进行自然语言处理教学改革。
2.1 倾听学生需求,关注学生发展
通过调查研究和讨论,了解学生对自然语言处理课程的期望和需求。通常,学生对专业方向和未来的就业比较感兴趣,在课堂上可以联系人工智能专业广阔的发展前景,相对较高的薪资水平,NLP算法工程师平均薪资,以及人工智能专业需要具备的素质和专业技能这些话题进行举例和讨论,激发学生的学习兴趣和主动性。
营造积极互动的学习环境和学习氛围,鼓励学生之间的合作与交流。通过小组讨论、项目实践等方式,激发学生的创新思维和团队合作能力。针对学生的兴趣和特长,设计灵活多样的教学内容,采用项目驱动[2,6]进行实践教学。在课程开始之前,按照当前NLP领域的研究热点,把选课的学生分成7个小组,每组2-3名同学,协作完成一个自然语言处理的综合实践项目。部分项目如下:
1) 序列标注方法研究
2) 實体关系抽取方法研究
3) 推荐系统算法实现
4) 事件抽取方法研究
5) 知识库问答系统研究6) 知识图谱构建研究7) 文本情感分析方法研究
2.2 激发学生的学习兴趣和主动性,培养学生的实践能力和创新意识
通过结合具体案例和学生所选的实战项目,引导学生主动探索独立思考、查阅资料,提出解决方案,进行课内讨论、并由学生独立实现,其中,优秀方案和成果可以整理成论文发表。通过引入有趣的应用场景和挑战性的项目,定期检查项目进度,解决遇到的难点,在学生中形成奋发向上的氛围,激发学生的学习兴趣和动力,培养解决问题的能力。
在教学过程中,采用案例引导进行启发式教学。比如,在介绍自然语言处理的应用领域时,可以列举日常生活中的案例,让学生来回答是什么应用。比如,微信的语音转换成文字(语音识别、语言模型),公交自动报站(文语转换)、垃圾邮件筛选(文本过滤)、小学生作业拍照批改(文本识别)、命题作文(文本生成)、产品说明书文字提取(信息抽取)、汽车辅助驾驶(语音识别、对话系统)……。通过这些案例的引入,让学生思考自然语言处理在日常生活中的实际应用,激发学生的学习兴趣。
通过实践项目和案例分析,培养学生的实际应用能力。鼓励学生自主设计和实现自然语言处理系统,提升他们的创新意识和问题解决能力。
2.3 引入最新的研究成果和技术,及时更新教学内容
在教材方面,选择中国科学院自动化所宗成庆研究员编写的《统计自然语言处理》[1],这本书是国内NLP领域的经典教材,介绍了自然语言处理的基本原理和常见应用,如情感分析、文本生成等。除了学习教材中的经典内容,还应引导学生理解深度学习技术在自然语言处理中的作用和优势。特别是随着人工智能模型的发展,预训练模型、强化学习、对抗训练网络、图神经网络等前沿算法驱动了一系列新兴的NLP 技术。通过引入最新的研究成果和技术进展,介绍先进的模型架构、算法和工具,让学生了解最新的自然语言处理技术,并引导他们参与相關研究。
随着以ChatGPT为标志的大模型的问世,开辟了人工智能的发展的新纪元。大型语言模型(LLM) 的出现为NLP的研究带来新的机遇和挑战,也产生了值得研究的新方向:
1) 随着大模型积累的数据不断增加,呈现出与以往统计学习模型、深度学习模型、预训练模型不同的特性,从而需要对大模型的基础理论进行深入研究。
2) 大模型往往包含数以亿计的参数,对计算和存储的成本消耗巨大,如何建设更加高效的分布式计算体系是一个值得研究的问题。
3) 目前预训练模型已经得到了广泛应用,但真正使用大模型的研究占比并不高。其原因在于,尽管已经有很多的大模型开源框架,但是对于计算能力薄弱的研究机构来说,如何将大模型高效适配到具体应用场景是亟待解决的问题。
2.4 利用多媒体技术和在线资源,丰富教学方法与手段
结合OBE理念进行教学设计[7],其教学模式的组织如图1所示。课前发布教学资源供学生预习,课堂采用师生互动的参与式教学,引导学生参与课堂活动,课后发布在线测验或课后作业引导学生进行知识巩固和拓展,并通过微信、QQ群进行线上答疑。在教学资源方面,除了使用教材配套的PPT之外,还向学生引入学堂在线,中国大学慕课等平台中优秀的网课资源,如西湖大学的“自然语言处理”,北京理工大学的“机器学习”、浙江大学的“知识图谱”等在线教程。
为了深入地学习某一具体任务,如“知识图谱问答系统”,可引导学生参照B站相关视频,通过展示视频,提供直观的学习材料和实践环境,帮助学生更好地理解和应用知识。提供实践项目和团队合作任务,让学生通过实际操作和合作解决自然语言处理问题。培养学生的团队合作精神和实践能力,提升他们的综合素质。
2.5 设计多样化的评估方式,完善考核体系
针对传统课程考核方式存在的问题,制定了团队授课和导师参与的多元化的评估方式,包括文献综述、单元测验、算法实验报告、项目展示、小组讨论等。通过综合评估学生的理论掌握、实践能力和团队合作能力,全面了解他们的学习成果。在西华大学硕士研究生培养方案中,本课程为2学分,32学时。每个章节的学习结束后,按照教学计划进行单元测验、算法实验或大作业,按照每个单元评分比例核算最终成绩。课程总成绩由三部分构成:即平时成绩(20%) 、实践环节(30%) 和期末考试成绩(50%) 。其中,平时成绩由课堂表现(50%) 、单元测验(50%) 构成。课堂表现包括出勤、课堂提问、课堂练习等。实践环节可以根据章节内容,选择文献综述/算法实验报告/项目报告的方式,由负责该模块的教师灵活把握。
如表1所示为课程的教学日历安排及考核方式设置,课程教学团队由三位老师承担,每人负责若干相关的单元,通过多阶段、多元化考核和多人参与授课的方式,弥补了期末考试/大作业考核方式中存在的单一考核模式。通过团队教学+导师参与的方式,引导学生进入自己感兴趣的研究领域。利用单元测验+项目报告的方式,使得学生同时掌握理论原理和算法实现能力。对于编程能力,由于每个学生的入学基础不同,要求其通过自学的方式巩固Python编程和机器学习,在完成算法实验/项目实训的过程中提高编程能力。
3 教学改革的成效与反馈
通过两届研究生自然语言处理课程的教学改革探索实践,基于OBE理念的教学思路明显提高了教学质量,课程改革得到了学生普遍的认可。主要体现在:
1) 学生能够在研一下学期根据项目实训的大作业为背景,撰写学术论文。以2022级为例,在11位选修该课程的同学中,有6位有论文投稿,其中1位同学的论文“基于信息集成的意图识别和槽位填充联合模型研究”已被《计算机应用研究》录用。
2) 鼓励学生团队在合作完成项目实训任务的基础上,积极申请软件著作权。其中有学生在完成了项目实训任务后,成功申请了名为《知识图谱问答信息检索系统》的软件著作权。
3) 通过对学生进行问卷调查与座谈,有90%的学生认为课程安排及考核体系合理,有助于调动其积极性,有80%的同学认为课程改革有助于申请到头部企业的实习机会,有40%的同学有意继续在课程某个方向进行深入研究和论文选题。
4 结论
基于 OBE 教育教学理念自然语言处理课程教学和学习方法,更加符合人们的认识复杂事物的规律。通过改变以往的教学方式,更新教学方法,以学生为中心,设定教学内容和学习目标,结合学习成果多样化评估模式,激发了学生的学习积极性和主动性。通过以上教学方案和考核措施,基于OBE理念的自然语言处理课程教学改革可以更好地培养具备实践能力和创新意识的人才,满足社会对智能信息处理人才的需求。教师在教学过程中要注重学生的主体地位,建立积极互动的学习环境,多样化评估学生的能力和素质。同时,不断总结经验、修正不足,实现教学改革的可持续发展。
【通联编辑:王力】