芦展华 喻莹 庄甲鹏 杨佳泰 郑世珏
关键词:高校思政课;高校虚拟教师;语音识别及合成;答疑数据库;小雅智能助教平台
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2023)12-0105-04
0 引言
高校思政课是我国落实立德树人根本任务的关键课程,是为国育人、为党育才的关键步骤[1]。2016年习近平总书记在全国高校思想政治工作会议上明确指出:“要运用新媒体新技术使工作活起来,推动思想政治工作将传统优势同信息技术高度融合,增强时代感和吸引力。”[2]
新媒体以数字化为主要特征,呈现出及时性、互动性、共享性等特点,高校思政课程具有内容广泛、理论深刻的特征,因此,借助人工智能的相关技术为高校学生的思想政治教育赋能是一项极佳的选择。2021年北京理工大学在VR+思政课领域率先建成大规模沉浸式虚拟仿真思政课体验教学中心[3]。在美国加利福尼亚大学,JOHNSON W L和SHAW E研发了虚拟教学代理Adele,并成功应用于教授医学专业外伤及肿瘤课程。针对教学问答辅助系统的发展现状,中南财经政法大学的陈宇对实际课堂中获取的数据进行分析处理,为学生提供了问答检索的服务,验证了问答形式对于教学的辅助效果[4]。
针对高校学生对思政课程的问题与建议,笔者进行了走访调查,了解到主要问题如下:高校思政课程内容与中学所学部分重复度较高,思政课大班教学的模式限制师生交流互动,学生学习方法缺乏灵活性。为解决以上问题,高校思政课需要引入新技术、新模式、新方法,故如何设计出高艺术性与高吸引力的智慧课堂成为高校教师积极探索的热点。
对于上述现状,本文尝试将高校思政课程引入智慧课堂新模式,借助语音识别及合成技术,搭载科大讯飞API实现语音交互,通过构建虚拟教师形象,在原有小雅智能助教平台的基础上,设计高校思政虚拟教师答疑数据库,实现了高校思政虚拟教师答疑系统,改变传统的人机交互模式,增强高校思政课程的趣味性及灵活性,提高学生对思政教育的热情和兴趣,打破传统模式下师生交流的时空壁垒,充分发挥高校学生在思政教育中的主体地位。
1 系统的相关技术
1.1 小雅智能助教平台
小雅平台是由教育大数据应用技术国家工程研究中心和华中师范大学共同研发的云端一体化智能教育SPOC 平台,如图1所示,该平台构建了智能问答、知识图谱等多个智能模块,支持伴随式采集教学数据和数据驱动分析。目前小雅平台已完成在华中师范大学、武汉理工大学等多个高校的部署,用户人数持续上升,开设课程4.5万余门,涵盖校内各类教育资源220万余个。小雅平台作为连接师生的智能终端,支持多种教学模式,学生可以借助平台随时随地对课程内容进行学习,教师可以通过平台布置课程任务、分派小组学习等。根据学生的学习情况,小雅平台将学生的学情进行数字化分析并加以可视化呈现,助力学生查漏补缺,加强对知识体系的掌握,同时帮助教师实施精准化差异教学。本文以小雅平台作为研究载体,用新媒体技术提高虚拟课堂的辅助教学效果,让高校思政教育更加智能、便捷。
1.2 语音识别及语音合成方法
本文研究主要涉及智能语音技术中的自动语音识别技术(ASR,Automatic Speech Recognition) 和语音合成技术(TTS,Text To Speech) :语音识别技术主要用于实现让计算机“听懂”人类发出的声音,即将人的音频转换为文本信息的技术;语音合成技术主要用于实现让计算机像人类一样“会说”,即通过机械的、电子的方法将文本信息转换为人造语音的技术。借助语音识别及语音合成技术,使得虚拟教师和高校学生之间的人机交互更加简明快捷,智能语音交互系统结构图如图2所示。
科大讯飞提供了智能语音开发技术的应用程序编程接口(API,Application Programming Interface)。本文将采用科大讯飞API作为语音识别及语音合成的技术支持,将其API直接嵌入整体系统中,当用户使用高校思政虚拟教师系统进行语音提问时,通过网络直接访问科大讯飞平台,调用其语音识别API,将转换后的文本信息返回传递给系统;在系统查询得到正确的回答对话后,再次通过网络访问科大讯飞平台,调用其语音合成API,将回答对话的文本信息转换为音频信息。通过调用科大讯飞API,极大地简化了虚拟教师答疑系统的搭建过程,提高系统整体语音技术的响应速度。
1.3 Okapi BM25算法
系统在数据库中匹配学生问题的正确率是影响系统使用效果的关键因素,匹配正确率的高低将直接影响系统为学生解答的有效性及帮助程度。因此,本系统采用BM25(Best Matching 25) 算法进行学生问题和数据库问答表中问题的匹配。BM25算法多用于搜索相关性的评分,系统使用BM25算法将语音识别得到的问题文本与答疑数据库中的问题文本进行相关性评分,并将得分高于某一预设值的问题视为用户提问的问题,调出其预先存储的答案文本,从而实现系统在答疑数据库中的一次查询。
2 系统总体设计
2.1 系统总体框架设计
本系统总体架构层次设计如图3所示:客户端层用于获取用户信息,互联网层用于提供网络信息。虚拟教师系统依托于华中师范大学小雅平台,其内部共分为四个层次,分别为前台界面层、核心计算处理层、数据管理层和系统信息安全层。其中的数据管理层用于存放各类资源和数据,同时也是對前台用户提交的请求进行响应的区域,是本文的研究重点。
数据管理层可以细分为四个子层:系统数据管理子层用于存储系统自身相关数据,如系统软件数据等;资源管理子层用于将各种资源(原始资源、处理后的资源)和数据等存放在既定的逻辑区域中,以便更好地对各种资源进行管理;问答数据管理子层负责整合并存放所有的问题及其对应的答案,以便后续更好地查询题目;个人数据管理子层存放着学生的个人基本信息等与学生有关的数据[7]。
2.2 答疑数据库设计
MySQL是一种关系型数据库管理系统,其管理的数据库将数据保存在不同的表中,从而增加了速度并提高了灵活性[8]。本文将使用MySQL作为系统后台数据库的管理系统,用于存储大量有关虚拟教师思政课知识问答对话等信息,借助MySQL查询速度快、支持多线程等特点,提高系统的整体性能。
在本文设计的系统中,建立答疑数据库是搭建整个系统的重要环节。系统对学生帮助的程度及有效性,取决于系统的答疑数据库。数据库中的信息越完善,越能真實复现教师的思维过程、解题方法等,进而答疑系统的辅助教学效果越强[9]。
本文整体以高校思政课程知识答疑为背景,故系统答疑数据库主要针对高校大学生思政课程学习内容等方面的情况进行数据库的设计及构造。在建立答疑数据库之前进行相关调研活动,并整合归纳出对应数据模型,设计出如图4所示系统E-R图。
2.3 答疑数据库的建立及系统设计
系统答疑功能主要借助答疑数据库实现,而在答疑数据库构造前,需要先构建知识库。知识库是用于知识管理的一种特殊数据库,能够对相关知识进行有效整合与转化,使知识在答疑数据库内部进行传递和应用。系统想要很好地实现答疑功能,就要兼具以下两个功能:①作为知识的来源;②作为衡量学生知识掌握情况的一个标准。因此,采用有效而统一的结构来组织存储知识、较为完整地表示知识内容,是答疑数据库结构合理、有效性强、覆盖知识面广的前提条件。根据分析,本文在建立答疑数据库前先建立如图5所示的知识库,系统将使用专家模块的知识响应学生行为,并生成相关问题分析。
本文答疑数据库主要针对高校大学生对于思政课程存在的问题进行数据库的设计与构造。通过走访等相关调研活动,设计出高校思政课虚拟教师答疑系统的E-R 图。故系统整体建立一个数据库VRTeacher,该数据库中包含如下几个表:学生信息表、学生行为表、学生成绩表、学习记录表、课程表、知识点表、常用对话表、问答题表、使用记录表。基于对E-R关系图的分析,转化出如下几个关系模式:
学生信息(学号、真实姓名、密码、用户、专业、年级)
学生行为记录(学号、登录时间、登录次数、累积登录时长)
学生成绩(学号、试卷编号、试卷得分)
课程学习记录(学号、当前学习知识点、已学习且通过测试的知识点)
知识点信息(知识点序号、知识点主题、知识点关键词、知识点内容、知识点难度、所属课程)
常用对话(对话编号、对话内容、使用次数、对话关键词)
课程(课程编号、课程名称、课程难度)
课程问题(课程名称、创建者、创建时间)
答疑问题(问题编号、问题内容、问题答案、关键词、所属课程编号、难度、使用次数、知识点编号、问题分析)
如图6所示是问答题表中的两条记录示例,其中:Qno指问题编号,Que指问题内容,Ans指问题答案,KeyWord指关键词,ClassNo指所属课程编号,Deg指难度,Fre指问题使用次数,KnoNo指知识点编号,Anyl 指问题分析。其他表单以此类推,不再一一列举。
2.4 语音调用及实现
本文人机交互多基于语音交互实现,系统的语音调用及实现过程归纳如图7所示:
1) 语音识别
系统通过麦克风采集用户提问的音频;计算机对音频信息进行A/D转换等预处理;之后对采集的音频进行语音信号特征的抓取,提取出反映语音特征的矢量序列;对提取到的矢量序列进行模式匹配,把输入的语音特征同模板库中的模型进行匹配,将最佳匹配对象作为识别结果,得到最终的文本信息[10]。
对于语音识别功能模块,我们选择调用科大讯飞的接口,获取所需应用的Appid 及secretkey,通过在demo.js中的play函数传递所获得的信息取得与科大讯飞平台的对接[11]。调用函数onResults(ArrayList results, Boolean isLast)获取识别后的结果,其中,ArrayList 是语音识别后的结果,isLast 是用于判断识别的文本是否读完的标志变量。麦克风采集音频信息后,将得到的参数通过网络传到语音API分析器中,并将返回的结果放入result的临时变量中,同时将结果做相应的正则表达式处理得到最终的分析结果。
2) 问题匹配
当系统API识别成功后,将转换后的文本传至虚拟教师系统。系统将获取到的问题文本与答疑数据库中的问答表中的问题一一借助BM25算法进行相关性评分,将得分最高的问题作为用户提出的问题,将其答案返回给系统。
3) 语音合成
系统对于获得的答案文本,首先对其进行文本分析,将文本分析得到的参数用于实现韵律控制;从基元库挑选出一个最符合当前韵律要求的候选基元,将其及分析得到的韵律与文本相结合,进行语音合成。
3 系统使用流程
基于系统的整体设计,将高校思政课虚拟教师答疑系统使用流程归纳如下:用户通过浏览器进入Web 端小雅智能助教平台或通过手机、平板等个人终端设备进入小雅App;用户登录自己的账号进入平台,若为首次使用,则需要先进行账号注册;在首页,用户可以搜索或点击进入需要提问的课程;点击页面上“虚拟教师答疑”按钮进入高校思政课虚拟教师答疑系统;用户点击“开始提问”按钮并对问题进行表述;等待片刻,即可听到虚拟教师对于问题的解答。系统使用流程图如图8所示。在系统的使用过程中,用户需确保良好的网络环境,并拥有麦克风及扬声器等设备。
4 系统测试
在系统整体实现后,笔者对各个功能模块都进行了测试。测试结果如下:首先,分别在Web端及An?droid端对小雅平台进行了测试,经十组测试,用户均可成功进入小雅平台并转入高校思政虚拟教师答疑系统。之后,在某一特定条件下(带宽10Mbps,较标准普通话,音量高于45dB,输入语音长度为2.5~4.5s,噪音低于25dB) 测试了本系统的语音识别和回答响应时间。测试结果如图9所示:共进行十组实验,横坐标表示实验组数(单位:组),纵坐标表示实验测试所得时间(单位:秒)。由十组测试数据计算可得,系统平均语音识别时间为0.84687s,平均响应时间为1.55293s。
最后,对答疑数据库的匹配效果进行测试,从三个渠道(高校教师提供、高校学生提问、网络随机查询)随机选取了共计200道思政题目,经测试,系统对这些题目的匹配正确度可达96%。综合以上测试,系统及答疑数据库设计基本符合预期效果。
5 结束语
随着科技的进步及教学需求多样化的发展趋势,如何使用现代科学技术助力教育发展是一个值得研究的问题。本文采用科大讯飞的语音交互技术,依托于小雅智能助教平台,在前期调研的基础上设计并构造高校思政课程虚拟教师答疑对话数据库,最终实现了高校思政课虚拟教师答疑系统,借助互联网+教育调动高校学生学习思政课程的热情,助力高校学生思想政治教育“活”起来。