中国医学科学院医学信息研究所(100020) 胡红濮 雷行云 栗 佳 魏路通 张爱超
1.题库概念与发展
智能题库[1](item bank)是以一定的教育测量理论为基础,按照测试目标收集编制的量多质优、附有试题参数并经过分类编码的题目的有序集合。它通过相应的数学模型对试题进行多项性能指标分析,选出符合要求的优秀题目,并能够按照要求调出所需试题,最终按规定的条件组合成卷[2]。
我国的题库建设与国外相比起步较晚[2],针对卫生统计学学科特色智能题库的研究较少。已有卫生统计学智能题库研究,多为关注在线教学平台搭建[3]、组卷功能[4]或试题建库流程[2]等单个环节的研究,尚缺乏对卫生统计学学科智能题库构建及功能设计的系统性研究。
2.题库建设的重要性
在传统教学考核方式中,教师需要花费大量的时间根据教学大纲的要求对试题进行甄别、筛选,确定试题标准,完成试卷编排。智能题库的建立,可以帮助教师从题库中快速寻找合适的试题,通过输入简单的参数,由题库智能组卷,从而节省命题时间、提升出题效率和试卷质量[5]。
1.试题库分析
卫生统计学智能题库需建立在课程教学大纲基础上,按照教学目标设计。本题库的建设中参考了姜晶梅教授主编的《医学统计学基础》等15本优秀教材和教辅资料及其衍生试题、部分重点大学历届考试中总结的优秀试题、教师总结科研实际数据案例的试题等[6]。题库建设过程中对每道题的元数据进行标记,包括:所属章节、难易程度、要求掌握的水平、对应的知识点、参考答案、分值参考等。目前在卫生统计学课程中,常用到的题目类型包括:名词解释、判断题、选择题、填空题、简答题和计算分析题等。智能题库根据不同的题型设置不同的格式进行储存,并设置对应参数。
2.试卷分析
应用智能题库组卷应考虑到试卷的信度、效度及区分度,即被测试者在测验中的实测值与其真实能力的一致性,考试内容是否能有效地测量学生的知识和能力,以及试题对学生不同掌握水平的区别能力[7]。因此,在组卷时,智能题库需注意以下几点:试卷范围和内容,各知识点题目及分值占比;不同难易程度,题目所占比例;不同题型所占比例及分值;题目排序,考虑到学生答题心理和答题习惯,题目排序应先易后难,分析计算题靠后;降低重复率,尽量避开往届出过的题目[8]。
3.系统管理分析
用户管理与系统日常维护是题库不可缺少的部分。其中,用户管理方面需要对用户进行身份验证,进行用户的添加与删除,不同身份的用户设置不同的权限,并提供密码验证与修改,从而加强系统的安全性和试题内容的保密性[8]。
本研究智能题库设计主要采取模块化的设计方法,根据不同的功能来进行模块划分。面向的用户类型主要为:系统管理员、教师、考务人员和学生。主要包括的模块有:试题配置模块、题库管理模块、试卷管理模块、在线考试模块、评卷模块以及用户管理模块[8-10],系统功能架构如图1所示。
1.基础题库建设
基础题库建设,主要功能是形成所需的试题资源,在建设智能题库过程中把优选的试题通过批量导入途径生成基础题库;题库建设者将汇总的试题根据教学目标,进行去重、归类、选优、重新设计并标记相应参数,完成基础题库的建设。
2.试题录入
该模块面向用户为课程教师,其功能包括:
(1)手动录入
系统针对每种题目类型,设置相应的试题模版,并定义好必要的元数据项。教师通过选择题目类型,在系统内置的试题模版中手工录入试题及元数据,系统检索基础题库,并显示类似题目,教师通过比对填写相应标签,经系统逻辑校验审核后存入数据库中。
图1 系统功能架构图
(2)自动生成试题
①半自动生成。半自动生成功能一般用于选择题、填空题、判断题等客观题,教师需要先按照手动录入的方式录入试题,并在原有正确和错误选项的基础上,额外增加一些选项。系统能够在原有选项的基础上,根据该类题型的构成规则生成试题,经系统逻辑校验初步审核后,存入题库数据库中。
②基于人工智能的全自动生成。教师首先在系统中录入学生所需掌握的知识点,知识点可以包括概念、定义、公式、统计方法等多种形式,并对该条知识点的元数据进行定义,包括所属章节、重要程度、掌握程度、知识类型等。软件利用内置的词库和分词算法,自行对知识点进行自然语言处理,形成计算机可读取、可理解、可分析的卫生统计学知识库。随后,教师通过选择某条知识的考点,并设置题目类型、所属章节、难易程度等基本参数,系统读取知识库中的相应内容,利用内置的人工智能算法,自动生成对应的题目。自动生成试题流程示例:
Ⅰ教师录入一条概念型知识“在抽样研究中,当样本例数逐渐增多时,标准误逐渐减小。”
Ⅱ系统通过切词算法,对该条知识进行分解,并标记可供选择的考点。
在抽样研究中,当样本例数逐渐增多时,标准误逐渐减小。
Ⅲ教师选择“标准误”考点,并设置题型为选择题,系统根据内置词库和算法自动生成考题。
“标准误”在词库中的关联概念为“标准差”;(易混淆概念)
“逐渐减小”在词库中的关联概念为“逐渐增大”;(反义词)
系统自动生成如下题目:
在抽样研究时,当样本例数逐渐增多时( )
A.标准误逐渐减小 B.标准差逐渐减小
C.标准误逐渐增大 D.标准差逐渐增大
3.题库管理
该模块面向用户为课程教师,其功能包括:
(1)试题浏览及查询
教师可以浏览题库中的题目,题目对应属性,及相应参考答案。同时,通过对题目参数进行编码,可以查询不同属性对应的题目。例如每道题的前4位数0101为第一章第一节。
(2)试题编辑
通过该功能,教师可以对题库中本人添加的试题内容和元数据信息进行删除和修改,并填写编辑理由,提交审核者进行审核后修改、删除操作方可生效。
(3)试题审核
高年资教师、系主任等具有审核权限的教师可对其他教师录入的试题进行审核,审核通过后方可进入正式题库,未通过的可直接进行修改后进入题库,或退回录入修改后再提交审核。
(4)试题统计
应用该功能,教师可以对题库中的题目进行统计分析,了解题库中题目的总量以及在不同属性中的分配,并可查询不同时间段更新的题目数量。
4.试卷管理
该模块面向用户为课程教师,其功能包括:
(1)智能组卷
①手动组卷。结合试题查询浏览功能,查询不同属性符合要求的试卷,教师手动进行添加和删除。此种方法效率较低,不易控制题目总量及占比,常用于辅助经验丰富的教师进行组卷[9]。
②自动组卷。首先对试卷进行参数设置,包括总分,各章节知识点所占比例与分值(常用的参数设置有:均等,或要求掌握程度:掌握>熟悉>了解),各题型所占比例与分值,试卷的难易度(通过难易度赋值,输入相应的难度值),然后系统根据设置的参数从题库中抽取相应的题目(自动规避知识点重复的试题),进行排序。试卷的排序默认为名词解释、单选题、对错题、填空题、计算分析题,由易到难,教师也可根据自身需求进行排序修改。在组卷完成后,可通过预览功能进行试卷预览。
(2)试卷上传与下载
已编辑排版的试卷,连同参考答案及试卷参数一同上传到服务器存档。试卷包括未考过与已考过的试卷,一般以word形式输出。未考过的试卷,可在下载后进行纸质试卷考试。对于已在线考过的试卷,其信息增加了学生在此次考试中的成绩及成绩分布,不同分数段人数统计,该部分内容在考试及评卷完成后由系统生成。
(3)试卷分析
通过试卷分析功能,教师可以查看已编辑试卷的参数,如题量和分值的分布、难易度等,便于教师通过试卷分析功能控制试卷的质量,从而进行编辑修改。
5.在线考试(包括考试监管)
在线考试模块供考务人员和学生使用,其登录后系统根据用户的不同提供不同的权限。该模块具有以下功能:
(1)考务监考
考务人员可以进行人员信息管理,对在线考试学生的试卷进行监控。对考试中出现的机器故障,根据开考时系统为每个学生绑定的座序,考务人员进行座序的重新绑定,保障学生可以重新登录,并从断点处继续答题。
(2)在线考试
学生登录进行考试后,系统绑定座序,为邻座学生提供不同题目或选项顺序的试卷,防止作弊。在考试过程中,学生可在界面上看到考试剩余时间及未答题量,并可对已答题目进行查看和修改,系统自动保存。考生可利用计算机上安装的SPSS等统计软件进行分析计算,把结果输入到答题框中[11]。教师评卷后,学生可登录查看成绩。
6.智能评卷
该模块的用户为教师。评卷分为客观题和主观题的评卷。客观题由系统自动比对参考答案进行评阅。主观题在系统自动比对的基础上可由教师进行修改,系统通过比对试卷与参考答案中相应的得分点进行评阅,但考虑到系统主观题评阅可能由技术带来的偏差,可由教师进一步修改评阅结果。
此外,评阅结束后,该模块还可进行试卷成绩分析。系统自动统计学生成绩及不同分数段人数分布,不同题目及知识点答题的正确率。教师通过浏览试卷成绩分析,可了解试卷的考核效果,掌握学生的学习情况。该分析结果由系统与对应试卷进行关联,可在试卷管理模块查阅。
7.用户管理
该模块供系统管理员使用。系统管理员进行系统的日常维护,为用户提供系统使用的帮助,可为忘记密码的用户进行密码修改,进行用户的添加、注册和注销,以及其他用户信息的修改变动等。
该智能题库是目前正在建设的北京协和医学院卫生统计学智能化教学体系的一个重要组成部分,该体系从三个方面进行建设:(1)构建多样化的知识体系,形象化展示“抽象的概念”,可视化展示”复杂的逻辑关系”,动态显示”知识的关联”,从而达到“降低学习难度、增加趣味性”的目的;(2)开发智能工具,研发APP学习软件、构建智能题库、建立案例库,达到“促进对知识的理解、记忆和深化”的目的;(3)搭建交流互动平台:收集和传播优质资源、建立交流互动的机制、提供应用和科研指导,达到“促进优质资源传播、强化知识的应”的目的。实现教学管理的计算机化是教学改革的趋势,该智能题库的设计可为类似学科题库构建提供借鉴。在智能题库构建中,通过遗传算法[12],LT-backfilling算法[9],基于知识点的主观题自动评判技术[10],Rijndael 加密算法[10]等方法,将进一步提升智能组卷、主观题评阅的质量[9-10]。