基于神经网络题目的自动化解析研究

2021-09-13 18:53薛静程达
无线互联科技 2021年10期
关键词:在线教育神经网络

薛静 程达

摘 要:在线练习是在线教育的必备一环,但从传统线下教育转到线上教育时需要将往年积累的海量习题导入在线教育配套的数据库中。这一过程会消耗大量的人力、财力,出现效率低、出错率等一系列问题。针对这些问题,文章提出一种基于神经网络的实现模型。

关键词:题目解析;在线教育;TensorFlow;神经网络

0    引言

该研究目标是改变人力制题导题,实现全自动化解析处理。目前,市场上人力导题的普遍方法是,首先下载电子版试题,然后在每一题的指定位置上以人工的方式加入试题所需标记,然后计算机遍历试题文档,按指定的标记解析出对应的题目、题型与题号等数据。

1    基于神经网络的软件系统设计

整套软件系统由服务端与测试客户端(demo)组成,并提供可用于第三方集成的SDK。

1.1  服务端设计

1.1.1  服务端架构

服务端采用的是SOA架构,由Service Interface层、Service Bus层和 Persistence层组成。使用的技术框架包括:Flask与TensorFlow。ServiceInterface与ServiceBus由Flask框架+TensorFlow框架结合RabbitMQ实现,其中识别处理与模型训练由TensorFlow实现[1]。Persistence由MySQL實现。

1.1.2  服务端模块

服务端由服务接口层、服务总线层、数据持久化层组成。服务接口层是面向用户或者二次开发人员的endpoint,提供的接口有4个。

(1)用户注册接口。

用户注册接口主要用于注册使用的用户,请求地址为 IP/reg,请求参数如表1所示。

(2)题目上传接口。

题目上传接口用于用户提交试题文档,请求参数如表2所示。

(3)题目解析接口。

题目解析接口用于用户获取题目的智能解析结果,请求参数如表3所示,返回参数如表4所示。

另外,还有识别处理模块及模型训练模块的设计,识别处理模块的目标是识别出文档中的所有试题,并且做到准确拆分试题,之后识别题型,从而生成标准化试题[2]。根据特征识别试题的偏移量就成为拆分试题文档的关键。模型训练模块是提升试题识别能力的关键。其分为题型模型、题号模型与题干模型等。前文已经论述如何提取题号偏移量,最终达到提取试题的目的。因此,提升题号识别能力,训练题号模型就成为提高拆分试题准确率的核心。

2    实验结果

点击“解析试卷”后,从服务器返回的结果可以清楚看到所用时间情况和试题的解析情况。原试卷是一套完整的带标准答案的初中数学试卷,其中包含选择、填空和解答三种题型,没有做任何的标记处理。经服务端解析后,进行了准确的切分,从试卷中提取出每个试题,并识别出对应的题型。

实验过程中用一套完整的初中数学试卷作为实验用例,试卷中包含选择题12道、填空题4道、计算题6道。人力制题,用时48分钟,平均每题用时约2.2分钟,折合132秒。利用该软件制题,用时7.35秒,平均每题0.33秒。由此可见,制题效率得到极大的提升,实现了本文的研究目标。

3    结语

本文的研究是在充分调研在线教育行业现状的基础上展开的。首先,针对目前基于word人工制作可用于大数据学情分析的标准化试题的现状,本文提出了完整的提升效率的方案。其次,研究并建设了完整的软件实验环境。最后,用相同的一套试题分别测试了人工制题和AI制题的效率,测试结果充分证明了该研究的必要性和重要性。

[参考文献]

[1]朱溦.神经网络结合平均影响值方法筛选变量[J].产业与科技论坛,2017(1):78-79.

[2]俞颂华.卷积神经网络的发展与应用综述[J].信息通信,2019(2):39-43.

(编辑 王永超)

猜你喜欢
在线教育神经网络
神经网络抑制无线通信干扰探究
“互联网+”时代在线教育模式创新研究
在线教育商业模式探究
提高机械原理教学质量的几点思考
基于在线教育的大数据研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于神经网络分数阶控制的逆变电源
基于GA-BP神经网络的光伏阵列MPPT研究