机器人考生来了,但它可能更想当老师

2017-06-29 08:52李嘉文
第一财经 2017年23期
关键词:机器题目考试

李嘉文

6月7日,中国高考的第一天,北京有一位特殊的“考生”也做了一份全国高考文科数学卷。

这位考生的解答速度惊人,解开一道题目的时间为7到15秒,据说,这还是“他”刻意将速度放慢了6倍的效果,为的是不但要保证解题的正确率,还需要展示自己的解题思路和过程—这些思路会通过一块大屏幕来显示:每解答一道题目,“他”运用的知识点就会在这块屏幕上同步出现。

最终,该“考生”只用了9分47秒就完成了整张试卷,成绩为134分。看来,老师常叮嘱学生的那句“做题目太快就容易粗心”的“真理”在“他”身上并不适用—这位考生并非人类,而是由中国公司学霸君推出的智能教育机器人Aidam。

学霸君最开始的创业方向是拍照搜题,目前已经推出了君君辅导以及AI学两款产品。拍照搜题业务帮助这家公司积累了大量的学科数据,目前学霸君有7000万注册用户,答题搜索次数超过100亿,老师在线答疑超过500万次。“考试机器人背后的技术从创业第一天就已经开始积累了。Aidam解题能够如此迅速顺利,正是基于过去累积的一个庞大数据库。”学霸君首席科学家陈锐峰对《第一财经周刊》说。

在中国高考的学科中,数学和物理是目前人工智能相对胜任的两门学科。它们具有较强的逻辑性,考点基本稳定,容易判断对错。“从我们搜集到的数据来看,学生们平时有40%的疑问都是针对数学学科,中国的学生在数学上的困难比较大。”陈锐峰说。

高考的数学试卷中既有简单的选择题,也有复杂的需要解题过程的大题。但即使面对的是选择题,机器背后的一套解题过程也很复杂。

Aidam首先需要将试卷上的题目从自然语言转为形式语言,形式语言强调条件、状态或者是一个固有状态。陈锐峰介绍,学霸君的技术团队选取了一个接近主谓宾的组合,基本上人们的日常对话或者是各类论述都可以转化为主谓宾形式或者相关变种的语句。

比如数学题中常出现的表述:角A等于多少度。Aidam的理解思路就是:主语是角A,动词是等于,多少度就是宾语—这一步是它解题的基础,理解的正确与否会直接影响解题的正确率。在这一次高考题的测试中Aidam之所以未得满分,陈锐峰认为,一部分原因就在于它在有些情况下无法理解题目的意思。

Aidam解题的第二步是其内部定义的“知识元”计算。学霸君在高中数学和初中数学方面已经积累了一个庞大的数学学科数据库,涉及到的原理、运算逻辑较全,而且有一个专业的老师团队在对知识点做梳理,但仍然不能穷尽各种组合。因为涉及到太多维度,而大部分数学解题过程是一个多步骤序列问题,所以还需要利用“增强学习”的方式让机器学习题库中的题目,減少运算维度。而在这次Aidam的实际解题过程中,有些题目此前没有训练过,导致它没能解出。

解题的第三步相对简单,是将解题完成后的机器语言重新翻译回人类语言。

其实,每一个步骤技术团队都花费了很长时间。比如如何将自然语言转化为机器语言,团队就花费了整整一年的时间。“机器理解的部分我们一直在做,一开始是做词汇级别的,之后觉得描述的精度还是不够,开始渗透到句法层次,之后还会再深入到上下文的语境理解。”陈锐峰说。

这次高考,也有一场“人机大战”。机器的对手是6名高考状元,虽然他们答题花了整整一个小时,但6人的平均分达到了135分,比Aidam高1分—人类战胜了机器,这在最近几年可不多见了。

而同一天,另一款“考试机器人”—成都准星云学科技有限公司的AI-Maths也参加了今年高考的数学考试。它分别解答了北京文科数学卷和全国数学卷,得分分别为105分和100分。和Aidam一样,题目的叙述文字一旦太多,机器就会因为读不懂题目而无法解题,但是它计算题和证明题都完成得不错。

根据准星云学的CEO林辉介绍,该机器人此前做了500套试卷,大约1.2万道数学题。它背后的技术逻辑与关注题库、数据挖掘的Aidam不太一样。1.2万道题目从机器学习的角度来讲,还是一个较小的范围。所以相比数据,这款机器人更倾向于建立类似人类的复杂逻辑推理能力与联想能力,试图在较少样本和较少资源耗费的情况下,拥有“举一反三”的能力。

而日本也有考试机器人,自2013年开始,每年其机器人Torobo都会参加当年的东京大学入学考试。虽然Torobo有所进步,但总免不了落榜的命运。

这说明,无论是哪种技术路径,至少在考试领域,人工智能还是有一些技术问题没有解决。2016年再次落榜后,Torobo已放弃“求学”,转而投入实用领域,比如负责一些数据分析工作,但在商业模式上,考试机器人目前在教育领域普遍缺少较为直接的变现模式。

不过,考试机器人背后的技术已经应用到了学霸君目前的两款变现产品中。

比如学霸君推向学校的电子教学系统AI学,它在前端用一套专用的纸笔搜集学生的作业数据,而这次考试机器人参加高考用到的自然语言处理技术,同样应用在了AI学中,帮助它处理学生做题的文本。

另外,考试机器人在解题环节中展现的“自适应推荐”能力,在教育产品上也有很大应用空间。由于能根据各类知识的组合逻辑来演算,随着对各类知识以及各个逻辑之间的处理精度越来越高,这能帮助一些教育产品在识别了用户的薄弱环节后,向其推荐匹配度和准确度更好的题目。

人类还可以拥有自己的人工智能老师。它能够分析个体的薄弱点,从而给用户推送针对性更强的题目,或许在一定程度上有助于解决教育不公的现状。至于其“弱项”语文等需要大量语义理解能力的学科,目前微软的人工智能语音助手小冰已经可以利用循环神经网络(RNN)来写诗词。人工智能真的会成为人类全方位的老师吗?

猜你喜欢
机器题目考试
机器狗
机器狗
关于题目的要求
本期练习类题目参考答案及提示
未来机器城
追根求源