1月15日,阿里巴巴开发的人工智能(AI)模型,在斯坦福大學阅读理解测试中的得分超出了人类。
阿里巴巴上周让其深度神经网络模型接受了测试,要求AI给出超过10万个问题的确切答案,而这些问题所构成的试卷被认为是当前世界检测机器阅读水平的最权威的标准之一。由阿里巴巴数据科学技术研究院开发的这一AI模型在测试中得了82.44分,相比人类对手82.304的得分稍胜一筹。
阿里巴巴说,这是机器首次在此类测试中战胜真人。微软开发的机器也取得了同样的战绩,在同一测试中得到了82.650的高分,只是成绩的最终确认比阿里巴巴的AI模型晚了一天。
所谓的自然语言处理是模仿人类对语言词句的理解。斯坦福大学的测试题基于500多篇维基百科文章编制而成,旨在通过这套试题梳理出线索,看机器学习模型是否能够在经过大量信息处理后给出问题的确切答案。
阿里巴巴研究院自然语言处理首席科学家司罗在一份公告中说,对于像“天为什么会下雨”这样的客观问题,机器给出的答案准确率会很高。公告称,其中的技术可以逐步应用于诸如客服、博物馆指南、在线解答患者医疗问题等广泛的实际应用领域,从而以一种前所未有的方式减少人力投入的需求。
(彭博新闻社)endprint