开源人工智能系统Tensor Flow的教育应用*

2018-03-06 12:23
现代教育技术 2018年1期
关键词:教育领域开源深度

石 磊

(上海第二工业大学 工程训练中心,上海 201209)

一 Tensor Flow简介

1 人工智能与Tensor Flow

随着近年来人工智能技术的突破,人工智能正在全球范围内迎来新一轮的创新与变革,推动人类社会从信息化时代向智能化时代转变。与此同时,人工智能领域也在发生着新的变化:一方面,以深度学习的成熟为标志,全球主要科技厂商与研究机构都在加大对机器学习与人工智能的研发和投入,将人工智能作为重要的战略发展方向;另一方面,许多优秀的人工智能和机器学习系统纷纷开源,与全世界的科研人员与技术开发者共享,通过“合作+开放”的战略,构建了免费的技术开放平台、生态合作平台。人工智能技术的发展正在由学术推动的实验室阶段,走向学术界和产业界共同推动的产业化阶段。

如何促进人工智能在教育中的有效应用是目前教育领域关注的热点,《2017地平线报告(高等教育版)》也将人工智能列为长期的关键技术[1]。通过梳理总结国内外现有的教育人工智能研究成果,本研究将当前人工智能在教育领域的研究归为两大类:①对教育人工智能的理论如内涵、应用领域、发展趋势等[2][3]的探讨,分析了人工智能为教育发展带来的挑战和机遇[4];②对教育人工智能的某些具体领域如智能导师系统[5]、教育机器人[6]等的研究。就整体而言,人工智能在教育领域的实践研究还较少,缺少对人工智能如何在教育领域落地和应用的探索。

结合当前人工智能技术的发展现状,本研究认为采用开源系统开展教育人工智能的研究与应用,将是推动人工智能在教育领域落地与发展的一条有效路径。TensorFlow是Google公司推出的开源人工智能系统,具有灵活性、高效性以及良好的可扩展性、可移植性等特征,可应用于从智能手机到大型计算集群的多种计算环境。

2 Tensor Flow的研发现状

TensorFlow自提出后,在学术界和工业界都得到了极大的重视与发展,如Google的多种应用包括 Gmail、Google Play、搜索、翻译、地图等都应用了 TensorFlow。在研究层面,一方面TensorFlow自身正在不断地完善,其深度学习算法和API等保持着持续更新和演进。如2017年5月,Google推出了 TensorFlow研究云,这是一个可以免费提供的云端张量处理器(Tensor Processing Unit,TPU)集群,以支持广泛的计算密集型研究项目[7]。另一方面,越来越多的研究选择使用TensorFlow,包括一些顶尖的学术研究项目也采用TensorFlow进行人工智能研究并取得了多项卓越的科研成果[8],开发人机博弈系统Alphago的DeepMind也将全部研究重点移到了TensorFlow。可以说,TensorFlow正在形成一个通过研究、应用与发展相互促进的良性循环。

二 Tensor Flow的相关分析

1 架构与特征分析

TensorFlow是Google公司推出的一个使用数据流图进行数值计算的开源人工智能软件库,最初由Google大脑团队为了研究机器学习和深度神经网络而开发,之后于2015年10月宣布开源。机器学习与深度学习是人工智能技术中最核心、最关键的部分,正是深度学习的发展带动了人工智能近年来发展的新浪潮,推动着“大数据+深度模型”的发展。TensorFlow提供了丰富的构建和训练机器学习模型的API库,支持卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Networks,RNN)、长短期记忆网络(Long Short Term Memory Networks,LSTMN)等深度神经网络模型。TensorFlow的基本架构如图1所示。其中,设备层提供TensorFlow的运行环境;前端则负责提供编程模型,并支持多语言编程环境。在应用中,通过前端调用TensorFlow核心API,实现TensorFlow在不同设备环境下的运行。

图1 Tensor Flow的基本架构

TensorFlow的主要特征有:①灵活性与可移植性。在设备层,TensorFlow能够运行在不同类型和大小的机器上,如台式机、服务器、手机移动设备等,并可以方便地进行移植。在前端,TensorFlow支持C++、Python、Go、Java、Lua、Javascript、R等主流语言。TensorFlow核心库对CPU/GPU是透明的,其分布式架构使得在大规模数据集上的模型训练可以在合理的时间内完成。②易用性与高效性。TensorFlow工作流易于理解,能够方便地构建和实现已有的复杂机器学习架构。同时,目前已有多种高层接口构建在TensorFlow之上,如Keras、SkFlow等。TensorFlow库的高性能、高效率特征,还可以将硬件的计算潜能全部发挥出来。③促进科学研究进程。以往研究者在科研中的算法需要大量的编码工作才能转化为产品,而使用TensorFlow可以帮助研究者直接尝试新的算法,通过训练和使用模型,更便捷地将研究成果转化为实际产品,故有效地提高了科研产出率。④良好的技术支持与完善的社区。Google投入了巨大的资源为TensorFlow提供支持和引导并且鼓励社区参与,使用者通过广泛的社区支持可以方便地获取帮助。

2 主要开源框架的比较

当前,Google、Microsoft、Facebook等科技公司和多家研究机构都推出了开源的人工智能与机器学习框架,其中主要开源框架的比较如表1所示。结果显示,较之Caffe、MXNet、CNTK、Theano、Torch、PaddlePaddle等主要开源框架,TensorFlow在架构设计、性能、应用等方面的表现均更为出色。

表1 主要开源框架的比较

三 Tensor Flow的应用原则

TensorFlow为教育人工智能的研究与开发提供了良好的基础和支持。在应用开源系统进行教育人工智能系统的设计与实现时,需要遵循以下原则——

1 设计方面:从教育需求出发,围绕用户、目标、问题和场景展开

在教育人工智能研究中,要注意“人工智能教育不同于娱乐游戏产品,无论是应用还是市场开发,都必须充分尊重教育自身的规律。”[9]设计教育人工智能产品是在设计一个具有主动学习、成长、预测能力的系统,用户、目标、问题和场景是进行教育人工智能系统设计时需特别注意考虑的要素。从教育需求出发,用户群分析和目标分析是进行系统设计的前提,而明确应用场景和要解决的问题是进行系统设计的关键。在此基础上,通过教师、教学设计者、教学软件开发者的共同参与,完成系统的模型构建和功能模块设计。

2 实现方面:从教学模型到教育产品,发挥开源系统优势

在具体的实现方面,应充分发挥TensorFlow开源系统的优势,选择合适的TensorFlow技术和相关技术,将系统模型从教学研究变成教育产品,具体可从以下方面着手:①在应用中可以使用TensorFlow Serving导出和应用模型——TensorFlow Serving是一个高性能的服务系统,用于运行通过机器学习得到的模型,使模型能够更迅速、更便捷地进入产品开发过程;②可以通过 TensorFlow Ecosystem与多种开源框架融合,实现不同开发环境和系统的互通;③在基于TensorFlow教育人工智能系统的应用中,注意充分发挥其分布式、可扩展性、跨平台性等优势。

四 Tensor Flow在教育领域的应用

人工智能在教育领域的应用被赋予了极大的希望。结合上文相关TensorFlow的分析和教育信息化现状,本研究认为TensorFlow在教育领域可应用于教育大数据分析、学习推荐系统、教学游戏和教育机器人等方面,助力智能教学应用的设计与实现。

1 教育大数据分析

教育大数据的主要类型包括文本数据、语音数据、图像数据、视频数据、行为数据等,海量复杂的学习数据需要有效的方法进行分析以产生更好的教育价值。本研究总结了 TensorFlow在教育大数据分析领域的主要应用,如表2所示。

表2 Tensor Flow在教育大数据分析领域的主要应用

(1)文本数据的分析与应用

文本是教育系统的主要数据类型,TensorFlow对文本数据分析提供的主要支持有:文本分类、卷积神经网络、循环神经网络、长短期记忆网络等。在此基础上,可以实现教育大数据分析领域中的问答系统、自动评分、情感分析等应用。

①问答系统:随着机器学习与自然语言处理技术的发展,在各类大规模知识库和海量信息的支持下,问答系统的功能得以不断提升。TensorFlow能够使用深度学习的方法完成问答系统的关键任务,如问题分类、答案选择、答案自动生成等,从而使问答系统更为准确地理解以自然语言形式描述的用户提问,并通过检索问答知识库返回简洁、精确的匹配答案。

②自动评分:大规模在线学习环境下的自动评分方法受到教师越来越多的关注,而自动评分的关键技术包括自然语言处理、语义分析等。TensorFlow的深度学习框架提供了良好的技术方案,可以对学习者的全量数据进行分析,实现对学习结果和学习表现的实时跟踪与评价,给出相应的等级或分数,并发现作弊现象。

③情感分析:从认知科学的角度来看,情感既是智能的一部分,也是教学交互的重要要素。应用情感计算理论与技术,有助于教师监测学习者的情感变化,调整教学策略和方法,实时给予学习者情感反馈,使教学质量达到最佳[10]。TensorFlow的情感分析API可以实现更深的语义理解和多模态情感分析,实现人机交互中情感、情绪的识别与理解,使教学系统更加人性化。

(2)语音数据的分析与应用

随着教学系统的发展特别是移动学习的广泛应用,语音数据的使用越来越多并已成为一种重要的交流方式,语音会话系统的设计也因此成为了研究者关注的一个重点。其中,基于人工智能的虚拟助手被认为是构建“对话即平台”的信息系统的核心。TensorFlow能够对所获取的语音信息进行深度神经网络分析,提供方便有效的模型和方法,从而支持语音识别、语音检索等功能,构建语音交互型应用,更好地支持教学。

(3)图像数据的分析与应用

图像识别是机器学习的一项重要任务。TensorFlow提供良好的图像分类模型和处理接口,可以实现拍照搜题、图像自动批注等功能,故增强了学习系统的智能化。如拍照搜题应用,通过大规模题库支持,基于图像识别技术,由系统匹配题库,能自动为学习者返回题目答案和解题方法。图像自动批注和注解也是一种有价值的应用,特别是在当前海量学习资源中有很多图像没有说明,而通过使用深度学习来自动生成图像的注解,就为图像提供了相应的描述。

(4)视频数据的分析与应用

随着慕课等在线学习的发展,基于视频的学习越来越普及,视频资源的多种处理需求也应运而生,如考试监控中的人脸识别和在线课程中的视频互动分析就是当前教育视频场景中的典型应用。人工智能技术是解决海量视频资源分析的关键技术,TensorFlow具有视频分析的各类API,能够有效地实现视频中的物体识别、视频分类、视频检索、视频自动标签等功能。

(5)行为数据的分析与应用

当前智能移动设备特别是手机搭载了越来越多、越来越精确的传感器。TensorFlow系统具有物体监测 API,能够利用智能手机搭载的传感器,结合深度学习技术对数据进行分析,最终可识别用户的行为。这种行为识别一方面可以实现对学生行为的实时监测,另一方面所获取的行为数据将为学习者分析提供有效的参考。

2 个性化学习推荐系统

在教育领域,个性化学习推荐是指根据学习者的具体学习情况,为学习者推荐个性化、适应性的课程和资源,它是大数据时代和信息智能时代提高学习效果的一种有效方式。在推荐系统的研究中,“宽度与深度学习”(Wide & Deep Learning)是集成于TensorFlow的一种有效推荐算法,它通过将深度神经网络(用于归纳)与宽线性模型(用于记忆)联合进行训练,取得了良好的推荐效果[11]。

本研究设计了一种基于宽度与深度学习的通用型个性化学习推荐系统,如图2所示。该系统基于学习者信息、学习资源的访问行为等数据,为学习者推荐相关的学习资源。该系统的推荐部分包括候选生成和排序两个模块:首先,由候选生成模块通过机器学习或人工定义规则等方法,生成高相关性的候选集合数据;随后,排序模块使用“宽度与深度学习”推荐算法,对候选集合数据进行排序,最终产生推荐结果。

3 教学游戏

人工智能在教学游戏中的应用主要涉及两方面:①使用人工智能操作游戏,如 DeepMind团队所设计的系统在多个游戏中击败了世界顶级玩家,证明人工智能可通过深度学习掌握游戏技巧,并获得和人类一样的操控力,甚至在某些方面还超过了人类;②将人工智能元素融入游戏的设计与开发中,如游戏关卡设计和非玩家控制角色(Non-player Character,NPC)类游戏等。

目前,引入人工智能要素的教学游戏还较少,这是未来教学游戏设计中需要重点考虑的问题。TensorFlow提供的深度学习算法可应用于教学游戏,并通过恰当的模型选择与训练实现游戏中智能化要素的设计。如何在教学游戏中融入更多、更新颖的人工智能要素,是教学游戏设计人员面对的新课题,这就需要设计人员真正理解玩家和人工智能之间的关系,充分考虑游戏的需求和人工智能的应用,最终设计出优秀的教学游戏作品。

4 教育机器人

人工智能是未来发展教育机器人的关键技术[12],而机器人也是人工智能的终极应用目标之一。教育机器人中的感知、认知和行为控制三个部分都是在机器学习和深度学习的支持下实现的,可以完成视觉、听觉、情感、推理、操作、互动等行为。

TensorFlow提供了构建机器人的智能平台支持,通过强大的深度学习算法,推动着开放性的教育机器人系统平台和机器人应用软件的发展。本研究对教育机器人的核心功能、行为描述、TensorFlow的技术支持等进行了分析,如表3所示。

表3 教育机器人分析

五 问题与展望

TensorFlow等开源人工智能系统为推动教育人工智能的研究与应用提供了新的思路和方法,但在研究和实践的过程中也还存在着一些亟待解决的问题:①学习曲线相对较高。相较于其它技术领域,TensorFlow的核心技术领域——机器学习和深度学习对教育领域的研究人员、技术开发人员来说门槛较高,他们需要进行专业化的培训和学习。由于进行以深度学习为代表的机器学习算法是研究者需掌握的一种基础能力,而目前与此相应的人才供应相对紧缺,且流通性较弱,因此未来应加强对此领域的研究和学习,做好教育领域的人才储备,以推动教育人工智能的发展。②教育界与产业界之间存在壁垒。目前,TensorFlow虽已在产业界得到了广泛应用,但在教育领域相关的研究和实践还比较滞后,教育界与产业界之间还存在一定的壁垒。在未来的研究和开发中,教育界应更多地加强与产业界的交流与合作,共享成果,共同发展。尽管人工智能在教育领域还有很长的路要走,但TensorFlow等开源框架提供了一条有效、便捷的智能系统设计与开发路径。随着人工智能生态越来越完善,研究者可以围绕开源系统框架,逐步构建“平台+内容+终端+应用”的智能教育系统,推动教育人工智能的落地与应用。值得注意的是,教育人工智能的最终落地需要多方面的努力,如加强人工智能人才培养、完善教育大数据采集、打破学界和业界壁垒、深化人工智能教学研究等。未来人工智能的发展应在政府、院校、企业的共同努力下,着力打造“人才体系+计算设施+大数据+技术框架+应用场景”的教育人工智能发展新格局。

[1]NMC. Horizon report: 2017 higher education edition[OL].

[2]闫志明,唐夏夏,秦旋,等.教育人工智能(EAI)的内涵、关键技术与应用趋势——美国《为人工智能的未来做好准备》和《国家人工智能研发战略规划》报告解析[J].远程教育杂志,2017,(1):26-35.

[3]Luckin R, Holmes W. Intelligence unleashed: An argument for AI in education[OL].

[4]Woolf B P, Lane H C, Chaudhri V K, et al. AI grand challenges for education[J]. AI Magazine, 2013,(4):66-84.

[5]Boulay B D. Artificial intelligence as an effective classroom assistant[J]. IEEE Intelligent Systems, 2016,(6):76-81.

[6][12]黄荣怀,刘德建,徐晶晶,等.教育机器人的发展现状与趋势[J].现代教育技术,2017,(1):13-20.

[7]Stone Z. Introducing the TensorFlow research cloud[OL].

[8]Esteva A, Kuprel B, Novoa R A, et al. Dermatologist-level classification of skin cancer with deep neural networks[J].Nature, 2017,(7639):115-118.

[9]新华社.人工智能“冲击波”来临,未来我们该如何教育孩子[OL].

[10]李勇帆,李里程.情感计算在网络远程教育系统中的应用:功能、研究现状及关键问题[J].现代远程教育研究,2013,(2):100-106.

[11]Cheng H T, Koc L, Harmsen J, et al. Wide & deep learning for recommender systems[A]. Karatzoglou A, Hidasi B, Tikk D, et al. Proceedings of the 1st workshop on deep learning for recommender systems[C]. New York: ACM, 2016:7-10.

猜你喜欢
教育领域开源深度
深度理解一元一次方程
人工智能视阈下教育领域各层次的战略管理框架
五毛钱能买多少头牛
2019开源杰出贡献奖
深度观察
深度观察
深度观察
基于文献计量的数据素养及其教育领域研究态势分析
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0