李楠
3月27日,美国计算机协会正式宣布将2018年图灵奖授予 Yoshua Bengio, Geoffrey Hinton 和 Yann LeCun,以表彰他们在深度学习领域的巨大贡献。有的媒体称他们为“熬过寒冬的人”,以此赞叹这三位学者在人工智能领域锲而不舍的常年耕耘。三位学者中Hinton的年纪最大,已经七十多岁,他跌宕起伏、先抑后扬的科研经历像极了人工智能的发展历程。虽然这几年正是深度学习将人工智能重新拉回大众视野,但纵观三位获奖者的主要科研成果,很多都是在20世纪八九十年代就开始萌芽。从历史角度来说,人工智能也许已不算是“新兴学科”了,但在中小学信息化教育领域,人工智能才刚刚起步。
与中小学校的其他学科不同,人工智能高度综合且对跨学科知识依赖性强。学生、教师和教材只是人工智能教育的“冰山一角”,还需要隐含在水面之下的大量资源才能够支撑起完整的教学体系,特别是与人工智能相关的软硬件技术群以及互联网资源,这些资源的整合应用是对教育工作者的巨大考验。
笔者曾询问过几名大学一年级新生是否知道“机器学习”“神经网络”这些概念,回答都是不了解,而一旦提到“阿尔法狗”(AlphaGo)时,他们则纷纷表示从新闻里听说过,就是那个下围棋很厉害的机器人。可见,目前很多学生对人工智能概念的第一印象不是来源于课堂,而是媒体或科幻小说。虽然大众传媒对人工智能概念的传播功不可没,但毕竟代替不了课堂上严谨的知识教学。一门学科一旦进入了课堂,就面临着教什么、如何教、教的好不好等难以回避的问题。这些命题都很复杂,需要广大科技工作者和教育工作者群策群力。在本文中,笔者想面对这座“冰山”,潜到水面之下,尝试着对其中一些问题做出思考。
准入门槛逐渐降低,让人工智能教育走进中小学成为可能
在人工智能教育中,我们要面临的第一个问题就是中小学的课堂准备好迎接人工智能了吗?
无论是国务院在2017年发布的《新一代人工智能发展规划》还是教育部在2018年发布的《教育信息化2.0行动计划》都极度强调了人工智能之于国家、社会乃至教育的重要性。科技的发展必然需要教育先行,要在普及教育中引入一门新的学科更需要的是制度保障。国家层面明确的指向性和人工智能本身在世界范围内的持续高热度正是其进入中小学课堂的最好时机。
人工智能爆炸式发展的一个重要前提是变“简单”了,这个“简单”不是指人工智能知识变简单了,而是指将人工智能“用”起来更容易了。曾经的人工智能学习和应用有几个较高的门槛。首先是知识门槛。无论是符号推理还是统计学习,都需要较为丰富的数学知识作为保障,符号逻辑、离散数学、线性代数、概率统计等,都或多或少成为学习人工智能的先修课程。另外,学习者还要具备娴熟的计算机编程能力,不能实现的人工智能终归是纸上谈兵。其次是数据门槛。不管哪种形式的机器学习,都需要足够的数据或知识进行支撑。没有数据就很难学习,更谈不上应用。第三是计算门槛。计算能力的不足变成人工智能应用的一个软肋。
这些门槛不仅限制了大部分的学生接受人工智能教育,也限制了各行各业从业者对人工智能的应用。这种情况在近几年有了较为明显的变化。随着深度学习在计算机视觉、语音识别、自然语言处理等几个领域的成功应用,人工智能变成了大众热门词汇,从业者的收入水平也有大幅提高,出现了明显的马太效应,更多优秀的人才和丰富的资源进一步投入到这个行业中。
目前在人工智能领域,免费甚至开源的框架和代码库层出不穷,已经形成了十分完善的工具链。很多优秀的模型和算法经过优雅的封装后可以很方便地被使用,使用者甚至不需要知道过多的理论技术细节就可以将人工智能引入到自己所在的专业领域中。这种完备的工具体系极大地降低了人工智能的准入知识门槛,为人工智能教育提供了绝佳的舞台。
另外,近几年随着人工智能同时发展的还有大数据和云计算技术。数据获取、存储和采集以及高性能计算的成本大幅下降,数据蕴含的价值被充分认知,计算资源的使用变得弹性而灵活,GPU、TPU等专用的人工智能芯片使得计算效率大幅上升。这些伴生技术相当程度上降低了人工智能学习的数据门槛和计算门槛。
再有就是人工智能教育的师资人才。目前很多大学都已经建立或者正在筹建人工智能学院或专业。在不久的将来,更大的专业人才基数有望促使中小学人工智能教育的师资力量得到显著增强。
可以说,人工智能教育走进中小学真正具备了天时、地利和人和的条件。
深度优先还是广度优先是方法更是策略
在图遍历算法中,存在“深度优先”和“广度优先”两种思路。对于人工智能教育亦是如此。“深度优先”可以认为是将人工智能的各个内容和知识点专门展开,从概念、算法、模型、范例等各个角度进行剖析,其目标是学生能够熟练使用相应方法,一种方法讲透以后再開始讲另一种。而“广度优先”可以认为是将人工智能的知识体系全貌先对学生进行介绍,首先帮助学生建立宏观概念,即人工智能作为一个学科目前到底能解决什么样的问题,不能解决什么问题,而在可预见的未来可能有怎样的发展。这两种教学思路的差异性是很大的,前者是面向方法的教学,而后者是面向问题的教学。
目前“深度优先”的教学方法被大学人工智能教育广泛采用,但未必很适合中小学人工智能教育。对于小学、中学、大学三个阶段来讲,中学人工智能教育似乎是最难统筹的。小学生因其认知能力和知识储备的局限性,可偏重于人工智能的科普和启蒙。相对的,大学生则已具备必要的先修知识和明确的专业方向,人工智能教育可以偏向垂直领域和学术化。而中学生,特别是高中生,其知识体系已经开始分化,学生个体之间的差异性也很强,要想做到普惠的人工智能教育难度很大。目前看来,小学的人工智能教育最适合启蒙式的“广度优先”方式,而中学生应该以“广度优先”为主,“深度优先”为辅的策略。
事实上,想要在高年级的人工智能教学中找到既不太“科普”也不太“学术”的平衡点还是很具挑战性的,需要有一座“桥”将二者连接起来,而这座“桥”似乎可以用“面向问题的教学”这一思路来构建。
在人工智能科普教育中存在这样一个现象,即以“方法的展示”和“结果的展示”为主,却很少有对于“目标问题”的剖析。如在介绍线性回归方法时,经常用房价预测作为例子,其主要原因是房价预测这件事的背景十分大众化,几乎不用解释。但这类例子也会导致几乎所有的受众会把注意力放在方法和结果的“奇妙性”上,而很少考虑为什么这个问题可以用线性回归来解决,似乎这个问题天生就是为了讲解线性回归方法而存在的。相对的,在实际工程中,目标问题的本质是什么、包含了怎样的知识、能不能用专业人工智能方法来解决、能在多大程度上解决、困难是什么等问题才是人工智能应用的第一步,往往也是最艰难的一步。如果忽略了对问题的探讨,学生会错误地认为人工智能实践起来如此简单,因为利用机器学习框架,只需要几十行代码的编写就能实现一个房价预测的实例程序。
可以说,对问题的深刻认识与对方法的深刻认识同样重要。在中小学的教学中,建议加强对目标问题的探讨。如在介绍图像分类方法时,可以使用形如“花卉种类识别”或者“蝴蝶种类识别”这样专业性更强的例子来代替通用例子。这样就可以结合学生们生物学方面的相关知识背景对具体问题进行更专业的剖析和探讨,如通过分析不同种类蝴蝶身体结构和翅膀纹理上的异同,将目标問题具体化和形式化,来引出诸如图像分割、目标检测、特征提取等概念,更深刻的让学生理解图像识别的本质。
教材与工具对人工智能教育都非常重要
人工智能的目标是希望机器能像人类一样思考。人是理性和感性兼具的动物,但计算机却几乎是绝对的理性。我们总是希望计算机能感性一点,这样才更像我们人类。这造成了人工智能教育中的一个核心矛盾,传统信息课程内容是绝对理性的,讲究逻辑的(例如计算机程序设计课程),但我们的目标却是要用理性的手段来实现一个与我们人类相似的,兼具理性和感性的智慧。这可能就是人工智能教育之于传统信息学本质的差别。
1.人工智能教材重要且更新快
人工智能的知识体系非常复杂,很难在中学课堂上做到真正的“无死角”教学。对于任何一个人工智能案例,教师都会发现将其涉及的完整知识链在课堂上讲清楚几乎不可能。其主要原因是学时不够和先修知识储备不足。如对于大部分的中学生来讲,“线性代数”可能是从没接触过的一门课程,这就导致大量机器学习中的形式化表达无法直接使用。因此,真正编制出一套“有舍有得”的中小学人工智能教材极为重要。
由于人工智能技术发展高速、知识更新速度快,其教材编写相应的也需要一个发展进化机制,要保持合理的书本知识和在线文档的比例,即每本教材背后都有一套完整的在线资源支撑,这更符合人工智能知识体系的特点。在线资源并不是教材内容的简单重复,还包括各种链接、视频和可编程交互文档等方面的内容。传统计算机编程技术的学习可以总结为“书本+示范程序+上机练习”模式。而人工智能教育则需要将学生的互联网文献检索和资源发现能力培养进行前移和强化。因为人工智能这门学科是在互联网中成长壮大的,海量知识和资源分散在互联网的各个角落,与互联网水乳交融。
2.人工智能的教学离不开教学工具
在信息学教育工具的发展史中,曾经有过一个非常令人遗憾的失败案例,即麻省理工学院多媒体实验室2005年发起并组织的OLPC项目,希望全新设计并生产100美元的廉价笔记本电脑用于发展中国家的青少年教育。该项目经过多年的挣扎之后失败了,远未达到当初的预期。究其原因在于该项目过于追求“教育”,而忽略计算机软件和硬件一直在飞速发展的事实。OLPC电脑为了追求节能和廉价采用了诸如手摇充电和特殊节能屏幕等独特的设计,最终成本不断攀升,性能却很羸弱。而与此同时,随着半导体技术的发展,民用的笔记本的价格却在节节下降,现在只要花几百元人民币就可以拥有性能不错的平板电脑用于教育。OLPC项目的失败提醒我们,信息学教育的教学工具不同于其他学科,计算机的软件和硬件始终处于快速的发展和变革中,同时这种变化能迅速地传播到每一个角落。在人工智能软硬件教具的研发中,先进性,特别是软件的先进性,要放在首位,应该充分利用互联网开源、共享精神带来的资源红利,不能仅为追求教育的“便捷性”而忽略前沿工具的使用。
理解人工智能的伦理、安全内容与局限性
在中小学的课堂中,笔者建议不仅仅进行人工智能知识和技术的教学,还应该引入相当程度的伦理与安全内容。我们的学生需要知道,人工智能技术的局限和边界在哪里,运用人工智能技术会导致哪些可能的风险。近期,连续两起波音737Max8飞机导致的大型空难震动世界。初步的调查报告表明,事故的罪魁祸首很可能是该型号飞机搭载的“机动特性增强系统”,该系统是一个高度自动化装置,其启动逻辑由计算机而不是飞行员来判定。本次事故可能是程序逻辑设计的缺陷导致了飞机失控。在我们憧憬诸如“自动驾驶”这类人工智能技术为我们带来便捷的同时,也需要让学生了解不成熟智能技术会带来的安全隐患。
1.人工智能中的隐私保护需要重点关注
笔者曾与一位高中学生闲聊智能音箱时谈到这个问题,该学生觉得这些智能助手们应该不会导致隐私的泄露,因为只有用户发出明确的指令(如称呼智能助手的姓名)时这些音箱才会开始工作。这种认知恰恰是对语音识别技术运行的机制不了解而造成的,试想这些音箱如果不是时时刻刻在聆听周围的声音,又如何能分辨用户在呼唤它的姓名呢?可见,全面的了解人工智能技术的运行模式,非常有助于学生从小就建立起自我隐私保护的意识,能够有效地判断隐私泄露的风险。
目前,如微软和谷歌这样的人工智能领袖企业都明确地把诸如“隐私”和“安全”等准则列入其人工智能道德规范中。在我们的中小学人工智能教育中,也应该有意识的通过案例教学等方式来夯实学生们在该领域的认知。诸如“差分隐私”等概念,也可在教学中适当引入,让学生能够实实在在触摸到隐私保护技术。
2.人工智能的局限与负面影响也应在教育内容中有所体现
如目前个性化的信息推荐会让用户陷入“信息围栏”,无论是阅读偏好还是购物偏好,用户喜欢什么,机器就给他推荐什么,用户的信息获取途径反而会变得狭窄,始终无法跳出自己认知的“舒适区”;机器利用用户行为数据对用户的“画像”甚至超过用户对自身的了解。人工智能教育需要让学生认识这个现状,有意识的摆脱人工智能的“负面”影响。人工智能教育的目的不仅仅为了让一部分学生在未来能参与到人工智能科技活动中,也是为了让学生能够适应未来可能出现的越来越智能的世界。
虽然人工智能在计算机视觉、语音识别领域取得了成功,未来在医疗、金融、自动驾驶等领域也必然有所作为,但是在通用智能领域以及广泛的工业智能领域还任重道远。现在的人工智能高度依赖历史数据的积累,一件事情如果没有足够的数据支持就变得很棘手。不幸的是在工业领域,很多信息和知识都是隐性的存在于算不上完备的数据积累中,甚至只是作为模糊的行业经验存在于领域专家的大脑中,这就让机器智能的培养变得很困难。这就好比一位教师在传授一门学科知识时,既没有充分的教材,自身对知识的理解也是模模糊糊,又怎么能把学生教的明白呢?目前来看,无论是迁移学习,还是强化学习,对待这些复杂的智能问题时还是稍显稚嫩。在教学中建议让学生能有所反思、能自主分辨,避免传媒对人工智能的过度神话造成认知误导——似乎一夜之间教师、医生、驾驶员等都会被人工智能所取代,科幻电影中的时代即将来临。求真和务实才是人工智能教学应有的态度。
虽然人工智能已经取得了不少瞩目的成功,但它仍然像一个襁褓中的婴儿一样,还有无穷的潜力。如今在中学、小学读书的这些孩子们,再过二三十年,将是我们国家和社会的中流砥柱。不管怎么说,人工智能教育至少应该达到两个目标:第一是激发一部分学生的学科兴趣,让他们能够有志于该领域的深造和研究,最后成为祖国建设的专门人才;第二是惠及每一位学生,让他们能理解人工智能,能明辨是非、评判真伪,能自信的拥抱未来可能到来的人工智能时代。人工智能的教育正像一座冰山一样,暂时还只对我们露出一角,隐藏在水面之下,还有大量的工作等待着教育工作者们去探索和耕耘。
作者单位:北京工商大学