人工智能的另外一面:从数学到教育

2018-11-30 02:55秦曾昌
中国科技教育 2018年1期
关键词:机器机器人人工智能

秦曾昌

人工智能的历史是计算机发展史的一部分,但是也许会是最精彩的后半段。作为计算工具,计算机已经一次次突破人类在信息处理方面的瓶颈,带领我们进入了一个可以一定程度上摆脱地域甚至是物理上的限制,创建了一个信息交换与沟通的虚拟空间(cyberspace)。

信息的大量积累与计算能力的提高,成为了人工智能技术能够应用的前提条件。从人类工程技术发展的宏观角度,我们可以大概划分如下几个阶段:①手工制造工具;②工具的机械化(如图1);③自动化;④信息化;⑤智能化。人类世界的大部分现代化国家,都已经正在或已经完成了自动化,尤其是以互联网为代表的信息技术开始普及,从本世纪初开始我们进入了信息化时代。但是各个国家和地区的经济发展并不均衡,同一国家的不同产业,发展也不同,在面临很多产业还没有完全信息化的今天,某些国家的高技术产业已经开始了智能化革命。

人工智能是英文Artificial Intelligence的中文直译,可以简单解释为用人工的方法实现智能。但是这种简单解释的背后,却包含了众多的误解和不为大众所知的外延。尤其是在通俗文化中,机器人甚至成为人工智能的代名词。实际上二者还是有明显差别的,人工智能更关注的是机器人是如何“思考”的。这里拟人化的“思考”主要是指如何设计聪明的算法实现自动响应及其他复杂功能。这些聪明的算法是基于计算机的基本工作原理的,甚至有人戏称计算机叫做“硅基生物”。那么这些智能算法也许并不适合我们人类这种有机物组成的“碳基生物”,更重要的是,我們还没有真正弄清楚我们人类智能的本质,所以我们无法真正复制同样的机制。但是这并不妨碍我们用算法实现很多人类以前做不到的事情。我们可以想象一下,人类和计算机都生活在一个客观的、遵循物理规律的世界中,里面有很多难题,人类进化出了一些解决方案,但是计算机也可以在人类的帮助下,实现另外一种01逻辑变换为基础的解决方案,而二者未必要相同。只是在行为上,二者实现的功能是相似的,比如机器也可以识别数字、进行自动驾驶、自动翻译,这些与人类的智能反应看起来是相似的,但是内在基本原理却不同。

人工智能在近两年成了技术社会的新宠,尤其是自AlphaGo在围棋上超越人类开始,我们发现这种技术惊人的能力甚至带来了很多模糊的恐惧。实际上以机器学习为代表的人工智能技术在过去的20年内都是稳定发展的。在2000年前后,包括微软、谷歌在内的大公司就开始关注机器学习并开始布局。经过了18年后,那些当时被认为晦涩和深奥的算法开始被写进高盛的分析报告(注:2017年高盛发布了人工智能产业报告),让资本所追逐,成为社会新的技术发展力量。我们惊叹地看到新技术的发展,但是也不免担心更多人对于这门技术的误解,以及把它“忽悠”成我们面临大部分问题的救世主,这不是科学的态度。这里我想从我个人的理解澄清几个主要的关于人工智能的问题。

人工智能与数学

与其他的数理及工程学科一样,人工智能的基础知识也是数学,也有人说是逻辑。这个也是对的,其实严格上讲逻辑与数学也并不分家。曾经有多少数学家想把完备的数学大厦建立在逻辑的地基之上,虽然后来还是失败了(建议大家搜索David Hflbert、Bertrand Russell了解这段历史)。逻辑学家Kurt Godel用数学方法证明了这样的构想是不可能实现的。而计算机科学的基础数学之一——离散数学主要就是讲逻辑。一句话,计算机与数学不分家,人工智能一般认为是计算机科学或信息科学的一个分支,所以一样离不开数学。

作为一个合格的人工智能工程师,虽然不是所有的数学都需要,但是更多的数学知识和能力从来不是多余的。从本质上讲,机器学习的算法核心还是数学,人工智能的覆盖面更广泛一些。对于数据挖掘、人工智能、模式识别,主要要有高等数学(微积分、优化)、线性代数、概率与统计这3门非常重要而且必要的数学基础。比如在机器学习领域最常用的贝叶斯(如图2)定理(Bayestheorem),是概率论中的一个定理,它描述随机变量的条件概率,以及边缘概率分布之间的关系。事件A在事件B(发生)的条件下的概率,与事件B在事件A(发生)的条件下的概率是不一样的;然而,这二者是有确定的关系的,贝叶斯定理就是这种关系的陈述。很难相信不懂普通的概率分布可以用贝叶斯方法做推理,不懂线性代数可以理解高维空间流形,不懂微积分可以理解反向传播,和不懂优化能理解SVM。

这些必要的数学基础,一般也是教授在教机器学习和数据挖掘中一次次被复习的内容。甚至很多课程要花大量时间确定学生有这样的基础。当然,如果你有离散数学、复变函数、图论、运筹学等基础是更完美的,很多机器学习中的难点都可以迎刃而解。当然,如果你想深耕到统计机器学习理论的时候,可以在测度论、随机过程等方面了解更多。如果做归纳逻辑编程(Inductive Logic Programming)、知识工程与知识图谱,可以学习一阶逻辑(First-order logic)、多值逻辑甚至模糊逻辑。如果涉及到经济或社会方面,可以学习博弈论(Game Theory),很多最新的研究是基于计算博弈的。

深度学习

深度学习通过利用深度神经网络(如图3)构建了复杂度的数学模型模拟给定输入输出的真实函数关系。虽说机器学习的方法都是类似的思路,但是深度网络利用大量数据的确完成了以前我们没有解决的任务,在某些领域把准确率提高了一个或几个量级。我们也开始重新思考神经网络这种计算模型与生物神经网络的关系。这里可以澄清的是,我们目前的深度网络不是在模拟人脑,也不是通过使网络更像人脑的神经工作原理提高准确率。严格来说,这次人工智能的卷土重来也是在算法上和利用数据上、硬件使用上提升到了新的技术高度,并非我们勘破了人类智能的玄机。我们希望趁着这个风潮发展“类脑”人工智能,但是我们还在期待伟大发现的到来。

对于我们面临的难题,并不是有大量的数据就一定会解决问题。通过我们对数据的认知,甚至通过我们对于利用复杂的深度模型自动提取和发现数据中的特征,我们也许能够在以前的研究上更进一步,但是不代表数据就是一切。因为我们很多解决问题的钥匙,不见得就在这些大量数据中。如何获得有效的数据,以及对于问题的理解,都是一些解决关键问题的态度。况且不是所有复杂的难题,都是机器学习问题。比如一个人在超市购物的数据,更能说明这个人的财政状况和对物品的偏好,但是通过这些数据判断一个人的教育程度,远远不如直接拿到他购买书籍的数据。我们深信数据中神秘和潜在的那些规律,但是也不能迷信和对未知数据神化,正如一个不懂技术的老板,把他们家过去10年的购物清单给你,让你判断什么时候会地震一样。虽然这个例子很荒谬,但与我们面临的很多挖掘问题相比,只是荒谬程度的不同而已。我们要相信一个数据科学家的专业训练和判断,不要武断地认为挖不出金子,就不是好矿工。金子是否能挖出来,还是取决于这片土地中是否蕴含这种元素。数据挖掘曾经被人开玩笑地解释为“不断的折磨数据,直到它们招供为止”,当然,它们能招供的必然是它们知道的东西。

人工智能不是只有深度学习。虽然今天的人工智能的技术代表是深度学习技术,但是很多领域的研究在过去的几个十年中都是在不断进步和进展的。人工智能可以帮助我们整理人类的知识,将其变成可沟通或问答的“聪明”数据库;人工智能可以指导无人机或机器人编队完成协作任务,比如踢足球;人工智能可以帮助我们实现工业控制中的优化,提高供應链的效率,自动为货品定价、给广告排名;人工智能可以辅助人机交互,识别我们的意图,通过问答增强对我们意图的理解,自动完成最好的交易或设计一个新市场。人工智能其实包含了很多不同方面的技术与应用,但是不可否认的是,基于大数据与深度学习的方法在人工智能的各个领域都受到了关注,也有研究者每天不断地在推动其在各个领域的技术进步与升级。

人工智能与青少年教育

我们国家把人工智能技术的发展和应用写入了很多政府发展报告,这是一件非常有重要意义的事,充分说明我们政府在科技发展方面领先的思路和决心。但是人工智能利用还是一个高门槛的前沿科技领域,人才非常重要。作为后备人才,如何让青少年能够学习人工智能,或者如何使用人工智能技术促进教育,都是摆在社会面前的重要议题。

我个人认为,人工智能虽然是计算机科学的一个分支,但是正是因为提升到了国家战略的高度,我们可以塑造人工智能的大学科的概念,在青少年时期,打好数学、编程、创意设计、数学实验、数学建模等人工智能的基础。当然也可以把这些课程作为人工智能大学科的一部分。关于信息教育,我们国家已经高度重视,在青少年时期引入编程教育。因为教育要遵循孩子的智力发展水平。人工智能作为一个研究领域,实际上是一个高阶课程。它的基础是数学与编程。如果不打好基础,宛若空中楼阁,但是为了打好高等数学的基础,中小学又很难做到,就形成了基础的矛盾。大家可以想象一下,怎么没有人问如何让高等数学走进中小学,因为线性代数和微积分对于中小学都太难了。但是这些知识都是我们在学人工智能之前的基础课。可以想象一下,连基本的矩阵都不懂,怎么去理解卷积、神经网络;连微积分都不懂,怎么能理解梯度下降。这些还只是人工智能中的基础概念。所以对人工智能的严肃学习,需要在中小学打好编程和数学的基础。

目前社会上存在一些创意编程的课程和编程语言,以及大量的机器人课程给孩子们使用,尤其是MIT开发的Scratch,采用的是一种界面化的编程思路让孩子们能够体会基本的编程思想,让孩子们用程序作为工具实现自己的设计。很多网上社区的孩子们会共享程序。此外机器人的培训就更多了,甚至已经深入到了学校和社区,这里就不赘述了。

对于高级的人工智能技术进入中小学,可以让孩子们了解一下神奇的现象,如同带领中小学去参观英特尔或高通的实验室,让他们能够开开眼界,但绝对不能让小朋友来自己DIY个CPU什么的。我们的目的是让中小学生能够欣赏(appreciate)和理解基本的AI的思想,不要求他们掌握AI的技术细节。我们可以让中小学生可以尽早地接触到AI的基础部分,如简单回归算法等,但是课程内容需要精细的课程设计和选择。我们不可能系统地学习人工智能,不代表我们不能把一些简单思想通过简化过的例子,制造打包的算法与功能块进行实现。如同中小学生不能理解《红楼梦》,但是我们可以把故事缩写成简化本。

人工智能与人类不确定性的未来

机器的发展是人类科学技术发展的一个侧影,其实就是我们发觉了我们人类的弱点,有很多事情我们可以通过制造机器帮助我们提高生产效率,帮助我们创造更好的生活。从历史来看,机器一直在顶替人做了很多工作,而且也在很多领域超过了人,我们人也渐渐地从这些领域中退出。所以,这件事情一直在发生,不过以前的是机器,现在是机器人而已。

机器人,实际上指的是智能机器,这些智能机器当然不必是人类的形状。实际上越不是我们的形状,它的优势反而发挥得更好,如水下机器人、多轴无人机、擦玻璃机器人等。考虑到实际情况,我们从来没发现需要设计一个类人的机器人用他的手臂拿着抹布擦玻璃。

你会在很多西方的电影里发现有种工作特别适合只是女性,就是打字员,很遗憾的是,这么漂亮的一个工种已经被我们今天的电脑和打印机代替了,现在不会觉得这是一个特殊技能的工作。甚至如以前的绣花、钉鞋、打铁等工作也已经几乎消失了,取而代之的是各种不同机器。当然你也会发现麦当劳的点餐机已经减少了他们雇佣点餐员的数量,ATM机的普及也减少了银行柜台人员的数量。以后超市的自动结款、饭店的自动点单和结账,这些都能逐步减少人工,也可以简单地认为机器正在拿走人类的工作。

但是也不难发现,这些工作都是简单重复性工作,即使涉及到判断和分析,也都是比较简单的。这样的工作避免不了会被逐步替代,但是这不是人类悲观的理由,因为这样,很多简单工作被机器做了,人们就可以把要求放到更高,有更多高层次的需求,就会有新的工作出现。我们也在被技术倒逼提高我们人类自身的技能。如果你在任何方面都没有一个机器人好,也许你也无法逃脱这样的命运,就如你如果是个文盲的话,在现代社会你几乎不会找到工作。我们都不能做未来世界的文盲。

关于未来的机器,有其他回答也提到了很多大咖的看法。关于未来人工智能的风险,推荐大家看这里,里面有很多不同的意见,尤其是关于人工智能未来对于社会的风险。

关于工作的概念,我们也可以借鉴历史。随着科技和社会的进步,人的需求产生了工作。而人的需求也是从低级的吃饱穿暖到文学、科学、艺术……而且工作的形式也随着新技术的产生而变化。总之,是人在工作中的自由度在变大,而不是变小。很多重复性的脑力工作也是可以通过智能化提高效率的。以前我们人能完成的统计分析、简单决策判断,一般来讲都是有固定规则的工作,尽管规则可能复杂,但是这样的工作被智能算法替代的概率是很大的。

上面提到的脑力工作中,如果能产生大量的数据和有限的模式,比如在麦当劳点餐,能被点的组合是有限的,但是点餐的数量是不断增加的,这样的工作就很容易被替代。但是如果涉及到创意、发明、理解这些还没有被机械化的范畴的工作,就可以说被替代的概率要小很多。未来的机器与人类共存,工作的形式也会发生变化,很可能是你和机器人或算法一起合作工作。未来的工作是离不开信息化和智能化的,即使你的工作不被完全替代,但是在内容和形式上也会发生巨大的变革。Are youready?

最后

如同我在前面提到的一样,这是一个激动人心的时代,我们信息技术今天的发展如同20世纪初物理学的发展一样,在不断地进步与迭代,更重要的是,新发明与新技术在以更短的周期改变人类的生活。人工智能技术会对各个行业产生深远的影响与升级,这个升级是遵循我们在开始提到的朴素的技术规律的。各个行业的AI+及技术升级,将提高各个行业的生成效率。我们要用聪明的算法尽可能地利用信息为人类服务。

最后我非常愿意为我们好奇年轻的读者回答一个大家关心的问题,就是人工智能是否会统治人类。我当然不敢断言这样的事情不会发生,但是这个问题更像是你在关心以后在火星生活要不要担心地震一样。这个问题还很遥远,目前还不是一个可被解答的科学问题。我们不是不鼓励丰富的想象力和各种思辨的方法看待这个问题,只是我们目前人类有限知识范围能画出的这个圈子还很小,我们仍需要大量的工作在提高我们对于智能的认知后,才能对这个问题有更好的认知。

猜你喜欢
机器机器人人工智能
机器狗
机器狗
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
神奇的独眼机器
机器人来帮你
认识机器人
机器人来啦