教会机器人学习

2016-05-21 10:12南露

大科技·百科新说 2016年1期

南露

假如，有一天，在每个家庭，都有一个机器人，洗碗做饭，收拾房间，承担所有的家务；在每个公司，大部分工作都由机器人来做，人类可以完全摆脱苦力劳动。这样的未来，会不会对你很有吸引力？但要想进入这样一个梦想中的人工智能时代，我们得先教会机器学习。

让机器自我学习

就像每个人在获得技能前，必须经历过学习训练一样，机器要实现智能化，也只能通过学习。机器学习起源于人工智能的一个分支，在这一领域，计算机科学试图创造计算机的类人智慧。

真正的机器学习与我们所认为的传统编程有本质的不同。当提到电脑程序时（或者一个程序里用到的运算法则），我们一般会认为是工程师为电脑下达了一系列指令，告诉他们怎么样去处理一系列的输入，然后产生相应的输出。一个浏览器会跟踪被浏览的网页，然后对于用户的输入通过一种确定的可预料的方法进行回应。但这些都是由人类事先编码好的，而非机器主动学习的结果。

机器学习，就是机器自己编程，这些机器经过培训，也能像人类一样进行编程。谷歌公司2015年发布了一款名为“深梦”的图片识别应用软件，这款软件不仅可以识别图像，而且可以利用图像制造一些出人意料的奇幻景象。例如，你呈现一幅风景图时，软件会根据你的图片进行分析，输出一幅计算机眼中的风景图。

这是怎么做到的呢？谷歌深梦的运作原理是通过模拟人类的神经元网络，建立起计算机自己的神经网络系统，通过神经元获得物体的信息，从而进行分析。计算机的神经元网络系统包含了上千个互动的神经元，以实现数学上的精密运算。

当然，为了让机器能识别物体信息，在过去四年里，研究者们一直用大量图片训练电脑神经网络，例如给“深梦”软件看许多图片，并告诉每张图片中的主体是什么，一旦“深梦”从上百个角度看过上百个狗头一千次之后，它就能学会自己输出图像。

在实验中，“深梦”产生出了混合着鸟、眼睛和狗头轮廓的模糊图像，虽然它们并不那么栩栩如生，但是也揭示了电脑处理图像时的一种创造性，它已经不用人类监督指导地学会了识别小猫、小狗的脸。

神经网络的机器构造模仿了人类大脑，也充分发挥了计算机超强的记忆功能，在生活中有更普遍地应用。谷歌的搜索引擎、亚马逊的推荐目录、脸书的好友动态和垃圾邮件的过滤，还有军事、金融、科研、比人类驾车更靠谱的自动驾驶等重要工作，都是神经网络运作的具体应用。

今天，机器学习已经被成功地应用于更多领域，从检测信用卡交易欺诈的数据挖掘程序，到获取用户阅读兴趣的信息过滤系统，再到能在高速公路上自动行驶的汽车。可以说，我们的智能生活，都是机器学习的结果。

研究机器人学习的算法

机器学习能追溯到上世纪40年代二战结束前后，得益于战时交战双方的科学精英殚精竭虑，计算机理论在那一时期得到突飞猛进的发展。当时，控制论研究者们设想有一个神经元计算机模型，能够大致模拟生物神经元，并且可以用一种简洁和明确的数学形式来表示。

但是，面对一个不确定性和多样性的世界，人工预先制定的数学形式根本就难以应付。或者说，人工编程的世界，与现实的人类世界偏差太远，现实的世界不会那么有秩序和守规则。

例如，计算机预先以数学形式来表达马有四条腿，但这会产生两个问题。首先，电脑怎么样去学会理解这个事实；其次，对于那些因意外而失去了一条腿的马怎么办。这些看似是很愚蠢的问题，却是人工编程时遇到的最大障碍。这就是为什么至今搜索引擎还不能回答问题、仅仅能搜索关键词的原因所在。

但如果机器学习创造了自我编程系统，就可以对于他们自己的错误做出反应，并且不断更新他们的内部状态。人工编程中的漏洞在发布之前需要被检查出来，而机器学习的运算法则能在过程之中不断纠错，比人工智能更加灵活、有智慧。

但怎么能让机器学习呢？这就涉及到算法。可以说，算法是构建互联网的核心，现在许多网络搜索和沟通方式，都是基于设定好的数学公式构建起来的，比如谷歌搜索引擎、苹果语音系统、Facebook。在信息时代，我们的生活实际上是被一些数学公式引导着，在医学方面，已经有了公式能算出糖尿病和疟疾。今天，我们也在让学习公式的机器查看胸透时的X线量。

连接学习、符号推演法、贝叶斯学习、类比学习是4个当代计算机学习范式。其中，连接学习就是模仿人脑神经系统，建立起计算机人工神经网络；符号推演法就是将问题或知识表示成某种逻辑网络，采用符号推演的方法来学习；贝叶斯学习理论就是通过概率规则来实现学习和推理过程；类比学习就是通过对相似事物进行比较来学习。这4种学习范式还是过于复杂了，因此，华盛顿大学教授佩德罗·多明戈斯提供了一个更大胆的假设，即在未来，能将现有的算法公式统一成一个万能算法。

万能算法下的世界

多明戈斯构思了这样一个万能算法，它能将物理学、生物学上已经发现的理论和标准模型或者中心法则统一起来，同时，可以从数据中发现所有的知识，所有的人类现有的知识，也包括所有的未来的知识。例如，万能算法可以从第谷·布拉赫的太空观察中，推出牛顿定律，即使它没有相关的基础知识。

大脑皮层可能就是这样一个万能算法的典型例子。一些神经学家认为在所有领域，大脑皮层只用到了一个相同的公式，就能不断调整皮层下各级脑部及脊髓的机能，使他们能根据环境不断学习调整，听见、看见或者是弄懂周围世界的意思。

在信息时代，万能算法也将发挥类似大脑皮层的作用。它能在数据云的基础上，学习和利用信息，改变现在呆板的计算机被动执行模式，主动改进功能和完善输出，这将给人类信息生活带来革命性的转变。

例如，现在的网络信息量庞杂，打几个关键字，却得到了上百万网页，常常令人无法抉择。但有了万能算法，电脑将变成百科全书，只要问几个问题，就能很迅速地给出准确答案。

同时，今天的推荐系统也将得到彻底更新。现在，每个人会遇到许多的推荐信息。基于每个人留下的碎片化的数据，上百万个推荐系统每天会为你推荐不同的东西：暴风影音从你开始看他们的电影时，就为你推荐电影；亚马逊根据你买了什么和没买什么为你推荐书本；新浪会在你注册时推荐上百个兴趣群。但大多数人可能更需要的是一个更聪明的系统，能根据你上网产生的所有的数据和信息，来进行更具针对性的推荐服务。例如，它能在你生活的每个阶段推荐相应的东西，不仅是书和电影，还有房子、工作等。为了能达成这样的效果，首先就需要来自你日常生活所产生的数据，但另一方面，也需要万能算法，因为面对大量的数据，没有公式也无法处理这些数据。

假如真能成功找到万能算法，人工智能将真正实现。但对于未来这一智能图景，还是不免会让人担忧。比如，机器学习能够处理大多数的工作，世界将会有一个很大的失业群体，他们将怎么生存呢？会成为社会不稳定之源吗？假如人工智能被居心叵测的政治家们利用，世界还会太平吗？

对于这些问题，万能算法的倡导者佩德罗·多明戈斯并不担忧，反而十分乐观。他认为计算机不会具备生物进化的能力，也不会自己发明东西，因此，将不会对人类具有威胁性。相反，呆板的工作将由机器人承担，人类则去做更有趣的工作。地球的环境也会变得越来越好，人类将会活的更久更快乐，也更有创造性。同时，人们不会出现在战场上，机器人会亲自出征，这些会防止人类因战争而致的伤残。