周志华
经常有人问:“比人类更聪明的人工智能什么时候能够出现?”这样的问题非常难回答,因为谈到人工智能,有两种完全不同的观点,其差别非常之大。
一种是“强人工智能”观点,认为未来会研制出和人一样聪明,甚至比人更聪明的机器;另一种是“弱人工智能”观点,认为人更聪明,机器工作应向人类借鉴而变得“聪明”。目前在人工智能科学界,探索主要集中在“弱人工智能”。
人工智能做的事情就是借鉴我们所看到的智能行为,做出工具帮助我们做更强大的事情。应该说,人工智能研究的主要目的并不是“人造智能”,而是“intelligence-inspired computing”,智能启发的计算。
人工智能发展的三个阶段
人工智能作为一门学科诞生于1956年。彼时计算机的能力还很弱,但已经有很多学者在思考“随着计算能力的发展,计算机是不是可以做一些更复杂的事情?”同年夏天,在达特茅斯学院开了一个会议,后来被称为人工智能之父的约翰·麦卡锡在这个会议上提出了“人工智能”这一概念。
经过60余年的发展,从主流研究内容来看,人工智能的发展经历三个阶段:
第一个阶段是20世纪50年代中期到60年代初,这个阶段主要是将逻辑推理能力赋予计算机系统。图灵奖得主西蒙和纽厄尔研制出来的“逻辑理论家”程序就是其中典型代表,可以说,当时的计算机所具有的推理能力已经达到了人类的巅峰水平。
慢慢地,人们意识到,计算机仅有逻辑推理能力是不够的,即便是数学家,为了证明数学定理除了要有逻辑推理能力,还要有数学知识。所以人工智能的研究很自然地进入了第二个阶段,即“知识工程”时期。在这个阶段,人们将知识总结出来,教给计算机系统,由此产生出很多“专家系统”,实实在在地解决了很多应用问题。
随着时间的推移,人们发现要把知识总结出来再教给系统非常困难。一方面,有时候我们虽然能够解决一些问题,但是这个知识是什么可能说不清楚。另一方面,有些时候人们并不愿意去分享知识。为了解决这一问题,人工智能研究先驱们希望让机器可以自动地学习知识。从20世纪90年代开始,人工智能的主流研究进入第三个阶段(机器学习)且一直持续至今。
大数据时代的机器学习
机器学习的经典定义是“利用经验改善系统自身的能力”。不论怎样的经验,一旦放在计算机系统中,必然以数据形式存在。机器学习要研究怎么去利用经验,就必须对数据进行分析。因此,机器学习这一阶段发展到今天,主要研究的是如何利用计算机对数据进行分析的理论和方法。
20世纪末,人类发现自己淹没在一个数据的海洋里,我们需要对数据进行分析,而机器学习恰恰在这个时候走上历史的舞台,给人类提供了一个机会。因此,我们对机器学习快速发展的需求高涨。
今天被定义为“大数据时代”,但仅有大数据并不意味着获得了价值。大数据是一座矿山,我们拥有了矿山,但如果想要得到矿山的价值,必须有强大的数据分析技术,而这个数据分析技术就是要机器学习。在大数据时代,想要让数据发挥作用,离不开机器学习技术。
机器学习在今天可以说是无处不在,无论是互联网搜索还是人脸识别、汽车自动驾驶、火星机器人,甚至包括美国总统大选、军队的战场数据情况分析,任何地方只要有数据存在,只要人们希望用计算机来帮助进行数据的分析,就可能使用机器学习技术。我们说人工智能现在很“热”,恰恰是因为机器学习,特别是深度学习技术在过去的十年里取得了巨大的发展,在大数据时代发挥了巨大的作用。如今,很多企业的解决方案是基于深度学习技术来实现的。
机器学习的技术局限与下一步发展
在谈到机器学习的时候,有些人想到的是算法,有些人想到的是数据。可以说,今天的机器学习是以“算法加数据”的形态存在的。在这种形态下,技术存在一定的局限性。
数据需求大
首先,我们需要大量的训练样本。在一些应用里,我们的样本总量很少,比如在做油田定位时,数据必须通过人工诱发地震才能获得,数据的获得成本是非常高,不可能有大量的数据;其次,数据可能很多,但满足精准需求的很少。比如银行在做欺诈检测时,每天一个银行的信用卡交易数据可能有几百万甚至上千万条,但其中信用卡欺诈的数据可能很少;另外,数据的总量很多,但是已经被标注了结果的很少。比如做软件的缺陷检测,我们拥有大量的程序代码,但程序代码中缺陷被标记出来的非常少。
环境适应弱
一个已经训练好的机器学习模型,如果环境发生变化,就很有可能失效。比如在一个传感器世界里,放出一百个传感器。一个月之后有60个传感器失效了,这时候重新部署60个传感器,原有模型的性能会大幅度衰减。因为新的传感器所发出的信号质量和强度和原来的也会有很大的变化,原有模型已经很难适应。
可解释性差
今天的机器学习系统绝大多数都是黑箱,我们可以利用机器学习非常精确的预测,但是很难解释是如何做出这样的预测的。这就会导致机器学习系统在一些高风险应用里很难使用。比如做地震预报,我们预报明天有地震,请群众撤离。领导肯定会问是如何做出这样的决策,这时候如果机器学习模型是黑箱,我们将无法说明做出预报的理由,这样的预报很难被采纳。
性能差异大
我们在使用机器学习技术时,即使对同样的数据,普通用户所能得到的结果和专家所能得到的结果差别可能非常大。怎样处理数据、如何使用机器学习模型,每个人的知识和经验差别会导致获得结果的巨大差异。
数据分享难
以现有的医院情况举例。如今各地都在发力智慧医疗,大型医院里很多病例数据,基于这些病例数据能够做出非常优秀的诊断系统。相比之下,社区医院的病例数据较少,基于已有数据很难做出好的模型,需要大型医院的数据支撑。但是大型医院一旦与社区医院分享病例数据,会涉及到数据隐私、数据所有权、数据保护等问题,对接起来非常不舒畅,存在一个数据分享的“墙”。
学 件
关于机器学习,还有很多其他问题。几乎每个研究方向都有人在做相关的探索。但如果将所有问题逐一独立解决,很难摆脱“头疼医头、脚疼医脚”的状态。应该考虑在一个整体性的框架之下全面地去思考并解决这些问题。最近研究者提出了一个想法,叫做“学件”(Learnware)。目的是让那些在某一领域的机器学习应用中已经建立好的模型被分享出来,建立一个“市场”让人们能够分享这些模型。这样,当一个新用户想要做机器学习应用时,就不用从头去建模型,而是可以先到学件市场上在已有模型中寻找合适的模型作为基础。
为了达到这一目的,学件应由两部分组成。一部分是模型(Model),另一部分是用于描述这个模型的规约(Specification)。模型需要滿足三个重要要求:可重用性、可演进性、可了解性;规约要能够给模型提供足够的描述。如果学件市场可以成为现实,我们将解决机器学习的局限性问题。