人工智能:从规则学习,到数据驱动,再到能力增强

2017-06-05 14:59吴飞浙江大学人工智能研究所
杭州科技 2017年2期
关键词:驱动人工智能智能

文 / 吴飞 浙江大学人工智能研究所

人工智能:从规则学习,到数据驱动,再到能力增强

文 / 吴飞 浙江大学人工智能研究所

人工智能诞生背后的故事

1955年8月,John McCarthy(时任美国达特茅斯学院数学系助理教授,1971年图灵奖获得者)、Marvin Lee Minsky(时任哈佛大学数学和神经学初级研究员,1969年图灵奖获得者)、Claude Elwood Shannon(时任贝尔实验室数学研究员,后来被誉为信息论之父)以及Nathaniel Rochester(时任IBM公司信息研究经理)四位学者联名给美国洛克菲勒基金会提交了一份名为“人工智能达特茅斯夏季研讨会”的项目申请书,在这个申请书中首次提出“人工智能(Artificial Intelligence,AI)”这一术语,并指出“人工智能”研究目标是实现能模拟人类的机器,机器能使用语言,具有概念抽象和理解能力,完成人类自身才能完成的任务并且不断提高机器自己。

实际上,在这份申请书中,四位学者希望洛克菲勒基金会能够于1956年夏季资助10个人在美国达特茅斯学院工作2个月,解决如下人工智能领域的7个问题:自动计算机、计算机编程、神经网络、计算复杂性理论、计算的自我改进提升、计算抽象(直觉)、随机性和创造性。从现在的眼光来看,这份申请书中提出了一些时至今日也无法解决的难题,如难以用形式化方法来精确描述的直觉和创造性等,而这些难题也正是当今从弱人工智能(也称领域相关人工智能)向强人工智能(也称通用人工智能)迈进突破的艰辛所在。

人工智能从其诞生之日开始,就在人类追求“类人智能”这一朴实梦想感召下获得了蓬勃发展。图灵奖获得者、美国卡耐基梅隆大学Raj Reddy教授曾对21世纪之前的人工智能研究划分为定理证明和象棋博弈(1950s)、问题求解和语言理解(1960s)、语音-视觉和专家系统(1970s)、机器人和知识系统(1980s)、语言翻译-搜索和神经网络(1990s)等几个阶段。

但由于各种原因,人工智能在70年发展过程中曾经遭遇过三次挫折。

1973年,英国科学研究理事会委托剑桥大学卢卡斯讲席教授、物理学家James LightHill爵士领导了一个小组对当时英国人工智能研究现状进行调查,这个小组提交了一份独立报告,指出自动机和神经网络研究有价值,但是进展令人失望,机器人的研究没有价值,进展非常令人失望,建议取消机器人的研究。这一报告的发表,直接导致英国政府几乎停止了对人工智能相关研究的资助,被称为人工智能发展史上的严冬(AI Winter),也就是人工智能发展史上的第一次挫折。从第一次严冬挫折可以看出,从一个新生事物初始阶段,很难预测其未来,因此需要对其抱以一定的宽容之心。应该说,英国在人工智能早期研究中表现得十分活跃,如理论计算机之父图灵提出了对机器智能进行评测的“图灵测试”、Donald Michie教授在爱丁堡大学建立了英国第一个(也是世界最早之一)的AI实验室且逐步发展成为欧洲人工智能研究中心,而这些陡然而来的努力进步随着第一次严冬的到来戛然而止。

1982年,日本启动了研制第五代计算机的计划,其动机在于从单纯计算与存储的计算机模型向知识推理的新型结构过渡,即从“计算”向“算计”跃升。第五代计算机应该具有逻辑和推理等高级功能的“语言”(如类似逻辑编程语言Prolog等),有别于第一代以0和1构成的机器指令编码、第二代的汇编语言、第三代的高级语言(如C等)、第四代的领域相关高级语言(如用于数据库操作的SQL)。同时,为了支持逻辑和推理,第五代计算机还被要求连接一个庞大的知识库以支撑并行推理。但是,由于目标过于庞大和当时人工智能水平尚未具备这样的能力,1992年第五代计算机研制宣告失败,这是人工智能发展历史上的第二次挫折。第五代计算机研制的失败告诉我们:类似人脑推理的“工具”需要软件、硬件和知识的相互配合。

对知识的获取是人工智能的一个本质功能,即从各种感知数据(如视觉、听觉和自然语言文字等)获取人类社会所普遍认同的概念、实体和关系等知识。知识的不断累积将会推动智能产生质的飞跃。20世纪80年代开始,人工智能学者开始尝试通过手工来建设涵盖人类常识性概念和关系的知识库,如1984年开始建设的知识库Cyc。但是,在建设过程中,人们发现这种通过手工方式来编制本身就具有不确定性的知识网络是一项无法完成的任务。如果没有知识库,则知识推理等活动则会变成无源之水,于是人工智能发展遭遇了第三次挫折,这次挫折带来的后果是历史上出现的若干专家系统难以在更为开放的环境中使用。这次挫折带给我们的启发是知识不能完全依赖于专家产生,而是要将专家智慧与机器学习(即从数据中学习)结合起来。

人工智能三部曲:规则学习、数据驱动与能力增强

早期人工智能重点研究的是基于规则的知识推理方法。在这种方法中,会有一些规则和一套推理方法,其目标是基于推理方法去验证命题或谓词正确与否,或者学习推导出新规则/新知识。如IBM的沃森和卡耐基梅隆大学研制的NELL(永不停息的语言学习)。基于规则学习的人工智能方法解释性强(与人类逻辑推理过程相符),但其可拓展性较弱,难以构建完备的知识库以及具有完善的推理方法,。

当前不断涌现的大数据史无前例地记录和链接人类社会中个体和群体,刻画个体和群体生活、生产复杂模式或规律的知识隐藏在这些大数据本身之中,难以事先定义。因此,数据驱动的人工智能方法成为热点,这一方法利用机器学习等手段直接从数据中直接析取深层次知识(而不是事先定义)。如谷歌公司利用网络搜索引擎得到的大数据来预测疾病流行、百度公司利用手机APP数据和商业信息来预测“鬼城”等等。

目前,深度学习已经成为数据驱动学习方法的一种主流技术,深度学习是一种端到端(end-end)的机器学习方法,其基本动机在于构建多层网络来学习隐含在数据内部的关系,从而使学习得到的特征具有更强、更泛化的表达能力。在大规模数据上所进行的实验表明,通过深度学习所得到的特征表示在自然语言处理、知识图谱构建、图像分类、语音识别和视频识别等领域表现了良好性能。但是,深度学习这种“端到端”学习机制解释性较弱,并且其依赖于标注大数据,难以利用未标注数据,这是深度学习下一步要攻克的“黑洞”难题。

人类在学习过程中还存在另外一种学习方式,即问题引导下的试错学习。在这种学习方法中,我们事先不知道最终答案,于是在学习过程中不断尝试各种解决问题的可能途径,然后根据结果反馈来相应调整学习方法,这一学习机制叫强化学习。强化学习是一种学习的能力,从过去的经验中不断学习,提升能力。如Deepmind公司研制的围棋人工智能AlphaGo就是在自我博弈中不断提升棋力、卡耐基梅隆大学研制的德州扑克人工智能Libratus在与人类选手对弈中不断提高牌技。

规则学习是通过逻辑推理引擎来学习新知识,数据驱动是基于假设空间和先验来学习潜在模式,能力增强是通过问题引导来学习策略,这三种人工智能形成了从知识到数据、从数据到能力的三部曲。这三种方法各有优劣,目前正在走向相互融合的过程,如AlphaGo身上凝聚着蒙特卡洛树搜索,深度学习和强化学习就是一次将传统规则学习方法、数据驱动模式和能力提升手段相互结合的一种尝试。

人工智能的未来

当前,人工智能正成为提升国家竞争力、维护国家安全的战略利器,成为社会经济发展的新引擎,世界主要国家纷纷出台规划和政策,围绕核心技术、顶尖人才和标准规范等展开激烈争夺,力图在新一轮国家竞技场中抢占主导权,如美国决定在国家科学技术委员会中设立“人工智能和机器学习委员会”来协调指导全美各界在人工智能领域的行动。

为了推动人工智能与经济社会深度融合、提升我国人工智能科技创新能力,中国政府正布局2030年的一项中国人工智能2.0重大科技项目。

中国工程院原常务副院长潘云鹤院士2016年12月在中国工程院院刊《Engineering》发表了题为“Heading toward artificial intelligence 2.0”的论文,从人工智能60年的发展历史出发,通过分析促成人工智能2.0形成的外部环境与目标的转变,提出了人工智能2.0的核心理念,并结合中国发展的社会需求与信息环境特色,给出了发展人工智能2.0的建议。潘云鹤院士指出,人工智能2.0将着眼于人工智能从1.0到2.0的如下五个方面的跃变:从人工知识表达技术到大数据驱动知识学习;从处理类型单一的数据到跨媒体认知、学习和推理;从追求“机器智能”到迈向人机混合的增强智能;从聚焦研究“个体智能”到基于互联网络的群体智能;从机器人到自主无人系统的跨越。

杭州市目前是人工智能产业应用的高地,如阿里巴巴电商大数据的智能服务、海康威视2016年在智能安防跃居全球榜单。我们相信,在人工智能2.0这一背景下,杭州市将迎来更加美好的智能社会。

从我国古代的偃师造人、木牛流马到希腊神话中赫菲斯托斯的黄金机器女仆,人类从未放弃过对人工智能的追求与探索。站在当前背景下进行历史回顾与未来展望,我们认为可解释、更鲁棒和更通用的人工智能是今后重要发展方向,其表现为:从浅层计算到深度神经推理;从单纯依赖于数据驱动的模型到数据驱动与知识引导相结合学习;从领域任务驱动智能到更为通用条件下的强人工智能(从经验中学习)。

我们深信,下一代人工智能(AI 2.0)将改变计算本身,它会将大数据转变为知识以支持人类作出更好决策。

(作者系浙江大学计算机学院副院长、浙江大学人工智能研究所所长,博士生导师。主要研究领域为人工智能、跨媒体计算、多媒体分析与检索和统计学习理论。)

猜你喜欢
驱动人工智能智能
基于模糊PI控制的驱动防滑仿真系统分析
屈宏斌:未来五年,双轮驱动,砥砺前行
轨旁ATC系统门控柜接收/驱动板改造
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业
数读人工智能