岳未央
人工智能(AI)机器学习是诞生于20世纪中叶的一门年轻的学科,它对人类的生产、生活方式产生了重大的影响,也引发了激烈的哲学争论。佛罗里达国际大学计算与信息科学学院助理教授马克·弗雷森(Mark Finlayson)认为,AI带来的真正危险不在于艾隆·马斯克(Elon Musk)和斯蒂芬·霍金(Stephen Hawking)(他对AI完全不懂)所述的机器人会胡作非为。真正的危险在于:AI会如何影响我们对待自己的方式,这就像核武器的威慑力那样。并且这一可能性与我们的距离远比我们自己设想的要近,它几乎就是已经在发生的事实:Uber声称要给我们提供许多无人驾驶汽车。如果这件事真的发生了,想象一下相关行业的利润不是与全世界竞争共享,而是流入一个单独的公司中或者一个人的口袋中时,世界会发生怎样的剧变?
有一个说法,说科技的进步是远远超过人类本身的进化,之所以科技和信息技术有如此飞速的成长,主要的一个原因就是所谓的摩尔定律,摩尔定律就是我们的计算能力每过18个月就翻一次倍,在过去一直按照摩尔定律进行。
今后的发展如果按常规的技术用摩尔定律进行推进的话,会碰到一个瓶颈。为何会出现这种情况呢?本质上的原因是在于如果把一台电脑放在自己的大腿上,时间长了我们会觉得很烫。这是因为在计算过程中电子的能耗非常大,而假设每个三极管所产生出来的热量都是差不多,经过18个月翻一次倍速的运行增长,机器本身的发热量也将相应翻一次倍。这就意味着目前的这台机器已经无法满足日常的“超负荷”运行需求,我们需要更高的技术和更好的材料来承载更高速能带来的更大负荷。
但是对于科学家来说这是一个非常好的机会,能不能寻找一个新型创新摩尔定律能够继续往前进非常关键。摩尔定律会碰到这样的问题:在赶集的集市,想象你是一辆跑车,它在赶集的时候始终在碰撞,如果不能散发热量就会受到阻碍。如果想到这个原理大家就可以想到我们为什么不为电子在芯片的层次做一个高速公路,这就是科学研究的发明,电子在芯片层次有一个车道的概念,能够各行其道互不干扰。在右边我们可以使用尾灯,这个车往前走,在左边的话我们是往前开,如果能把高速公路的运动模式实现在电子芯片层次的运动模式,我们真正意义上有一个新的工作原理,使得摩尔定律能够往前推进。
之所以人工智能在最近一段时间能够有突飞猛进的成长,主要是几个原因:一个受到摩尔定律的影响,由于计算能力每过18个月就翻一次倍,用的芯片就能够做非常快速的信息处理,单位元能够做的机器处理比人的大脑神经元都来得多。如果能把机器芯片模仿人的大脑神经元,就能形成一个网状的神经机构,大数据的时代使得及其能够快速学习。人工智能现在还只是停留在仿生学的一个阶段,可以做一个类比,比如人类曾经非常向往飞翔,我们之所以向往飞翔就是看到鸟会飞,看到鸟会飞,我们就想自己能不能也长一个翅膀飞。比如伟大的艺术家达 . 芬奇曾经设计过人身上辅助一个翅膀能飞起来,所以这是一个简单的仿生学。但我们人类真正能够学会飞行是由于我们理解了飞行的原理——空气动力学,一旦我们理解了飞行的原理就可以造大飞机,大飞机看起来和鸟不完全一样,但却是从鸟那边来的启发。所以这对于人工智能来讲也是最大的挑战,现在的人工智能还仅仅停留在用神经元仿生的原理,而我们真正需要的则是一个能够发展人工智能的理论基础。
人工智能是怎样发展起来的
回顾整个人工智能发展史,不得不去引发高度关注的是“机器学习”这样一个重要的铺垫式技术发展进程:
奠基时期
20世纪50年代初到60年代中叶
Hebb于1949年基于神经心理学的学习机制开启机器学习的第一步。此后被称为Hebb学习规则。Hebb学习规则是一个无监督学习规则,这种学习的结果是使网络能够提取训练集的统计特性,从而把输入信息按照它们的相似性程度划分为若干类。这一点与人类观察和认识世界的过程非常吻合,人类观察和认识世界在相当程度上就是在根据事物的统计特征进行分类。而这个研究成果也就正式揭开“机器学习”也就是“人工智能”技术的第一篇章。
从60年代中到70年代末,机器学习的发展步伐几乎处于停滞状态。虽然这个时期基于逻辑的机器归纳学习系统取得较大的进展,但未能投入实际应用。这个时期的研究目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为认知基础。机器能够采用符号来描述概念,并提出关于学习概念的各种假设。
事实上,这个时期整个AI领域都遭遇了瓶颈。当时的计算机有限的内存和处理速度不足以解决任何实际的AI问题。要求程序对这个世界具有儿童水平的认识,研究者们很快发现这个要求太高了:1970年没人能够做出如此巨大的数据库,也没人知道一个程序怎样才能学到如此丰富的信息。于是AI研究就此告一段落,人们的“人工智能”梦也因此暂时进入休眠状态。
20世纪70年代末到80年代中叶
从70年代末开始,人们从学习单个概念扩展到学习多个概念,探索不同的机器学习策略和各种学习方法。这个时期,机器学习在大量的时间应用中回到人们的视线,又慢慢复苏。1980年,在美国的卡内基 . 梅隆大学(CMU)召开了第一届机器学习国际研讨会,标志着机器学习研究已在全世界兴起。此后,机器归纳学习进入应用。
蓬勃发展时期
21世纪初至今
机器学习发展分为两个部分,浅层学习(Shallow Learning)和深度学习(Deep Learning)。1)这个阶段的人工神经网络具有优异的特征学习能力,学习得到的特征能对数据有更本质的认识和分类;2)深度神经网络在训练上的难度,可以通过“逐层初始化”来有效克服,且这种学习能够在无监督的状况下实现的(网络系统基于语料库自动抓取)。
神经网络模型貌似能够实现更加艰难的任务,如目标识别、语音识别、自然语言处理等。但是,应该注意的是,这绝对不意味着其他机器学习方法的终结。尽管深度学习的成功案例迅速增长,但是对这些模型的训练成本是相当高的,而维护和二次开发的成本依旧很高。
由此我们可以看出机器学习的发展并不是一帆风顺的,它也经历了螺旋式上升的过程,成就与坎坷并存。其中大量的研究学者的成果才有了今天人工智能的空前繁荣,是量变到质变的过程,也是内因和外因的共同结果。
人工智能在关键领域的“跨界合作”
AI和自动化机器人已经对我们的生活产生了极大的冲击,从打扫卫生这样简单的事到像自动驾驶汽车和Google DeepMind这样的复杂任务。AI现在覆盖的领域已经非常火,有大数据、移动互联网、有人工智能,总体而言人工智能有两个主要的应用路径:
一是用云端大量的数据做计算来成为行业决策的重要辅助工具,而这种途径通常只适用于大企业。伴随着大数据、云计算等新一代信息技术的快速发展和智能化应用需求的日益凸显,今年“阿尔法狗”将人工智能的话题推向了一个新热度。人工智能技术的突飞猛进不仅体现在神秘的机器人领域,它在人们日常生活中的发展和应用同样越来越引人注目。
人们对新事物总是充满恐惧。就在大家担心无人驾驶汽车是否弊大于利的时候,AI重塑金融规律的创新也引起许多人对其中的法律和道德问题的顾虑。让一个软件程序来决定,谁拥有投资开户的资格,谁能够获得贷款(征信),应该收取多少的费率,甚至在主流金融体系之外的金融服务客户都可能收获意想不到的后果。但也有些人认为,没有什么能够比算法更公平公正了——纯粹数学,毕竟,不会有偏见,对吧?
这个论点的缺陷之一是,算法也是人为创建的,通常会在连他们都意识不到的细微处隐含了偏见。这些偏见也许会被嵌入到算法当中。比如,去年卡内基 . 梅隆大学 的研究者测试谷歌的算法是如何向用户推送广告时发现,广告设置中的“男性”和“女性”标签中,谷歌会给“男性”用户推荐薪酬更高的招聘广告。更极端地说,一个人工智能引擎做出信贷决策时,也许会倾向于只认可常春藤盟校毕业的,或者家庭收入超过30万美元的群体。
人工智能,究其本质而言,还不能完全控制今天的以规则为基础的系统。在AI里面,电脑可以随着时间的推移来学习人们通常是如何做的:通过接收信息,然后决策基于这些数据进行征信决策,并不断观察结果进行风控。随着它们在错误和正确的信息中不断学习,它们会不断修正自己的规则和算法,然后开始作出它们自己的结论。
乔治 . 华盛顿大学社群主义政策研究所国际事务教授兼主任Amitai Etzioni指出,无人驾驶汽车被指示不要超速,但它们也被设计了学习程序。当周围的汽车加速时,它也会加速。它们所谓的标准是根据周围的参照而对结果做出调整。
使用人工智能自动化决策的另一个问题是,它们是否会使用智能合约技术自动执行,谓之可依赖性。“一不小心,我们就可能无法实现我们认为通过自动化能够做好的一切,”多伦多一名专门研究反洗黑钱规则、反恐怖主义集资、跨国资产追回的律师,Digital Finance Institute联合创始人克里斯丁·度海枚(Christine Duhaime)表示,“原因是,我们实现越高水平的自动化后,就越难与人类沟通问题。如果一个自动生成的决策将对客户造成消极后果,那么这需要对其有一个保护的机制。”
确保决策过程中所有被用到的数据都是精确且最新的,这对企业来说是一个特别的责任,除非用户明确表示授权,同时企业在适当的时候具备恰当的技术安保措施和隐私保护政策,并且只访问特许储存的数据。度海枚指出,在AI中还有一个危险隐患是,该技术实则将那些无法使用计算机或移动设备的残疾人和老者排除在外了。“在这样的情况下,我们打着普惠金融的旗号,最后却将大部分客户拒之门外,我们实际也没有解决银行现存问题的能力。这只不过是制造了不可解的新的金融问题罢了。”
其次就是被用于与生物科技领域的人工智能技术。生物学者通常通过人工智能来读许多医学的图片,比如看X光的图片、看超声波的图片、看核磁共振的图片。这也是在生物基因技术产业上非常好的布局。日前,CB Insights 研究公司整理出一份医疗领域AI创业图景,统计了全球活跃其中的 92 家初创公司。在 2011 年,人工智能医疗公司的融资交易只有 10 起,而到了 2015 年,这个数字达到了 60 起。
Frost & Sullivan 的分析师 Harpreet Singh Buttar表示,“到 2025 年,不管是人类大健康管理,还是利用虚拟形象与患者交流,AI 都会渗透其中,贯穿生活的方方面面。”从中我们也能看到人工智能+医疗的一些关注热点。
图像及诊断类:从 2015 年 1 月开始,图像及诊断类的 22 家 AI 创业公司中,有17家获得了天使/ A 轮融资,可以感受到这一领域已经呈井喷之势。Frost & Sullivan的一份报告指出,2005年以来,医学成像资料存储量已经增长10倍,并且随着更多先进设备的推出还会继续增长。
药物挖掘公司:目前, 8 家药物挖掘公司中已经有 6 家获得了风投,药物挖掘同样也是一个值得关注的领域,相关的新兴公司也不少。
以肿瘤治疗为代表的精准医疗:肿瘤治疗因其复杂性及个性化的特点,如果能运用人工智能实现“降维”精准打击,无疑能提高治疗的效率,说不定又会有一条生命因为科技而被拯救呢?
远程病患监控:目前的初创公司主要是通过自然语言处理及深度学习实现这一功能,当患者通过语音描述症状时,系统能基于海量数据库的知识给予反馈。
医疗算法平台:如果在医生资源或医院资源上受到了限制,专注算法并将方案提供给医疗供应商也同样是一个不错的选择。
“AI的下一个挑战就是把不同的层面联系在一起,首先要有非常精密的程序。”牛津大学计算机系主任、教授迈克尔·伍迪季(Michael Wooldridge)表示,英国、美国和中国很多人都使用智能手环,它能够监控人的心率、血糖、走了多少步等,所有这些信息给到AI,就能去实现一些健康的应用。在英国,一种观点是人工智能最大的应用就是在医疗体系的优化上。英国国家医疗系统的病例,包括所有英国人的病例数据和用药记录结合AI技术,将有望极大地完善英国的全民医疗体系。“今天所讲的AI就能够运用到医疗领域,确实为整个医疗行业带来新的发现,所以人工智能的下一个风口应该是在医疗领域。”