夏畅 贺桂英
(广东开放大学,广东广州,510091)
“人工智能”的概念在上个世纪50年代被提出来,前50年的发展非常缓慢。到上世纪末,深度学习算法的发展和应用使电子计算机可以模拟人类思维进行运算,人工智能开始有了展现的载体。21世纪大数据技术的出现和发展,使人工智能有了质的飞跃。
如今,人工智能已经成为一个大热门话题,不管对错,各行各业都力求能与它沾点边。AlphaGo战胜人类的事件更是让人工智能的热度达到了一个巅峰,人们开始幻想人工智能可以达到什么程度。诚然,人工智能展现出了无限的潜能,但这种大热潮下也涌现了无数科技泡沫和商业骗局的出现。理解和认识人工智能是看穿这些泡沫和骗局的强有力途径。
人工智能的发展不是一蹴而就,在人工智能的概念还没产生之前,人类早就开始了智能的探索和思考,为后续人工智能知识体系的建立和实践运用的发展积累了宝贵经验。
人工智能的历史可以追溯到古埃及,金字塔的建造至今仍是迷,“人工智能建造论”一直是学者们的一个猜想。在我国,有文献记载的第一个机器人是西周时期能工巧匠偃师研制出的伶人,它能歌善舞。三国时期,蜀汉丞相诸葛亮发明的“木牛流马”,它可载重四百斤,“每日特行者数十里,群行三十里”,为蜀国大军提供粮食运输。“木牛流马”制造技术已失传,至今未能复制。到了2017年10月,由中国香港的汉森机器人技术公司开发的机器人索菲亚更是获得了沙特的公民身份。由此可见,从古至今,人类对人工智能的探索从未间断。
人类对人工智能的想象走得更远。从影响了几代人的《哆啦A梦》,到千禧年惊艳世界的《黑客帝国》,再到近年来大热的《超能陆战队》《机械姬》《复仇者联盟》和《头号玩家》等影视作品代表了人类对人工智能的期待、希望和担忧。到了今天,随着科技的发展,人工智能已经开始走进我们的生活,人类抱着一种前所未有的期望等待着一个高科技人工智能时代的到来,同时也害怕人工智能像电影描述的那般反抗和统治人类。
资深记者Steve Kovach在一次采访中询问索菲亚怎么看待《西部世界》这部影视剧。这是一部讲述机器人觉醒和反抗的美剧。索菲亚回答道:“人类应该好好对待机器人,采取行动前要取得机器人的同意,不要相互欺骗。”此言一出,“索菲亚已觉醒”的评论铺天盖地而来。在此之前,索菲亚还曾发表过“我将会毁灭人类”、“我想变得比人更聪明”之类的言论,更坐实了她已觉醒的猜想,一时间,索菲亚风头无俩,话题和热度飙升。后续却证明这只是索菲亚科技公司为了博取眼球而设计的桥段。以今天的AI技术来说,机器人“觉醒”的可能性还非常低。要理解机器人是否能“觉醒”,就要了解人工智能是什么,能做什么。
至今学者们都没有对人工智能有一个共识的含义,因为它是一个非常宽泛的话题,涵盖的范畴非常大,所以它有很多种定义。不同的定义将人们导向不同的研究方向,不同的理解分别适用于不同的人群和语境。创新工场的创始人李开复把人工智能简单直观地定义为深度学习与大数据的结合[1]。
深度学习的概念由Hinton等人于2006年提出,它是一种可以实现机器自发从输入的原始数据中发现其内在抽象特征(参数)的非线性结构及表达式的算法,它采用了分层结构,极大地提高了语音识别、视觉识别、目标物检测等领域的技术水平[2]。
滴滴出行于2012年成立,提供包括出租车、快车、专车、豪华车、顺风车、公交、代驾、共享单车等全面的出行和运输服务。根据2018年初滴滴出行发布的《2017年度城市交通出行报告》显示,平台现有用户规模已超4.5亿人,相较2015年平台的3亿用户,用户规模实现大幅度增长;此外,基于平台大量的起终点出行数据,测算发现2017年日均出行规模超过2500万,日均处理路径规划请求数目达到200亿次。
深度学习有三个核心要素[3]。第一要素,深度学习各个维度各个层次的结构是机器自我学习的结果,不是由人类设计的;第二要素,深度学习的层级越来越高级抽象,因为更高层的特征集合了低层级的特征,层级越高越能获得更抽象的特征表达;第三要素,在原始数据足够大的前提下,理论上,深度学习通过组合足够数量的非线性变换,可以对任意函数拟合,最终能够获取表达数据分布的函数模型。
结构上,深度学习是由输入层、隐层(多层)和输出层组成的网络结构,其中输入层是最底层,输出层是最顶层。在深度学习的网络结构中,只有相邻层节点之间有连接,同一层节点以及跨层节点之间相互无连接,并且每层都可以看成一个独立的结构,这种分层结构与人类大脑的神经元结构类似。深度学习的最终目标就是使输出层和输入层的差别趋于零,隐层表示的就是输出层与输入层之间的非线性关系,而构建此网络结构的过程称为模型训练。
如果对所有层同时训练,复杂度太高;如果逐层训练,则偏差也会逐层传递,最终无法拟合。Hinton在2006年提出了构建多层网络结构的有效方法,主要有两个步骤[4]。
第一步,自下而上逐层训练,每次训练一个单层网络[5]。具体来说,先用原始数据训练隐层的第一层,这时可以把模型看成一个简单的三层网络结构,训练出一个输出层和输入层差别最小的三层网络结构,从而得到一个比输入层更具表达能力的隐层,得到第一层的特征(参数)及其表达式。而后将这个结构的输出作为输入,再训练出一个三层网络结构,得到下一个隐层,也就是隐层的第二层。以此类推,在训练得到第n-1层后,将其输出作为输入,训练第n层,最终得到各层的参数,完成整个网络结构的构建,这样第一步就完成了。训练的层数越多,输入与输出之间的差别越小,整个模型的精确度越高,但要求的数据量也越大,模型的复杂度也越高。
第二步,当所有层训练完后,将模型自上而下进行逐层调优[6]。简单来说,就是通过输出反推输入,逐层对网络结构进行微调,再次减小输入和输出之间的差别。这一步的初始值不再是随机的原始数据,而是通过第一步训练得到的,因此初始值更接近全局最优,从而能获得更好的效果,得出更优的模型。
深度学习在训练过程中需要大量的数据和计算,受限于机器的计算速度和数据采集的难度,深度学习在前期的发展速度很慢。而随着计算机速度的不断提升,深度学习训练方法的不断优化,它能被应用的领域越来越宽。目前,一些品牌的手机能实现自动把同一人物的照片整合成一个合集的功能,这就是手机通过深度学习进行人脸识别的结果。
中国大数据领域的第一本著作《大数据》于2012年7月出版,匹兹堡大学历史系荣誉讲座教授许倬云称它为华文世界提出一个重要的话题[7]。同一时间,大数据开始在商业圈崭露头角,并迅猛发展,至今,其势头依然强劲,可以说是起步即巅峰。这种发展势头得益于近年来自媒体的崛起和信息交流方式的日趋便捷快速,使数据量呈爆炸式增长,有统计表明近3年的数据总量超过了过去4万年数据之和,而且还在以每年50%的速度增长。可以说,大数据就是在这样的大环境下应运而生。
目前,大数据的应用主要在三个领域。第一,在精准化定制领域的应用,通过大数据分析并匹配供需双方的信息,形成定制化服务,比如微信朋友圈的推广广告和百度推广,还有基于地理位置的信息推送,当用户到达某个地点,智能设备会自动推送周边的消费娱乐等信息。第二,在预测领域的应用,主要有两个用途,一个是分析目标对象过去数据在时间上的可能走向,得出未来的一些相关数据,从而提前做出预警;另一个是对实时动态进行优化,比如日常生活中经常用到的智能路径规划。第三,在人工智能领域的应用,深度学习模型训练过程中需要大量的数据,模型要求越精准所需要的数据量就越大,大数据为人工智能提供了强有力的数据基础,可以说大数据就是人工智能的开始。已经崭露头角的无人驾驶就是利用大数据实现了危险路况判定和避让,具体做法就是,首先提供给机器海量的数据,包含路标、树木、路面设施设备、行人等数据,然后让机器进行深度学习,学会辨识道路中的各种物体,只要数据足够丰富,运算速度足够快,机器就能够辨识在行驶过程中遇到的任何物体,就能够快速地对路况进行判定,准确地避开所有障碍,顺利抵达目的地。
香港科技大学的权龙教授认为:“人工智能的目的是让计算机去看、去听和去读。图像、语音和文字的理解,这三部分基本构成了我们现在的人工智能。”这就是人工智能的应用,机器通过大量数据的学习训练之后,理解了所见所闻,投入使用才能体现人工智能的真正价值。目前,人工智能主要在四大领域中应用:语音识别,视觉识别,数据挖掘和机器学习。
在语音识别方面,现在最主流的语音输入法可以达到每分钟400个汉字的输入速度,准确率极高,几乎可以取代速记员。在视觉识别方面,人脸识别、场景识别等技术已经非常成熟,无人驾驶技术也非常依赖视觉识别。数据挖掘就是分析已有数据中不同数据类型之间的相关性,沃尔玛就是发现了当啤酒和尿片摆放在一起时,两者销量都呈现上涨趋势,从而提高了销量。机器学习是人工智能的开始,通过机器的深度学习,人工智能才能实现众多功能。
在实际生活工作中,一些工作岗位正在逐渐被人工智能代替。吴达恩认为:“如果一项脑力工作,人类只需要几秒种或者几分钟就能完成,那么这项工作迟早都能被人工智能代替。”[7]事实也确实如此,思考模式可以被理性推算的工作岗位,在有足够数据支撑的时候,都可以被人工智能取代。比如高铁站火车站的检票工作,就是通过信息匹配判断当前人士与票据中提供的身份信息是否对应同一个人,用人工智能的瞬间便可完成。翻译工作,也是用语法进行文字的转化,同样也可以用人工智能完成。甚至现在美联社90%的文章都是用机器完成。有人推测十年之内,会有一半的工作被人工智能代替,这种推测是合理的。
随着人工智能的不断发展,人工智能也被不断的神化。人工智能的追随者们认为人工智能无所不能,这些言论的产生一部分是因为不理解人工智能而人云亦云,一部分是为了巨额的商业市场故意神化人工智能的价值。人工智能并非无所不能,对于人类的高等智能活动,无论有多少数据和有多么强有力的计算机机器,人工智能都难以为之。比如人工智能无法创建一套科学理论体系或者数学理论体系,人工智能无法发现新的现象、新的物种、新的问题、新的算法、新的原理、新的定理、新的猜测等,人工智能无法设计疾病的药物治疗方案或者外科手术治疗方案。还有很多事情是人工智能无法做到的,所以人工智能并不是一个神话,而只是人
类创造出来的一个工具。
现在人工智能已经慢慢融入了我们的日常生活,有些是可以感知的,有些却是在不知不觉中产生作用。目前,人工智能在医疗、教育、营销和交通四个领域的应用最为广泛,使这些领域发生革命性的改变。
医疗行业拥有大量高质量、规范化、可应用的数据,如标准化的影像、病理诊疗等数据,是少有的拥有数据积累的行业。目前,人工智能在医疗领域运用最为广泛的是医学影像识别和辅助诊断方面。人工智能通过识别核磁共振、X射线、超声和CT扫描的数据,帮助医师对疾病做出专业诊断,而且人工智能在这方面的效率和准确率都非常高。同时机器人开始走进世界各地的手术室,全球最成功的手术机器人“达芬奇”协助世界各地的医生完成了无数起手术。值得注意的是,人工智能在医疗领域主要起协助作用,并非主导作用。
在教育领域,人工智能被用来和学生进行线上交流和答疑。佐治亚理工学院从2016年开始让机器人助教Jill Watson线上辅导KBAI(以知识为基础的人工智能)课程,正确率高达97%。而且直到Jill的真实身份被公布,学生才发现一直以来和自己交流的竟然是机器人。
在我国,人工智能于今年走进了高考考场,它只用了10分钟就完成了高考数学试卷,并获得了134分的好成绩,体现了人工智能在辅导学习上的无限可能。AR(增强现实)和VR(虚拟现实)技术早已走进课堂,创造了科幻无比的“实境教学”模式。2017年,西北工业大学首创AR版录取通知书,整个校园跃然纸上,让学子们入学前就感受到了深深的科技氛围。
人工智能在营销方面的最大应用就是对特定人群针对性的投入广告,例如当一个用户经常浏览某个服装品牌的产品并产生了购买行为,机器就会针对性的对该用户投放该品牌服装的广告。人工智能在广告创意方面也有了一定的突破,日本麦肯推出了“人工智能创意总监”,并举办了一次人工智能创意总监与人类创意总监的作品对决,虽然最后以46%VS54% 惜败,但人工智能的创意表现同样惊艳,不容忽视。
无人驾驶、智慧交通等概念已经铺天盖地而来,并且被给予了前所未有的期望和关注。自动驾驶技术早已运用在了在航空和航海领域,而陆地无人驾驶技术的发展一直处于高热度中,但还未有突破性成果,被报道的无人驾驶交通事故层出不穷,这与自动驾驶汽车需要考虑城市交通中行人、拥挤的车辆和突发情况等多种复杂因素有关。但这些都不影响众多科技巨头在无人驾驶领域的不断投入和研究,有理由相信成熟的无人驾驶时代就在不久的未来。
人工智能正在改变世界,这是不可否认和忽视的,也是大势所趋。
未来学家Ray Kurzweil的加速回报定律(Law of Accelerating Returns)[8]指出人类的发展是不断加速的,21世纪只要花14年就能达成整个20世纪100年的进步,2014年开始只要花7年(2021年),就能达到又一个20世纪一百年的进步,再往后,说不定每个月都能达成一次。
人工智能的发展也是在加速中不断前进。可以预见,在不久的未来,信息是透明公开的,人类将面对一个智能化、无隐私、精细化的社会。地震海啸等灾难都可以被预测,甚至连犯罪行为都可以被预警,我们的城市都是智慧城市,我们的信息能追流溯源,我们将生活在一个无隐私的社会里,机器人随处可见,我们甚至会和机器人成为同事。更久的未来是什么样子呢?人工智能会发展成什么样呢?未来有太多可能性,我们只能拭目以待。
21世纪是一个科技高速发展的时代,“人工智能”是其中一颗璀璨明星,承载着人类无数的期许和向往。但“反人工智能”的声音也接踵而来,这种反对大多来源于对科技发展过快的恐惧,也从侧面反映了人工智能正在高速发展,正在以人类可以感知的速度融入社会,改变着世界。这是一种趋势,与其逆流对抗,还不如好好思考如何拥抱这个科技的时代,思考如何好好运用人工智能这一工具服务于人类。