人工智能的产业与技术蓝图

2015-02-28 07:23马仁敏
机器人产业 2015年1期
关键词:人工智能智能

□文/马仁敏

人工智能的产业与技术蓝图

□文/马仁敏

就在移动互联网的技术发展瓶颈已经显现的同时,新一轮更激动人心、更值得期待的技术革命风暴已经诞生。它将成为未来10年乃至更长时间内IT产业发展的焦点,并更加彻底地颠覆整个世界。它的名字叫做“人工智能”,简称AI。

尽管互联网的普及打造了包括谷歌、亚马逊、阿里巴巴、腾讯、百度、京东等一批巨头以及数量更为庞大的中小企业,基于网络的创新应用和服务类型也多种多样,但技术瓶颈的制约已经越来越明显:生活方面需求痛点的解决、生产领域具有适应性和资源效率的智慧工厂的建立、物流体系中更加方便快捷的配送方式的建设等问题,都面临智能化程度不足带来的障碍。只有人工智能才能为“万物互联”之后的应用问题提供最完美的解决方案。

人工智能的价值如此重要,以至于我们可以毫不夸张地说,它将成为IT领域最重要的技术革命,目前市场关心的IT和互联网领域的几乎所有主题和热点(智能硬件、O2O、机器人、无人机、工业4.0),发展突破的关键环节都是人工智能。

什么是人工智能?

目前市场上所谓“智能”的设备或概念很多,从智能手机到智能家居等,但这些“智能”实际上是“smart”的含义,即灵巧。真正的“智能”,其对应的英文单词应该是“intelligent”。

“人工智能”一词最初是在1956年达特茅斯学会上被提出的。从学科定义上来说,人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

如果从比较容易理解的角度来概括的话,人工智能是指计算机系统具备的能力,该能力可以履行原本只有依靠人类智慧才能完成的复杂任务。

人工智能的应用领域主要包含以下几个方面的内容:自然语言处理(包括语音和语义识别、自动翻译)、计算机视觉(图像识别)、知识表示、自动推理(包括规划和决策)、机器学习、机器人学。

大数据有效提高人工智能水平

过去机器学习的研究重点一直放在算法的改进上,但最近的研究表明,采用更大容量数据集进行训练带来的人工智能提升超过选用算法带来的提升。我们已经进入到大数据时代,来自全球的海量数据为人工智能的发展提供了良好的条件。

根据IDC的监测统计,2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB的移动硬盘,人均200GB, 这些信息量相当于可以填充572亿个32GB的iPad),而这个数值还在以每两年翻一番的速度增长,预计到2020年,全球将总共拥有35ZB的数据量,增长近20倍。

表1 人工智能发展简史

这些数据又并非仅仅包含人类在互联网上发布的信息。全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。因此除了互联网,大数据的爆发很大程度上还来自于传感器技术和产品的突飞猛进。人类在制造数据和搜集数据的量级和速度上将呈现几何级数的爆发式增长!未来,随着互联网应用的进一步扩展以及传感器不断融入人类生活工作的方方面面,数据产生、搜集的速度和量级将不断加速,人工智能的进化速度也将加快。

云计算使大规模并行计算得以实现

从概念上讲,我们可以把云计算看成是“存储云+计算云”的有机结合,即“云计算=存储云+计算云”。存储云的基础技术是分布存储,而计算云的基础技术正是并行计算:将大型的计算任务拆分,然后再派发到云中的各个节点进行分布式的计算,最终再将结果收集后统一处理。大规模并行计算能力的实现使得人工智能往前迈进了一大步。

云计算的实质是一种基础架构管理的方法论,是把大量的计算资源组成IT资源池,用于动态创建高度虚拟化的资源供用户使用。在云计算环境下,所有的计算资源都能够动态地从硬件基础架构上增减,以适应工作任务的需求。云计算基础架构的本质是通过整合、共享和动态的硬件设备供应来实现IT投资的利用率最大化,这就使得使用云计算的单位成本大大降低,非常有利于人工智能的商业化运营。

深度学习促人工智能产业跨越式发展

“深度学习”是机器学习研究中的一个新的领域,它模拟人类大脑神经网络的工作原理,将输出的信号通过多层处理,将底层特征抽象为高层类别,它的目标是更有效率、更精确地处理信息。深度学习自2006年由Geoffrey Hinton教授和他的两个学生提出后,使得机器学习有了突破性的进展,极大地推动了人工智能水平的提升。2013 年,《麻省理工技术评论》把它列入年度十大技术突破之一。

深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。因此,“深度模型”是手段,“特征学习”是目的。

区别于传统的浅层学习,深度学习的不同在于:一.强调了模型结构的深度,通常有5层、6层,甚至10多层的隐层节点;二.明确突出了特征学习的重要性。也就是说,通过逐层特征变换,将样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。

三位人工智能领域的泰斗级人物加盟国际著名互联网公司

深度学习使人工智能在几个主要领域都获得了突破性进展:在语音识别领域,深度学习用深层模型替换声学模型中的混合高斯模型(Gaussian Mixture Model, GMM),获得了相对30%左右的错误率降低;在图像识别领域,通过构造深度卷积神经网络(CNN),将Top5错误率由26%大幅降低至15%,又通过加大加深网络结构,进一步降低到11%;在自然语言处理领域,深度学习基本获得了与其他方法水平相当的结果,但可以免去繁琐的特征提取步骤。可以说,到目前为止,深度学习是最接近人类大脑的智能学习方法。深度学习引爆了一场革命,将人工智能带上了一个新的台阶,将对一大批产品和服务产生深远影响。

互联网巨头青睐人工智能

IT领域的国际巨头近年来在人工智能领域频频发力,一方面网罗顶尖人才,一方面加大投资力度,这也昭示着人工智能新的春天已经到来。

2013年3月,谷歌以重金收购DNNresearch的方式请到了Geoffrey Hinton教授(上文提到的深度学习技术的发明者);2013年12月,Facebook成立了人工智能实验室,聘请了卷积神经网络最负盛名的研究者、纽约大学终身教授Yann LeCun为负责人;2014年5月,有“谷歌大脑之父”美称的Andrew NG(吴恩达)加盟百度,担任首席科学家,统领百度研究院的研究工作,尤其是“百度大脑”计划。几位人工智能领域泰斗级人物的加入,充分展示了这些互联网巨头对人工智能领域志在必得的决心。

根据量化分析公司Quid的数据,自2009年以来,人工智能已经吸引了超过170亿美元的投资。仅2013年就有322家拥有类似人工智能技术的公司获得了超过20亿美元的投资。自2013年以来,雅虎、英特尔、Dropbox、LinkedIn、Pinterest以 及Twitter也都收购了人工智能公司。过去4年间,人工智能领域的民间投资以平均每年62%的增长速率增加。未来,这一增速预计还会持续下去。

表2 IT巨头在人工智能领域的布局

产业生态圈发展路径逐渐清晰

人工智能发展的拐点已经到来,但需要指出的是,由于技术的复杂性,发展不会一蹴而就,必然经历一个由点到面,由专用领域到通用领域的历程,通用领域的人工智能实现还比较遥远。

我们以计算机视觉的应用为例,正常的成年人可以很容易地识别照片或视频里的多种场景和人、物,但对于计算机来说还难以做到。由于识别是一个特征抽取的过程,而特征抽取是建立在识别模型的基础之上的,要做到通用识别,则必须对世间万物都建立一一对应的模型,工作量极大。而即使是同一事物,由于光线、角度、距离的原因,在不同的场景里也会呈现出很大的差异,这进一步增加了建立识别模型的难度。短期内计算机的运算能力(即使是超级运算平台)还难以望人脑视觉中枢的项背,因此无法达成这一愿景。

以“百度大脑”为例,百度几乎动用了全部的云计算能力来为其构建高性能计算资源池,投资47亿元建造云计算中心,将搭载超过300万服务器内核、存储4000PB数据,但目前“百度大脑”的智力水平也仅仅相当于2岁的婴儿。

未来5~10年之内,专用领域的定向智能化将是人工智能主要的应用发展方向。在更远的将来,如果人脑芯片等硬件架构能有所突破,运算能力有极大提高,则专用智能将逐步进化成为跨场景、跨下游应用的通用智能。而AI的生态格局,无论是专用还是通用领域,我们认为都将围绕“底层-中层-顶层”的技术和产品架构逐渐成形。

人工智能产业生态格局的三层基本架构如图所示:

底层为基础资源支持层,由运算平台和数据工厂组成;

中层为AI技术层,通过不同类型的算法建立模型,形成有效的可供应用的技术;

顶层为AI应用层,利用中层输出的AI技术为用户提供智能化的服务和产品。

每一层架构中,都有不同的企业参与,最终形成围绕AI技术、产品和服务的生态圈。

基础资源支持层

基础资源支持层通过部署大规模GPU与CPU并行计算构成的云计算资源池(定义为超级运算平台)来解决AI所需要的超强存储和运算处理能力问题,并辅以能够抓取到汇聚了人类智慧的海量信息的大数据工厂作为数据集,为AI技术层的实现提供有利支持。

超算平台负责存储与运算。人类没有记忆就没有关联,也更不用说决策与创造,而构成记忆的基础正是有极大存储能力的脑容量,那么机器要模仿人脑,也必然首先拥有庞大的存储能力,海量数据的积累最终让机器的“存储”形成类似于人类的“记忆”。

除了存储的绝对容量之外,运算处理能力是第二个需要提升的硬实力。

运算处理能力有两个方面,第一是服务器规模,第二是特征向量大小。所谓特征向量简单理解的话就是指将文本、语音、图像、视频等内容转化为机器能够读懂的一连串关键数据,数据越多,机器学习得就会越好,但对服务器的压力也会相应加大。

百度能够仅用两年时间从10万特征向量直接飙升到200亿,足以说明百度服务器技术实力的雄厚。在这个过程中,还需要解决大规模GPU和CPU并行计算所带来的错误率提升以及散热难度加大等问题,因此,是否能够搭建超算平台成为人工智能企业的重要进入门槛。

数据工厂实现分类与关联。数据工厂会对数据进行基础性的加工,而这种加工又非常关键。从人类的记忆联想模式分析,要调取某部分的记忆,就会很自然地联想到某个词、某个画面、某个音乐等等,就能记起很多事情。这是因为人类大脑的神经连接结构允许我们这样去检索,而机器是不允许的。数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念。如果需要机器理解用户的语言,这种搜索技术也依然要机器的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,数据工厂所依托的搜索算法,就是在这么一个数据海洋中去为他们建立管理,然后去索引。数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等建立起动态关联的过程。因此,通过数据挖掘和搜索算法对数据工厂中的知识库和信息库进行分类与关联的技术能力同样是人工智能企业的重要进入门槛。

表3 目前AI应用层的主要参与公司

AI技术层

AI技术层的作用是基于底层提供的计算存储资源和大数据,通过机器学习建模,开发面向不同领域的应用技术,例如语音识别、语义识别和计算机视觉等。

中间层的运行机制和人类的思维形成过程高度相似,是从感知到思考再到最终的决策行动甚至是创造,核心是机器学习技术的应用。首先,感知环节需要连接的是人、信息和物理世界,通过传感器,搜索引擎和人机交互来获取建模必需的数据,相当于人类的感知过程。依托于底层的高性能计算和弹性存储能力,中间层对感知到的数据进行建模运算,相当于人类的思考过程。最终,应用层利用数据拟合出的模型结果,对智能应用的服务和产品端输出指令,指挥包括机器人、无人机、3D打印等在内的各种设备响应用户需求。尽管目前由于思考层面的计算存储能力和建模能力的不足,导致人工智能还无法达到和人类相接近的“智慧”程度,但也足以支撑包括语音识别、图像识别和知识图谱在内的各种AI技术在特定场景下的应用。

另外一方面,在具体的应用场景中,更为优化的算法和更为准确的背景知识库数据集等因素都有助于在不提升计算资源的前提下实现更优的结果。这就给众多专业领域的AI公司带来了巨大的市场机遇。我们看到,专用智能的商业化应用风生水起,在这个领域,巨头和新贵都处于同一起跑线上,产业格局会趋于分散,先入者优势明显。

AI应用层

专用智能的应用水平不断提升将推进智能产品和服务的智能化程度。为了能够满足用户需求,智能产品和服务需要多种不同的AI技术支撑。

智能产品和服务是否能够切中用户的痛点需求,依赖于人工智能技术在产品背后能够给予多大的支撑。当前的智能产品市场之所以出现产品热,需求冷的局面,主要的症结在于所谓的智能硬件大多是“伪智能”产品,只是把功能性电子产品加上联网和搜集数据的功能。例如,以手环为代表的可穿戴设备,以智能机顶盒为代表的智能家居设备等等,杀手级的智能产品和服务必然是建立在强大的AI技术支撑下的。

正在被AI颠覆和重塑的行业

O2O

生活服务O2O是未来电子商务发展的重要趋势。艾瑞报告指出,与庞大的网络购物市场规模相比较,本地生活O2O渗透率较低,仅为4.4%左右。其中,餐饮O2O的市场占比最高,达40%。生活O2O核心观念在于提供本地化的生活服务,并且通过网站帮助商家更好地做营销,同时借助点评分享社区,让用户有更多的参与。

AI技术的提升能够实现智能化的餐饮推荐、线下即时图像搜索等,给生活服务O2O带来新的变革,提升市场规模。

O2O市场规模存在着巨大的增长空间。以餐饮业为例,2014年中国餐饮O2O市场规模为913.8亿元,同比增长46.56%。从渗透率来看,餐饮O2O市场规模占整体餐饮行业的比重还非常小,仅为3%。AI能帮助各类餐饮服务网站和应用做大量智能化推荐,提升用户的参与度。通过AI技术将餐饮O2O市场的渗透率每提升1个百分点,就能够直接为该市场扩大300亿元/年以上的规模。其他的O2O市场还有诸如在线旅游、在线医疗和在线教育等,均存在着巨大的AI智能推荐市场空间。

图1 2010-2015年中国餐饮业O2O市场规模及渗透率

医疗

基于医疗图谱的AI应用正在对医疗行业进行重塑,通过对电子病历、医疗影像、病理生理学等数据整合,可以分析和预测人体的健康状态,并获取准确的处方信息,帮助医生做出迅速有效的判断。

国内医疗影像分析市场份额估算:2014年全国三甲医院1475家,二甲医院6957家,每家医院细分的科室有数十个,如果医院配备整个就医科目的医疗影像分析软件,医疗软件价格按200万元计算,保守估计医疗影像分析的市场规模就超过150亿元。

表4 应用人工智能技术金融业企业

零售业

基于视频监控的AI应用将对零售业进行重塑,通过对摄像头采集的视频数据的AI分析,可以为店主提供客户的热点图和路径图等辅助决策信息,帮助商家重新调整出更好的物品摆放位置来促销,也可以给消费者购物带来便利。

对于线下零售实体店,获取用户的浏览行为和采购行为,不及线上用户浏览网页信息那样便捷。视频热点分析,对消费者行动轨迹以及行为模式进行检测、跟踪和搜索,精确统计出在设定的热点范围内的客流量、停留时间、行动轨迹、消费者行为,提供客观的消费行为分析数据,帮助传统零售客户转向数据驱动的管理方式,提高商业运营效率,可以说提供了一种完美的解决方案。

我国零售业热点监控分析市场份额估算:2014中国连锁百强企业门店总数达12万家,视频分析公司能够为大型超市、零售店提供数据和分析报告,我们按每份解决方案1万元计算,热点图像分析的市场规模超过12亿元。此外我们整理其他一些前沿公司如何运用AI技术,给现有的零售行业带来业务提升。

金融业

AI技术的应用,也在引起金融数据市场的变革。在美国市场上活跃着不少应用AI技术的企业,如上图所示。

营销

AI技术的进步,也为广告业务带来了新的解决方法。

图2 2010-2014年中国互联网广告市场规模

比如微信朋友圈的信息流(Feeds)广告推送基于大数据分析,通过分析用户朋友圈语言特性,以及朋友圈图片内容,根据对用户收入和消费能力的分析来刻画用户画像,并决定投放何种广告。信息流广告与社交平台上好友发布的信息形式类似,广告本身内容将基于微信公众账号生态体系,以类似朋友圈的原创内容形式进行展现,融合在信息流中,在基于微信用户画像记性定向的同时,通过实时社交的混排算法,依托关系链进行互动传播。

信息流广告这种形式最初被运用在Twitter、Facebook、Instagram、Pinterest等主流社交产品。国内的新浪微博、QQ空间也都相继加入了信息流广告。信息流广告的推送涉及自然语义理解,以及图像识别等人工智能技术。

根据用户内容信息贴标签,然后刻画出用户画像数据,可以用兴趣、商业等维度来描述,最后是用户数据输出,商业广告也因此可以按客户群体的类别来进行投放。

信息流广告基于社交网络数据挖掘,将成为移动互联网时代重要的广告推送方式,给互联网广告市场带来新的增长点。根据易观智库的数据,2014年整个中国互联网广告市场依然保持着高速增长,市场规模预计达1565.3亿元,同比增长56.5%。我们认为,随着AI技术的进步,广告业的精准投放将得到进一步提升,市场规模也有望继续扩大。

农业

AI技术正在对农业生产进行重塑。我们看到美国市场上已经出现不少为农业客户提供AI的应用公司。美国Blue River Technology是一家农业科技和农业自动化技术服务商,主打机器人系统优化农业经营方式,减少化学农药在粮食生产中的使用。其机器人系统能够自动识别农作物,比如确定幼苗间距是否过小,或是确认哪些杂草应该清除。这可帮助农民减少在购买农药上的支出和人力的投入。

除草机器人里有三个不同算法在工作。第一个只是简单的照相机的取景,这台相机朝地,用来分辨是否长的像植物。这里不仅仅是弄清楚绿色的就是植物,算法还要能够记录植物的生长起点和终点,这样便于之后辨别它。第二个算法是分类,用来确定植物到底是不是杂草。这个算法的准确率达到98%到99%。最后的算法被简单地称为除草算法,它的目的是决定什么时候适合注射足以致死的肥料剂量。因为除草机器并没有处在机器人的视野里,必须基于机器人移动的速度、杂草的位置以及杂草被分类的时间来决定在哪里注射肥料。

中国农业收割AI应用市场规模估算:根据第二次全国土地调查数据显示,全国耕地面积共18.26亿亩。全国耕地按质量等级由高到低依次划分为一至十等,扣除掉七至十等耕地基础地力相对较差的耕地,其余部分耕地基础地力较高,农田基础设施建设具备一定基础,也可实施农业机械化操作,这部分耕地面积为13.16亿亩。我们参照水稻收割机一天工作10小时可收割40亩,除草机器人的需求量可达658万台,按每台6万元价格计算,市场规模为3948亿元,可以说存在着巨大的空间。

商业

AI对商业领域也进行了重塑,在现代企业的全业务周期范围内,包括招聘、销售、采购、会计财务管理等等业务模块,AI技术均能够帮助企业客户提高效率和节约成本。

以HR招聘为例,人工智能可以通过数据匹配找到合适的人选,代替原有人工检索的方式。社交网站已经可以构建起一个人的肖像,但每个人的信息分散在Twitter、Google+、Facebook、LinkedIn,而且他们还不足以描绘一个人的专业技能。

智能招聘软件Entelo不停地抓取网页上的信息,包括时事新闻、社交网站、专业社区等;当用户提出需求要招聘符合某些特定条件的候选人后,Entelo就会做数据匹配,它主要解决两个问题——第一,时机:如何率先发现“想换工作的人”并和他们取得联系,例如当一个公司发生了收购或被收购的新闻时,总是会带来一些人事变动;第二,对的人:Entelo会从社交网站、专业社区中做个人信息的检索和匹配,这种方法就像先建立起一个数据库,再从不同的角度过滤数据。除了做数据匹配,甚至可以做预测分析企业什么时候需要招聘新岗位,以及跟踪的职业经理人什么时候可能考虑换工作。

在线教育

AI技术的应用也为在线教育行业带来了新的模式。

传统的教育模式下老师与学生是一对多的关系。老师的精力有限决定了其教学只能针对平均水平推进。对于学习能力不同的学生来说,这样的教学都欠缺一些针对性。因此,个性化教育成为未来智慧教育的趋势之一。根据Knewton公司的报告,93%的教师认为在线教育工具能提高教育水平;95%的教师认为这能更好地吸引学生注意力。以面向100名学生进行1小时课程为例,在线教育的成本约9500美元,而教师辅导方式则要17000美元,能够减少约44%的费用。

我们再看国内市场,艾瑞数据显示,2013年中国在线教育市场规模达839.7亿元,同比增长19.9%。其中,中小学在线教育、在线职业教育、高等学历在线教育等细分领域成为市场规模增长的主要动力。

随着内容生产方、技术设备提供方、平台搭建方的相继入场,用户习惯的养成,在线教育将会有持续的增长。其中,职业在线教育和在线语言培训属用户刚性需求,且用户付费能力较强,将会成为在线教育发展较为突出的领域。如果能够利用AI技术为在线教育提升教学互动的体验,将个性化的内容和教学方式植入在线教育的课堂中,那么,在线教育的市场规模有望持续高速成长。

图3 2013年中国在线教育市场细分结构

图4 2009-2014年中国在线教育市场规模(亿元)

马仁敏 华泰证券研究所计算机研究员

猜你喜欢
人工智能智能
我校新增“人工智能”本科专业
智能制造 反思与期望
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业
智能制造·AI未来
数读人工智能