您的《AI创建指南》正在接收……

2018-09-11 08:21Q比特
科学Fans 2018年8期
关键词:大脑芯片计算机

Q比特

完成一个人工智能的研发,就像是构建一个真实的人类,不仅需要主导神经活动的大脑,也需要感知外界的器官,还需要维持运作的神经系统、运动系统等协调配合。模仿人类的AI当然也有自己的“大脑”“器官”“躯体组织”“神经系统”……这些功能不同的构造,共同形成了您现在使用的一件件人工智能产品。

为了保证最亲爱的用户放心使用本公司的产品,技术部在这里向大家保证,这些“大脑”和“器官”的质量都是经过层层把关的。您可以随时咨询和检验,不如就先从最关键的“首脑”开始吧。

AI大脑部分

数据收集

“没有输入,何来输出”

我们有了大脑,有了可以储存知识的空间,接下来就是获取知识的时候了。感官系统的存在能很好地帮助我们获取外界的各种信息,为大脑的运作提供充足的驱动。人工智能也一样,有了高效存储、传输数据的设备和平台,用于人工智能学习训练的数据就需要多方收集和整理。比如,我们要训练图像识别的人工智能模型,就要收集大量的图像资料并提前进行标记处理,才能让机器学习的程序识别读取。诊断癌症的AI需要大量清晰准确的癌症组织切片图像来学习识别癌细胞。识别人脸的AI需要大量图像和视频数据来学习分辨不同的人。语音助手需要大量人类语音数据来分析理解人类语言。

数据收集的途径多种多样,我们手机里装的各类APP、GPS,网络上的信息和评论,各类探测检测仪器的监测数据,都是数据的来源。

“聪明的大脑才能造就聪明的AI”

如果说“程序”是AI的“思维”,那么计算机就是运行程序的“大脑”。也就是说计算机的性能越好,AI的反应就越快,越能轻松处理各种复杂任务。而这个“大脑”的计算能力主要依靠芯片,一般计算机的计算核心是CPU,想必大家对英特尔公司这家芯片巨头也耳熟能详了。然而随着摩尔定律的逐渐失效,机器学习所需的计算和数据量越来越大,CPU不再是AI“大脑核心”的唯一选择。

人们首先想的是GPU(显卡)。相比CPU,GPU没有那么全能和稳定,但优势是做图像处理类运算的速度更快,而当下机器学习所需的恰恰是这类运算。于是GPU不再只是游戏玩家的必需品,也成了机器学习研究人员手里的抢手货。

然而硬件工程师们并不满足于GPU的性能,依然在不断开发更加适合AI的专用芯片。Google公司研发的TPU,在运行机器学习需要的某种计算模式上,速度就超过了价格和配置更高的GPU。同时,源自中国科学院计算技术研究所的寒武纪科技,也推出了专门应用于AI神经网络计算的寒武纪芯片。

摩尔定律

1965年,由英特尔创始人之一戈登摩尔提出,每个新芯片大体上包含其前任两倍的容量,每个芯片的产生都是在前一个芯片产生后的18~24个月内。揭示了信息技术进步的速度。

存储

“最强大脑就是最强记忆”

大量的数据如何成为丰富的储备?这就需要记忆功能出马了。到了AI这边,大量的数据就是人工智能的“学习材料”。数据规模越大,人工智能的知识就越丰富。于是,高效、稳定又实惠的存储介质就显得十分关键了。

存储硬件主要分两类,一类需要随时高速读取写入但不长期保留数据,如RAM(随机存储器)。另一类相对读写频率较低但可以长久稳定保存数据,如SSD硬盘(固态硬盘)。

我们在挑选手机和电脑时都有感受,一般RAM越大的设备运行起来会比较流畅,很少卡顿。而SSD硬盘虽比传统的机械硬盘存取速率快得多,但成本较高。就像人类不断训练自己的记忆力,AI也要选择更高效的存储设备来实现记忆功能,光盘和U盘等受到局限的存储器已经随着各类网盘云存储的兴起,不再是人人必备了。

云技术

“资源共享才能高效发展”

如果说“芯片”和“存储”作为AI的“大脑”和“海马体”存在,那么“云技术”就是能够高效调配协调大脑结构的“神经系统”。

还记得我国的超级计算机“神威·太湖之光”吗?那个由40个运算机柜和8个网络机柜组成的大家伙,每个运算机柜比家用的双门冰箱还大。像这样的超级计算机或大规模的数据中心,就需要云技术来调配协助了。

用户只要通过网络连接就可以付费远程使用高性能的计算和存储设备。AI开发人员不需要自己购买配置大量硬件设备,只要挑选自己需要的服务就好,也不用所有人集中在计算机硬件旁,这样不同地区的开发者也可以进行远程合作。

所以对于AI所需的“大数据”,云技术是重要的解决方案。再举个“栗子”,网上各大商城促销活动期间,保证大家“剁手”时“不卡顿”“不崩盘”的,就是云技术了。

AI思维模式

当我们说—个人的心智发育或思维活动,就是在说这个人对新输入信息与脑内储存知识经验进行一系列复杂的反应操作过程。思维以感知为基础,涉及所有的认知或智力活动。而人工智能中的。卷积神经网络、Q-Learning、深度学习……其实并不是我们想象的完全复制人类学习思考的过程,而是依靠的数学统计模型以及计算机理论来实现的。

数学统计理论

处理数据

毕竟用计算机完全模拟人类大脑是一件“费力不讨好”的事,反而运用计算机上的数学统计模型能得到更好的结果。但在建立人工智能数学统计模型的过程中,还是参照了人类大脑的一些方面。

比如卷积神经网络的基本结构就模仿了人类的神经元,只不过这个“神经元”不是神经细胞也不会放电,而是一个能根据输入数据自动优化参数的函数。将这些基础的模型用数学统计方法联合起来,就架构出了复杂的神经网络和深度学习的一系列模型。

所以,“人工智能超越人类”的担忧在大部分理论研究者这里,是不存在的。因为他们心中明白,人类可以推演改造人工智能的基础数学算法,而这些机器都只是在人类的命令下完成高速计算,在数学统计模型的推演改造方面并没有什么能超越人類的能力。可以说数学统计理论是目前让人工智能变得越来越聪明的最!核!心!的因素之一。

卷积神经网络

在机器学习中,卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别,是一种高效的识别方法,包括卷积层和池化层。主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。

计算机理论

运行程序

人工智能的控制核心是计算机。稍微了解一些计算机原理的人都知道,计算机内部运用二进制计算。现有的计算机计算原理基本都遵循“图灵机”这一模型,架构则遵循“计算单元-控制单元-存储单元”冯·诺依曼结构。

和人工智能领域研究数学统计理论的研究者不同,计算机理论的研究者,主要的目的是让计算机算得更快、更稳定、更省资源。

在软件方面,同样的数学统计模型可以用不同的编程语言和程序结构来实现,软件工程师和科学家要创造出合理可靠的理论或流程来指导开发人员更高效地写出并运行人工智能程序。

而硬件方面,由于当下计算机架构本身的限制和摩尔定律的失效,计算机科学家们必须研发出打破硬件限制的系统,甚至是新的计算机架构。比如跟传统架构完全不同的。量子计算机,以及前面提到的优化硬件计算存储资源的云技术,高速传输数据的网络,这些都需要依靠计算机理论的指导才能得以发展。

二进制

是计算技术中广泛采用的一种数制。二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一”。人类世界通用的十进制,即满十进一。

量子计算机

遵循量子力学规律进行高速数学和逻辑运算、存储及处理量子信息的物理装置。2017年5月,世界上首台超越早期经典计算机的基于单光子量子模拟机在中国诞生。

AI协调躯干

人类运用大脑支配身体完成某些任务的时候,需要通过各种器官的功能来共同作用。AI自然也有一套自己的“身体器官”,从可识别目标的“眼”,到负责语言的“语言中枢”,再到可输出的“嘴”和“双手”,分别涉及计算机视觉、语言处理、语音工程、规划决策、大数据分析等方面的技术。

作为AI“双眼”的計算机视觉,是目前机器学习方法运用最广泛的,也是市面上很多人工智能的核心技术。像“深度学习”这个目前十分火爆的人工智能理论模型,最早就是在训练识别猫狗图片的实验里实现的。自动驾驶的汽车能认得路也是靠计算机视觉的技术分清道路车辆,检测行进路上的移动物体。传统的计算机视觉技术已经有了不少处理图像和视频的方法,机器学习模型的引入也帮助这些方法变得更快且有了学习和自我提高的能力。

在人类大脑的左半球有负责表达的“语言中枢”,AI当然也有这一功能,帮助他们懂的人类语言,我们称之为自然语言处理技术。自然语言处理又分为理解语言和生成语言两个方向。AI需要理解的自然语言不仅仅是人类对话,还有人类文章,如新闻报道和文学作品等,甚至还有语言所包合的情绪、逻辑和涉及的主题和关键词。而语言生成,不仅是与人类对话,还要能写文章等。自然语言处理领域不仅需要广泛多元的数学统计模型,还需要语言学家来研究提炼不同的人类语言之间的特点和联系。

而语音工程跟自然语言处理领域的联系非常紧密。自然语言处理让AI“懂得”语言,而语音工程则是进一步给了人工智能“听”和“说”的能力。二者最大的差别是自然语言主要处理文本文字,而语音工程处理音频。语音工程要面对的挑战是:如何在嘈杂的环境里准确分辨出人类语音,或是多人谈话时能够准确分辨出谈话人以及他们各自讲了哪些内容。另一方面则是如何让AI的话语更像人类。虽然讲话的内容是由自然语言处理过程决定的,但对话不是念稿子,同样的内容,不同的情景、不同的心情讲出来也是不一样的。

规划决策系统说来陌生,但其实举几个“栗子”大家就明白了。玩各类游戏的人工智能都属于规划决策系统,因为赢得游戏的本质就是根据游戏的规则来规划决策。此外,帮助规划开车路线,帮助选择理财产品等也属于规划决策,这其中还运用了很多博弈论、随机过程和统计学原理。规划决策系统常常和大数据分析计算结合使用,因为面对复杂的情况,人工智能需要海量的学习数据。

再到大数据,这个不断被人类提及的关键词,作为海量的信息资产,可以说没有大数据就没有基于机器学习的人工智能发展热潮。大数据分析其实也是人工智能。比如根据偏好推荐商品,浏览网页投放有偏好的广告,还有金融行业预测金融产品在市场上价格的涨跌,公司收集消费者偏好来决定是否升级换代产品等,都属于大数据分析的范畴。

各部集结,AI的诞生

召唤神龙还要集齐7颗龙珠呢,灭霸的响指也要6颗“彩豆”才能打得响。如同人类的大脑、躯干,各种系统缺一不可,人工智能的各种“器官”想要发挥作用,也需要“团结”起来。

就拿我们大家都非常熟悉的AlphaGo来讲,它不仅是一个决策系统,分析围棋棋盘同时也需要用到计算机图像处理。第一代AlphaGo参考的海量人类数据和第二代AlphaGo自己互相下几百万盘棋,这些数据量都非常庞大,这时候就需要大数据分析。AlphaGo的硬件是成百上千个芯片协助共同运行,升级后的“狗”能在网上远程与人类顶尖棋手进行车轮厮杀大战,又涉及了云技术和并行计算。AlphaGo本身的模型也是多个不同的数学统计模型联合协作。所以,一款人工智能的诞生,离不开“身体”各部分的共同作用。

行业需求,了解一下

AI诞生后,接下来要考虑的是,如何真正帮助人类更好地生活与发展。需要我们对各个行业的现状、变化和需求做全面且深入的了解。比如在金融界,我们可以有聊天机器人作为客服提供金融咨询服务;可以有大数据分析AI预测市场指导投资;也可以有高速自动交易系统取代容易出错的人工交易专员等。对一个行业而言,需要不同功能结构的多种人工智能以及技术辅助,也只有这样才能让人工智能发挥其更大的价值。

原来,AI的创建与人类发展成长有着异曲同工之处。“大脑”芯片控制整体“命脉”,“存储系统”帮助记忆,“感官系统”掌握输入,“躯干”实现运作。虽然作为通才的强人工智能还没出现,但不同功能的人工智能已经在人类社会的各个领域崭露头角。TM公司不断突破技术瓶颈,力图打造出更加全能的产品。在为人类服务这件事情上,我们—直都很用心。

猜你喜欢
大脑芯片计算机
计算机操作系统
基于计算机自然语言处理的机器翻译技术应用与简介
信息系统审计中计算机审计的应用
芯片测试
多通道采样芯片ADS8556在光伏并网中的应用
Fresnel衍射的计算机模拟演示
74HC164芯片的应用