人工智能的发展及硬件技术分析

2022-04-16 18:37李国栋
今日自动化 2022年9期
关键词:算力芯片神经网络

李国栋

(深圳市华途数字技术有限公司,广东深圳 518000)

人工智能被视为“第四次技术革命”的核心驱动力,推动着全球经济产业与生活模式的智能化变革升级,是大国新一轮科技竞赛的“掌上明珠”。2016年,我国就将人工智能作为发展新一代信息技术的主要方向,探索人工智能的关键技术与发展应用,对于推动新科技、新产业、新应用加速重塑具有重要意义。

1 人工智能概念及内涵

1.1 人工智能的概念

人工智能(Artificial Intelligence)是通过人工模拟、延伸和扩展人的智能思维过程及行为的一门技术,主要的物质载体和实现平台是现代计算机,并包含了仿生学、神经科学、信息学、心理学、自然语言学、数学和哲学等诸多学科。关于人工智能内涵,最早可追溯至艾伦•图灵提出“图灵测试”,随着信息技术的不断发展,其内涵也在不断深化完善,目前各领域给出的定义与阐释不尽相同,但基本可以包含3个层级:①弱人工智能,就是利用算力和算法模拟人的思考过程,通常专注或限制于特定领域、专用应用场景,作为脑力与初级智能的延伸,本质上是不完备的人工智能,当前人工智能发展水平还主要停留在这一层;②强人工智能,是人工智能向认知型、通用型发展的结果,不再受限于某个领域,能够综合各类知识进行类人推理、分析、整合,并通过自然表现形式进行呈现,这一层人工智能基本可以顺利通过“图灵测试”;③超人工智能,是人工智能发展的高级形态,目前通过想象还不能完全描绘其样貌,至少应包含的特征有:除人类智能外,还同时具有人类情感和自主意识,具备独立且先进的创造能力而并非人类劳动的简单替代。

1.2 人工智能关键技术

从当前发展看,人工智能围绕模拟人类感知、学习、处理、表达、行动等各个环节,按应用领域发展出计算机视觉、机器学习、自然语言处理、智能芯片、智能控制等关键技术。其中,计算机视觉用于智能图像处理,能够感知、提取、分析、判断图像中实体对象,广泛运用于面部识别、自动驾驶等领域;机器学习是通过模拟人类学习认知过程,通过知识训练不断修正算法模型的过程,是智能算法的核心;自然语言处理重点解决人机自然通信问题,既能分析、理解人的语音、语法、语义,还要能够运用自然语言表达逻辑、思想等;智能芯片是人工智能的底层基础,通过大规模并行计算为智能算法和大数据处理等提供算力支撑;智能控制是人工智能的外部行为体现,在无人操控情况下实现机器自主决策、智能驱动、自动控制。

2 人工智能的发展

人工智能概念的提出最早可追溯至20世纪50年代,经多次延宕发展至今,总的看可分为4个阶段。

2.1 萌芽奠基阶段(1950—1980年)

1950年,图灵首次探讨了机器拥有人的智能这一思想模型,并提出了“图灵测试”的概念,1956年,在达特茅斯会议上首次提出了“人工智能”的概念。并确定了人工智能的发展目标,即“可以像人类一样运用思维模型自主获取处理知识并解决问题的机器”,自此开启了人工智能的研究探索之旅,计算机科学家围绕模拟思维逻辑构建过程进行了诸多有益的尝试。算法模型上,比较典型的有罗森•布拉特提出的感知器模型,主要模拟了生物神经突触的信息感知处理机制,并首次引入了机器学习、M-P 模型、梯度下降算法等概念,虽然感知器模型作为一种二元线性分类器,仅仅实现了单层人工神经网络,且被证实无法解决异或等线性不可分问题,但基本思想为后来神经网络深度学习模型奠定了重要基础。试验运用上,1952年,剑桥大学基于EDSAC 电脑开发了“购物者”模拟器,能够初步模拟人类购物行为;1956年,Oliver Selfridge 开发了首个基于字符的模式识别软件;1959年,Arthur Samuel 开发了“跳棋程序”,加入泛化机制能够在对弈过程中自主获取“经验”,并在与州跳棋冠军对抗中取得胜利;1970年,日本早稻田大学研制了第一个拟人机器人WABOT-1。这一阶段,由于算法模型还存在参数引入单一基础性制约,对于稍高维度、复杂问题显得束手无策,人工智能发展一度陷入低迷期。

2.2 跌宕发展阶段(1980—1996年)

20 世纪80 年代初,以Edward Feigenbaum 为代表的“知识学派”提出人工智能不应囿于通用求解方法,应着眼引入“知识”模拟人类专家求解具体领域的问题,开启了知识工程系统的发展阶段,出现了以XCON 为代表的系列专家系统,专注于医疗、地质等领域的智能应用,但受知识获取限制,知识系统依然难以解决较为复杂的问题,传统人工智能发展进入瓶颈期。为解决海量知识获取与模型建立难题,人们又提出了自下而上的“涌现”式解决思路,即让计算机“自己学习”。围绕这一思路,传统人工智能研究者、神经网络研究者、生物行为研究者分别从不同方向进行了探索,并形成了符号学派、连接学派和行为学派三个主要发展方向,其中,符号学派聚焦于模拟人外在行为和表现,尝试将人的高级行为模式如推理、规划等进行“符号化”,本质上是希望通过算力和存储优势扩展人的逻辑思考过程;连接学派则聚焦于模拟人脑和神经系统的活动过程,是由感知器模型的基础上发展而来,并将单一神经网络扩展为多层神经网络,其中,BP 算法的引入有效解决了多层神经网络复杂参数训练问题,成为第三次人工智能浪潮的最重要推动力之一;行为学派则将目标转向低等生物仿生学,尝试通过模拟低等生物行为和组织活动来理解智能的产生,这一阶段,涌现出多种人工智能算法模型,但当时处理器算力、机器性能明显还无法满足复杂模型的计算需求,对人工智能的探索多停留在试验阶段。

2.3 理论成型阶段(1997—2011年)

20世纪90年代后,随着计算机技术的快速发展,特别是“摩尔定律”带动计算机算力飞速提升、功耗不断下降,加之人工智能算法的深化演进,数字通信、大数据存储等一系列前沿技术的兴起,也推动着人工智能技术得以长足发展,带动了“第三次人工智能浪潮”。这一阶段开启的标志事件是IBM 公司研发的“深蓝”超级计算机首次击败了世界第一的人类棋手,引发世界广泛关注。同时,人工智能也开始在模式识别、自然语言理解、计算机视觉等领域迅速发展。这一阶段,统计学习的数学模型被引入人工智能,数学家先后提出线性SVM、AdaBoost、随机森林、图模型等理论模型,使人工智能在分类、回归等问题上取得较大突破,并开始尝试为机器学习构建新的统一框架。2006年,Hinton 及其学生正式提出了深度学习的概念,围绕“梯度消失”问题给出了解决方案,成为当前基于神经网络的人工智能算法基础性模型,人工智能正式进入深度学习时代。同年,英伟达公司推出CUDA芯片,用于神经网络训练;2011年,苹果公司推出了首个智能手机语音助理Siri,人工智能开始逐渐向消费端转移。这一阶段,随着基础理论模型的发展完善,人工智能开始不再只是实验室里的产物,更多的科技产业开始将目光转向人工智能领域,推动人工智能应用进入涌现期。

2.4 广泛应用阶段(2012年—至今)

随着谷歌等科技巨头的纷纷加入,人工智能正式进入大应用时代,同时,新一代移动通信技术、大数据、云计算等也迎来爆发式发展,“算力+数据+移动网络”使人工智能技术在算法和运用上都得到了突破性进展。这一阶段的标志性事件是谷歌DeepMind研发的AlphaGo 机器人,成为首个战胜人类围棋冠军的智能机器,与传统的“穷举式”人工智能不同,AlphaGo 真正实现了通过“深度学习”进行知识迭代,成为人工智能走向未来的一丝曙光。基于深度学习和神经网络算法,各大科技公司相继推出了人工智能开发基础框架,如谷歌公司的TensorFlow、脸书公司的PyTorch、华为公司MindSpore 等,助推人工智能领域快速向外扩展,智能应用进一步普及化,进入通信、零售、物流、生产、社交媒体等大众生活的方方面面,也为智能学习获取到大量学习样本。深度学习算法进一步技术迭代,衍生出卷积神经网络、递归神经网络、长短期记忆网络、生成对抗网络等多种模型,使人工智能在各领域发生从“象征性应用”到“实质性应用”巨大转变。目前,人们还在围绕知识数据双重驱动、人机物深度融合、开放自适应等方向持续完善突破,驱动人工智能技术进一步向通用化、自主化、生态化发展,“人工智能+”或将成为未来生活的新常态。

3 人工智能硬件关键技术分析

人工智能硬件包括AI 芯片、智能传感器与中间件、智能外设等,作为算法实现的承载基础,AI 芯片是人工智能硬件的关键核心。目前AI 芯片技术发展主要遵循2种路径:①基于传统的冯•诺依曼架构,通过提升算力和并行处理能力,实现先进算法支撑,包括英伟达Tesla 系列GPU、英特尔Arria FPGA 等;②另起炉灶,摆脱原有体系结构,根据人脑神经结构研制类脑芯片。

3.1 GPU+CPU

CPU 与GPU 的组合是目前最广泛的智能芯片架构,其中,GPU 因其在高并行处理、浮点数据计算上的独特优势,能够充分发挥人工智能的潜力,成为近年来智能芯片方案的首选,而CPU 主要担负任务处理和控制等任务。从GPU 架构看,以英伟达为例,在AI 计算上采用CUDA 架构,可包含数千个Stream Processors(SP),每个SP 就是一个并行处理核心,能够提供强大的并行处理算力,相比于传统CPU,GPU 在AI 运算上速度可提升10倍以上,同时CUDA 提供了统一的开发模型,能够有效缩短开发周期,提升开发效率。目前,GPU 主要应用于模型训练与算法推理2个方面,模型训练上主要用于深度学习算法卷积层计算,目前主要GPU 生产商均有针对卷积层计算的矩阵乘法库,如英特尔MKL 等,以及针对性优化算法,如Tensor Core 等;算法推理上主要是针对AI 算法进行模型和编译优化,如网络剪枝、张量分解等,目前GPU 在模型训练上的计算优势较为明显,在算法推理上还有较大短板。

3.2 现场可编程门阵列FPGA

FPGA 能够同时完成并行AI 运算和并行任务处理,与GPU 相比,其峰值运算能力较弱,但具有功耗低、部署灵活、成本可控等优点,在特定应用领域时具有一定效率优势。FPGA 可最大包含数百万个布尔运算单元、数千个存储器以及多个处理器内核,每个时钟周期可触发百万次并行计算操作,由于不需要进行取指令和指令译码,在相同算力情况下,其功耗较GPU 低80%左右,FPGA 的高稳定性也使其广泛运用于智能汽车、无人飞行等复杂场景,也可与GPU、ASIC 芯片搭配使用。但由于没有统一框架和专用的集成开发环境,目前使用FPGA 开发AI 芯片还比较复杂,开发难度大、周期长。

3.3 定制ASIC

专用人工智能ASIC 在性能和能耗上均优于CPU和FPGA,并具有封装紧密、体积小、可靠性强、保密性高、成本低廉等诸多优点。对于同等规格的GPU 和ASIC,算力上ASIC 可达GPU 的2.5倍以上,功耗仅有GPU 的1/15。但ASIC 一旦定制后便无法更改,难以适应当前快速迭代的算法更新,部署灵活性受限,因此应用还不够广泛,目前部分用于矿机芯片,如ASICMiner、Avalon 等。

3.4 类脑芯片

类脑芯片是人工智能芯片的发展方向,此类芯片的基本思路是彻底改变传统芯片架构,借鉴脑科学领域的基本原理,开发类人脑工作模式的新架构。相比于传统的总线传输形式,类脑芯片数据处理单元与存储单元一体,可减少数据交换能耗,同时采取神经网络结构,具有自适应调整、分布式处理、高并发连接等优势,能够在极低功耗下处理海量数据、解决复杂问题。以IBM 推出的“真北”类脑芯片为例,其包含54亿个晶体管、2.56亿个可编程突触,突触运算速度可达460亿次/s,但功耗不足70 mW。我国清华大学、浙江大学等也在同步开发相应的类脑芯片。但由于晶体管在模拟神经单元上的差异,以及当前对于脑科学认识不足,类脑芯片在商业化应用上还有较长的路要走。

4 结束语

人工智能自提出至今已逾60余载,先后历经多次曲折发展,不断吸收融合各领域前沿科技,其理论框架日益成熟,软硬件基础日益完善,应用领域日益广泛。总的来看,人类在弱人工智能领域已取得长足进步,正在努力突破强人工智能的瓶颈。随着计算机技术与基础理论的不断突破,人工智能技术在未来将取得更大发展,深刻改变人们的生活方式。

猜你喜欢
算力芯片神经网络
卫星通信在算力网络中的应用研究
算力网络中基于算力标识的算力服务需求匹配
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
神经网络抑制无线通信干扰探究
基于神经网络的拉矫机控制模型建立
多通道采样芯片ADS8556在光伏并网中的应用
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
74HC164芯片的应用