人工智能领域关键技术的发展

2019-12-02 02:14:23靳芳
电子技术与软件工程 2019年22期
关键词:框架芯片领域

文/靳芳

1 现阶段人工智能技术发展特点

1.1 深度学习技术逐渐在各领域应用

深度学习借助搭建多隐层神经网络模型,在海量训练数据集的基础上学习到隐层特征,在各类型的学习任务上取得了最优算法性能。这种在海量数据集上进行有监督学习,并提取隐层特征的方法,能实现对特征高效的端到端学习,尤其适用于大规模标注数据集。深度学习自2006年由Geoffrey Hinton 重新提出以来,已经逐步从实验里走出,在各方面取得了令人瞩目的成就,其中包括利用计算机视觉技术在智慧安防、人脸识别领域的应用,自然语言处理技术在机器翻译、阅读理解及客服机器人领域的应用,语音处理技术在语音识别、语音合成等领域的应用,可以预计随着深度学习技术的不断深入发展以及与各个行业应用的深入结合,会有越来越多的智能应用在各个行业落地,并取得显著的商业成果。

1.2 基础数据集建设已经成为基本共识

2010年斯坦福大学的李飞飞教授发布了一个包含2 万多个类别、超过1400 万图片的图像标注数据集ImageNet。ImageNet 数据集的发布标志着图像处理领域有了大规模的基础数据集测量基准,此数据集逐渐成为业界图形图像相关算法性能的实际衡量标准。在ImageNet 之后,一些企业和大型研究机构逐渐认识到大规模基础数据集对提升人工智能在领域内应用效果的价值,并逐步开始建立属于自己的数据集,商汤和旷视公司构建的亿级人脸识别数据集、科大讯飞构建的大规模语音识别数据集、百度发布的多场景无人驾驶数据集都是很好的样例。

1.3 新型计算框架陆续成为产业界发展目标

深度学习在计算机视觉、自然语言处理、无人驾驶、语音识别等领域取得了长足的发展。然而,随着深度学习模型越来越复杂,为实现各种网络模型架构,开发人员需要耗费大量时间重复实现各类底层算法与程序库。为实现更高效的深度学习模型开发,学术界和企业界推出了多种深度学习框架,包括TensorFlow、Caffe、Torch、MXNet 等。这些框架的功能通常包括:自动符号运算、GPU 加速、模块化封装等。

2 人工智能技术发展面临的挑战

2.1 因果推理与模型理解

现有的深度学习模型能够通过发掘各种隐层特征,发现事件之间的关联性,建立映射关系,但是在现有的框架下,深度学习模型无法解释因果关系。简单来说,深度学习学到的是输入与输出特征间的复杂非线性关系,而非因果性的表示。深度学习是一种基于概率统计的算法,其学习到的是以概率表示的非线性连接关系,无法像人类一样进行举一反三的应用。

2.2 基础数据积累难以满足模型训练需求

深度学习模型性能严重依赖于大规模的标注数据集,然而数据的标注过程需要耗费大量的人力与物力,大规模高质量领域标注数据的建立需要进行长期积累。首先,在一些关键领域的标注数据还存在缺失现象,例如医疗行业,由于标注过程复杂且需要领域专家的深度参与,使得大规模标注数据一直是阻碍智能算法深入应用的瓶颈。其次,现存的基础数据集质量参差不齐,高价值的领域数据基本上由少数几家巨头或政府所掌握。基础数据集的缺乏,使得深度学习模型在领域中的有效训练与落地应用面临严重挑战。

2.3 计算框架和通用智能芯片之间竞争激烈

现在已经有较多的深度学习计算框架,但是实际使用深度学习的场景众多,其相关应用呈现出碎片化的特点,不管从功能还是性能的角度来说,使用开源计算框架和实际需求会存在着较为明显的距离。目前为止,由于行业竞争及需求碎片化的原因,目前尚未出现既贴合产业发展要求且兼具统治位置的开源计算机框架。此外,面向深度学习的专用智能芯片尚处于起步阶段,且大多是处于专有领域的专有芯片,如面向智能驾驶领域的芯片、面向语音处理的芯片、面向人脸识别的芯片等,而能适用各种领域应用场景的通用智能芯片还需要较长时间的探索。

2.4 人机和谐共处艰难探索

由于深度学习模型存在的黑箱问题,使得深度学习智能系统在应用过程中存在很多安全隐患,例如特斯拉公司推出的自动驾驶功能在使用过程中出现了多起由于技术原因导致多次严重事故、甚至出现人员死伤的情况。这些事故不仅造成了人们的生命和财产损失,也严重打击了人们对人工智能实际应用的信心。如何保证人类与智能系统之间的和谐共处、协同合作等问题,关系着未来人工智能技术在领域中的落地应用。

3 人工智能技术发展趋势

3.1 算法理论

从算法理论层面来说,将继续按照深度学习模型完善和新算法提出的两条主线发展。首先,深度学习在提升可靠性、可解释性等方面的研究以及在零样本学习(Zero-Shot learning)、无监督学习、迁移学习等方面的研究会逐渐成为未来发展方向,这是发展深度学习算法所必须经历的,也是行业发展的必要条件。

3.2 基础数据集

参照数据集基础来讲,现在发展的趋势是学术界与产业界共同合作构建含有语音、图像、视频等通用数据集以及各行业的专业数据集,确保各种数据能迅速达到相关实施需求。这其中的需求来源包括多个方面:

(1)人们对人工智能的认识不断优化升级,确保数据集的自建、清洗、规范、标注等工作在企业内部能有序完成;

(2)随着深度学习的发展,产生了大量辅助人类工作的智能化数据标注系统,提升标注的效率;

(3)政府集中引导,行业龙头协调配合,促使搭建更为专业标准的数据集,为行业领域人工智能技术的快速落地应用提供标准化训练数据集,并将逐步形成领域内检测算法性能的事实标准。

3.3 计算平台与芯片

针对计算平台和芯片来说,企业出于自身利益选择自主研究计算框架与平台,甚至定义领域专用智能芯片等是属于较为常见的现象,原因主要是:

(1)企业要对数据安全性业务进行考虑,企业内部不信任各种计算平台;

(2)企业内部数据信息和平台都有其特殊性,为了更好的促进企业内部实际发展需求,可以对计算框架平台芯片进行独立自主研究;

(3)在开源技术生态建设方面,人工智能计算框架及相关技术尚未出现一家独大的局面,各头部企业选择自建深度学习计算平台,并大力建设相应的开源生态对构建企业利益相关的商业闭环具有重要意义。

3.4 人机协同机制

结合人机协同机制的“人在回路”设计,在未来会是智能系统发展趋势与必备能力。当前计算机智能并不是以人为中心来进行设计和构建的,而长期处于以计算机为中心的系统发展模式中。在很多场景下,甚至出现了大量违背人类使用规律的情况。针对此类情况,需要构建将人类的认知模型向计算机智能技术进行有效植入的方法,确保其在推理决策方面能够符合人类世界认知水平。随着通用领域知识库(WikiData、DBPedia、FreeBase 等)与领域相关的专用知识库(如医疗领域知识库、地理信息领域知识库)的建立,将人类基础认知知识与人工智能技术相结合日趋成为学术、产业界相互配合追求的目标,且能在预期时间段内取得良好的成果。

4 结论

人工智能是基础研发与实践运用相结合的计算机科学,其研究热点既包含机器学习基础算法的改进与优化,也涵盖自然语言处理、计算机视觉和机器人等技术的实践应用研究。应用领域技术的发展,促进了人工智能基础算法的逐步发展,而基础算法在优化升级的同时,给实际领域应用方向也提供了新算法、新思路和新手段。人工智能领域的实际发展是通过领域应用热点和基础共性技术的相互促进集中体现与推动的,这其中新兴技术的发展也对整个学科的发展产生了深远的影响,尤其是近年来生成对抗网络、强化学习等的快速发展,其在实践领域的广泛使用,促进了人工智能技术向前快速变化发展。

猜你喜欢
框架芯片领域
框架
广义框架的不相交性
领域·对峙
青年生活(2019年23期)2019-09-10 12:55:43
WTO框架下
法大研究生(2017年1期)2017-04-10 08:55:06
芯片测试
多通道采样芯片ADS8556在光伏并网中的应用
一种基于OpenStack的云应用开发框架
新常态下推动多层次多领域依法治理初探
74HC164芯片的应用
河南科技(2014年10期)2014-02-27 14:09:18
肯定与质疑:“慕课”在基础教育领域的应用