深度学习:人工智能进入应用阶段

2017-05-04 13:52
中国信息化周报 2017年13期
关键词:语音领域深度

深度学习是人工智能的一个分支领域,其过程是建立模拟人脑进行分析学习的神经网络,从而实现模仿人脑的机制来读取和分析数据。深度学习被看做当前最接近人脑的机器学习方法。2016年3月,谷歌公司的人工智能“阿尔法围棋”(AlphaGo)战胜国际围棋大师李世石;2016年末至2017年初,化名“大师”(Master)的“阿尔法围棋”在网络平台上击败十多位中韩世界冠军,取得60连胜。具有深度学习能力的计算机已经能够在最复杂的棋类游戏上战胜人类,而在更多的工业、商业和家庭领域,人工智能的研发和产业化也不断推进,人工智能的美好时代已到了巨幕拉开的前夕。

从20世纪50年代发明需要人类指导才能运行的计算机开始,科学家用了半个多世纪的时间让计算机拥有自主学习能力,这一飞跃不仅仅是计算机科学和产业的里程碑,也对各行各业和人类社会产生巨大影响。“阿尔法围棋”的成功意味着计算机在智力上超过人类是早晚的事情,而这一转折点已经逼近,同时也表明人工智能进入了以“深度学习”为代表的新发展阶段。

传统计算机被设计用来进行高速运算,但必须先有人类工程师进行编程才能执行任务。编程是一个耗时且高成本的工作,而且在面对未知世界时,人类工程师并不能很好地帮助计算机进行判断。与这种依靠“教”来掌握工作能力的传统计算机不同,具有深度学习能力的计算机能够自己“学习”——程序员为它灌输的不是逻辑规则和方法,而是构建一个模拟人脑的神经网络。计算机通过不断自主训练掌握各种技能和技巧,在实际工作中根据环境变化和对人类命令的理解给出最优策略,这一过程和人类学习掌握新知识的过程几乎是相同的。从某种意义上讲,计算机已经发展到能够自行编程执行新任务的阶段。未来的人工智能将主动适应人,用人类的语言、动作、情感与人类进行互动交流,成为人类工作和生活的伙伴。

全球人工智能方兴未艾

作为一项革命性前沿科技,各大强国和跨国公司都在加速布局人工智能以抢占未来竞争制高点。如,在图像识别领域,谷歌、微软等公司近年来加强了对深度学习的研究和商业应用。谷歌的GoogleNet团队使用深度学习技术在计算机视觉挑战比赛中刷新了分类和侦测的纪录,该技术2015年起被应用于谷歌自动驾驶系统中,帮助计算机和人类驾驶员标注和预警道路上的危险情况;2015年,微软宣布其图像识别系统的错误率下降到4.94%,这低于人类在归类识别时5.10%的错误率。为了推动深度学习在语言识别上的应用,近期一些互联网巨头企业开源(开源技术是指开放源代码的软件技术,此类技术被认为有助于打破垄断,促进知识技术创新)了深度学习工具包,吸引更多人在自己的平台上进行语音识别的研发。开源思想能够建立更大的平台,有助于形成更大的学习数据库以及开发更多的应用产品。

每一次技术革命都会为赶超者带来“弯道超车”的历史机遇,但如果把握不好,赶超者也可能再一次陷入“跟随”的“漩涡”。经过几十年在计算机和相关领域的努力追赶,我国避开了这一“漩涡”。我国已具备发展人工智能研發和产业的基础和条件,在人工智能的基础研发、产业化上取得令人瞩目的成就,与发达国家的分工和竞争关系正在由“跟跑者”角色向“并跑者”“领跑者”角色转变。如,在语音识别上,2014年,百度对外发布其基于深度学习的语音识别系统Deep Speech,该系统能够模仿人大脑新皮层中的神经活动,通过深度学习识别出数字形式的声音、图片等数据。实际应用发现,在车内、人群等噪音环境下,Deep Speech系统的出错率比谷歌、微软、苹果等公司的类似系统低10%多。

人工智能是新科技、新产业

也是新的生产生活方式

深度学习是机器学习的新浪潮,也是人工智能发展的一个里程碑,虽然已在语音识别、图像识别、预测分析、机器翻译等领域小试身手,但客观上讲,无论是理论研究还是商业化都面临巨大的难题。谁也不能保证深度学习在未来能成为人工智能最基础的方法,或许会有更好的新技术替代深度学习,但可以肯定的是,人工智能的梦想不再遥远。机器在不久的将来会像人类一样思考,这将对人类科技、经济和社会产生巨大影响。

首先,人工智能代表更高的生产效率。机械化、自动化以及传统互联网对生产率的提升几乎已走到尽头,而人工智能的应用将为人类生产率的提升创造新动力。与之前技术革命主要提高体力劳动生产率不同,人工智能主要是推动脑力和智力劳动效率的增长。如,人工智能能够根据市场、供应链、物流、仓储情况,甚至每个工人的技能水平、工作效率进行科学排产,从而最大限度利用企业资源并将成本和损耗降到极低的水平,这是依靠人工排产不能做到的。

其次,人工智能造就新的竞争优势。在互联网产业领域,已经有现象表明,人工智能具有重新调整行业竞争秩序的潜力。面对愈加错综复杂的市场环境,企业的风险控制和经营决策已超出最优秀管理者的能力,未能投资和利用人工智能的管理团队将有很大可能会在竞争中被淘汰。

最后,人工智能催生新的产业和业态。苹果公司的语音助理Siri、亚马逊的语音助理Alexa、谷歌的图像识别、百度的语音识别等,是电子信息产业借助人工智能形成的新业务,但人工智能的应用绝不局限于电子信息领域。如,在农业生产领域,日本的瓜农借助谷歌人工智能技术完成对果实的自动分拣,而在过去这一工作需要花费时间和昂贵的劳动力。在金融服务领域,人工智能帮助投资决策者开辟新的数据集,实现更快分析,从而降低金融业成本,提高回报。在医疗保健领域,德国默克制药公司利用深度学习将研究工作聚焦于那些最有可能与靶标绑定的分子,从而使新药研发成功率提高15%。在零售领域,亚马逊、阿里巴巴、京东等电商都在尝试使用“大数据+深度学习”的方式对用户实现更加精确的推送服务,同时实现更科学的定价和配送货。

需要明确的是,我们通常不会孤立地使用一种科技手段,人工智能在实际中的应用需要与其他技术相结合。“深度模型+大数据”是现在非常流行的计算机解决问题的方法。如,在深度学习系统识别语音和文字后,通过大数据库,计算机能够将其翻译成其他国家的语言,这比之前通过语法逻辑的翻译手段准确得多。在无人驾驶系统中,计算机通过深度学习的方法了解外界环境中哪些是安全的、哪些是需要避让的、哪些是极度危险的,深度学习的结果用以指导计算机设计驾驶速度和路线,这是无人驾驶系统安全性的最基本保障。人工智能与机器人结合会创造真正会思考、能学习的机器人,这会极大提高机器人的使用体验,不仅提高工业领域机器人的生产效率和安全性,在商业场所和家庭,机器人也能够更好地为人类服务。

猜你喜欢
语音领域深度
深度理解一元一次方程
领域·对峙
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
深度观察
深度观察
对方正在输入……
深度观察
新常态下推动多层次多领域依法治理初探