迎接智能语音时代到来

2019-04-24 18:27
中国信息化 2019年3期
关键词:语音人工智能智能

作为一个见证者,我非常庆幸自己亲历了波澜壮阔的互联网时代、大数据时代、人工智能时代,深切感受到了接踵而至的技术浪潮是如何改变我们的工作和生活,如果未来有闲暇时间追根溯源,那一定是非常美好的事情。

作为一个出版人,我也非常高兴能够遇到《智能语音时代》这样一部优秀的科技人文作品,对于这本深入浅出、充满趣味、又可能引领一个新的时代到来的科普著作,能够先睹为快,实在是一件赏心悦目的事情。

对于智能语音时代的到来,我们大部分人已经多多少少有了一些直接或间接的感受。比如我们手机上的Siri或者其他语音软件,这曾是苹果(iPhone)手机最令人瞩目的新功能之一;又比如我们经常在用的语音导航软件里传出的林志玲的“娃娃音”,还有“微软小冰”展现自己诗歌“别才”的诗集《阳光失了玻璃窗》;当然,还有电子鸡、旅行青蛙这样风行一时的电子宠物。

对我来说最新的例子是,春节购买了一只小米AI音箱(“小爱同学”)作为礼物送给父母;“小爱同学”的乖巧能干,可着实把他们惊呆了。“小爱同学”为他们做的第一件事是播放花鼓戏《浏阳河》,这是现代技术与古老文化碰撞出的新奇快乐。

与我们直接的生活经验不同,被称为美国鬼才科普作家的本书作者詹姆斯.维尔和斯(JamesVlahos),给我们带来了对语音技术这样一个蔚为大观的科技发展趋势的深入洞察。作为智能语音领域的开山之作,作者确实出手不凡,他把智能语音技术、应用与产业的讨论引向了难得的高度,非常清晰地给我们展现了智能语音时代的新场景。

詹姆斯.维尔和斯是一位长期追踪研究语音计算技术、语音人工智能的专题记者,30多年来,他零距离地见证和细致地观察了这一领域的研究进展,曾与这一领域中的许多杰出人物直接对话,本书中的许多观点就是来自于他的第一手访谈资料的提炼。

更难能可贵的是,本书作者还是这一领域的深度涉猎者和亲身参与者。他从十几岁起就对人与机器的对话产生浓厚兴趣,并曾尝试用BASIC语言开发了自己的文本对话游戏(虽然只能运行寥寥几步),他还开发出了以自己父亲为蓝本的语音机器人程序,让自己的父亲实现了“初步”的“永生”。

因此本书不管是观察与思考的深度和广度、身心体验的直接和丰富,还是研究资料的广泛和详实等各个方面都令人钦佩,也让人感到解渴和过瘾。读这样一本书,从实用的角度说,花费的时间有更高的性价比,它能让我们真切地瞭望到一个新的产业生态的发展趋势,启发我们从经济、社会和文化等角度来思考语音计算技术和语音人工智能已经或即将带来的影响。

翻开这本书,你首先就会被作者这样的话语所吸引:每十年左右,人与技术的互动方式就会有一个根本性的转变。数十亿美元的财富会恭候那些定义了新的时代范式的公司,而落伍者将破产倒闭。在计算机的大型机时代,IBM是主宰者,微软是桌面时代的王者,谷歌靠搜索引领了互联网时代,苹果和脸书则在移动互联网时代一飞冲天。

最近的一次范式转换正在进行中。

最新的平台之战已经打响。

最新的技术颠覆正在发生,无论是其规模还是其重要性,都可能是世人前所未见的。

我们正在迈入智能语音时代。

语音打破了一些世界上最有价值的公司的商业模式,为新的应用创造了机会。语音把人工智能的控制权直接放在了用户的手中。科幻作品中很久之前就预言过的关系模式,在这样的关系模式中,拟人化的人工智能成为我们的助手、看门人、预言者和朋友。

作者这样言之凿凿,显然并非空穴来风。了解作者的思考逻辑,把握这样一个大趋势,并以此指导我们的工作和生活,必然有利于我们做出更多正确的选择。书中提到,当Siri 在2010年刚刚开发出来时,先知先觉的苹果公司前CEO乔布斯曾经连续17天每天给开发者之一的吉特劳斯打电话,有时甚至深更半夜也打,终于把Siri收入苹果公司囊中。

远见从来都是人类最宝贵的品质和资产之一,作为智能语音领域的第一本书,这也可以视为一本“远见之书”。

除了具有经济性含义的远见,本书还非常重视这项新技术对人类精神和感性世界的影响,甚至他也把自己和自己的家庭带入了与语音人工智能的互动过程中,这大大增强了本书的故事性。本书有文采、有温度、有趣味,展卷在手,没有同类书的枯燥和沉重,反而有一种引人入胜、不忍释卷之感。

正如作者在書中所言:智能语音时代的到来是人类历史的转折,因为运用语音是我们人类这个物种的特质——这一能力把我们和其他物种区分开来。我们的内部意识中心不在肺部的空气里,也不在血管里的血液中,而是在我们大脑的语言区里。语言调整着我们的关系。它能塑造思想、表达感受、沟通需求。它能发起变革、挽救生命、激起爱恨情仇。它把我们所知道的一切体现和记录下来。

不管语言是由人说出来,还是由机器说出来,尤其是当“你应我答”的模式出现,在人与人之间,人与机器之间,交谈就绝不只是一种纯粹依靠逻辑展开的过程。语言永远不是脱离内容的外壳,人都会被语言影响或打动。作者在书中讨论的种种事例和情境,都让我们领悟到人和机器之间的语言交流对我们的情感世界带来的影响和改变,未来,我们与无处不在的机器构成的世界,将是一个前所未见的更加丰富多彩的感性世界。在云时代,“只要简单地加上一个麦克风和一个Wi-Fi 芯片,任何装置都能实现语音驱动。从浴室的水龙头到孩子玩的布娃娃,任何装置都能利用分布在全球的几千台计算机所提供的计算能力。”这几乎意味着“万物能言”的童话世界真的实现了。

基于这样的前景,作者指出:当语音机器人同时作为工具和准生命进入我们的生活时,它们模糊了两者的界限。它们模糊了隐私、自主权和亲密感的界限。它们模糊了人际关系与数字关系、现实与虚拟、生和死之间的界限。

可以想象当这种种界线模糊之后,在我们的生活中将会发生多少故事。这些故事肯定不会沿着单一的模式进行,必定会有更多“人机情未了”式的故事发生。

除上述简单提到的精彩之外,还值得一提的是本书中充满浓厚的中国元素,从另外一个侧面拉近了中国读者与这一话题的距离。

作者在书中用很大篇幅讨论了亚马逊主办的亚历克莎奖竞赛,他这样介绍在比赛中拔得头筹的华盛顿大学团队,“这个社交机器人的优势似乎来自该团队28岁的学生领袖郝方(Hao Fang)的个性。郝方来自中国南方的宜春市,他活力四射、性格开朗。他和他的团队成员希望让他们的社交机器人的评审用户也能感到快乐。”正是这位郝方同学带领的团队所开发出的社交机器人创造了交谈长度20分钟的记录。

“当华盛顿大学团队上台后,普拉萨德把那份令人满意的奖品发给了他们——一张金额达50万美元的巨额奖券式支票。郝方大笑着拿过支票,对着镜头竖起了大拇指。”

此情此景也让我们为这位郝方同学高兴。

在由10万个问题组成的斯坦福问答数据集(Stanford Question Answer Dataset)测试中,真人平均能答对82%的问题。微软、阿里巴巴在2018年1月公布,它们所开发的系统得分和普通人得分一样高,这成了当时的头条新闻。

另外,还有在微软负责ZO聊天机器人项目的王颖,以及大家所熟悉的微信,都是书中屡屡提及的对象。这些中国元素让我们看到,我们与这一项划时代科技突破的关系从来没有像今天这样接近过。这令我们感到自豪,也让我们与本书的主题多了一些千丝万缕的关系。更何况,我们的人工智能领域的标杆企业——科大讯飞,经过在智能语音领域的务实坚持和勇敢探索,已经成为全球智能语音产业的主力军和技术领先者。

作为一项具有重大颠覆性的技术,语音计算技术和语音人工智能带来的影响是非常深广的,难以给出一个简单判断。作者对语音人工智能的认识非常深刻,他指出:“从鱼钩到火星探测器,我们一直在制造工具。虽然我们制造出非常多有用的东西,但它们在任何更深层次上都不像我们人类自己。使用语言是我们人类这个物种真正与众不同的地方。语言把我们联结起来。因此,教机器掌握语言不同于通过编程让它们学会进行衍生品交易、做手术、进行海底航行或其他任何事情。我们正在与其共享人类的核心特征。”

对这样一份科技“大礼包”,人类难以做到敬谢不敏。“世界应该拥抱语音计算技术所创造的充满希望的人文精神,人类必然会这样选择,也只能如此选择。”

我们应该看到,“像历史上其他给人带来便利的新技术一样,语音人工智能也可能需要我们付出代价。我们可能在智力活动上变得更加消极,我们将更少自主地寻找答案。寻找答案是一种激发好奇心、激发思考的探索。有了人工智能,答案會来找我们。与打开龙头放水相比,从井里费力地打水明显过时了,而费力地寻找答案也正变得过时。”

这显然可以视为其消极的一面,但人类从未因为其消极的一面而排斥过任何一项能够带来巨大便利性的新技术。

因此,作者又向我们指出:如果应对得当,语音人工智能有可能成为我们发明的最“自然”的技术。认为人工智能只是冷冰冰的算法,这是一种误解。我们可以将自己最好的价值观和同理心注入其中。我们可以让它变得聪明、令人愉快、精灵古怪,并且善解人意。有了智能语音技术,我们最终可以制造出不那么陌生、更像我们的机器。

未来已来,一场智能语音科技大秀的帷幕正在拉开。随着5G时代的到来,包括智能语音在内的人工智能技术,一定会让世界更美好。

(本文是为电子工业出版社《智能语音时代》一书撰写的前言。)

猜你喜欢
语音人工智能智能
微信语音恐惧症
魔力语音
Magic Phonetics魔力语音
2019:人工智能
对方正在输入……
智能烹饪机
人工智能与就业
超智能插秧机
数读人工智能
自由光2.4L专业版+智能包