霍娜
“人工智能在将来的5到10年,就像我们现在的水、电和互联网一样,在我们的生活中成为我们的必需品。以语音为主、键盘触摸为辅的人机交互正逐渐成为刚需,人工智能产业迎来第三次发展浪潮”。 11月23日,在人工智能学科诞生60周年之际,以“人工智能+ 共创新世界”为主题的科大讯飞2016年度发布会在北京国家会议中心隆重举行,科大讯飞董事长刘庆峰畅谈人工智能。
语音识别与合成
去年,科大讯飞推出的讯飞听见产品,实时将语音转写成文字,速度和准确率远超人工速记,现场识别正确率达到99%以上。今年的发布会上,讯飞听见进行实时语音转写,并以字幕形式呈现,再次将这一刚需产品进行了推广。
另外,讯飞听见在实时中文语音转写的基础上,融合全新的多语种翻译技术,实时将中文演讲翻译成英语、日语、韩语以及维吾尔语并同步展示在大屏幕上,引发现场的一个高潮,这也是全球首次基于人工智能技术的实时机器多语种翻译技术在大型活动上的展示,准确率比肩同传翻译。
会上,科大讯飞推出了两款语音合成技术相关的产品——讯飞快听和配音阁。讯飞快听APP,通过打造个性化音库,为用户提供个性化语音合成服务,能随时随地朗读任何文章,并有每日好文推荐,解放双眼,想听就听,满足用户个性化需求,特别是在老人、恋人、儿童等人群有着广泛的应用空间。比如,空巢老人可以每天听到使用自己儿女的声音播报的新闻以及生活提醒,拉近时空距离,增进亲情。配音阁,致力于为用户提供智能语音合成、真人配音及各种特色化、个性化配音服务。
科大讯飞还发布了中英互译神器——“晓译翻译机”和完全自主产权的智能客服机器人——晓曼。晓曼机器人是一款专用于银行业务的接待机器人,集成了AIUI人工智能技术,以及人脸、声纹、远场识别等科技,可以识别已登记过的顾客、提供个性化的推荐。目前,已有20多台晓曼机器人在徽商银行、建设银行等地试点上岗,可以独立办理超过70%的业务。
发布会上,科大讯飞也展示了讯飞输入法的新功能:可直接将纸上的文字转录,并支持手势修改。台上演示人员先是在一张白纸上手写了一段“我现在有点紧张,发布会结束后,我晚上请大家吃饭”的文字,然后他举着这张纸正对着机器人说“启动拍摄”,机器在进行扫描后迅速将纸上的文字录入了进去。此时响起了由衷的掌声。
他接下来演示如何在这段文字里添加文字。他用手势的体感交互在这段文字上进行光标定位,嵌入了“六点”俩字。然后他手轻轻一划,屏幕上的文字就被清理干净。然后他用语音输入了一长段文字,先是发出口令“开始听写”,然后输入“请庆峰帮我订好火车票,把庆峰修改成庆丰包子铺的庆丰,另外请庆峰帮我带一本创新者的窘境,把创新者的窘境翻译成英文,并加上书名号。”此时,屏幕上根据口令,将“创新者的窘境”瞬间改成《The Innovator's Dilemma》,场下顿时响起如雷掌声。它不仅能识别“庆峰”和“庆丰”,还能从一长串语音中精准找到书名并根据指令进行修改,着实让人吃惊。
科大讯飞轮值总裁胡郁透露了这套输入法的奥秘:“首先得益于我们领先的离线手写输入的引擎,可以让各种各样的智能设备识别手写文字。同时,我们知道要完成输入,必须有一个确定性内容、确定性的功能保证,而语音在达到99.99%以后,剩下的0.01很难达到,我们看到,在没有触摸屏的情况下,用上帝赐给我们的自然的双手(解决了这个问题)。”智能家居
在智能家居方面,科大讯飞推出了新款家庭智能盒子超脑魔盒,想要打造一个通过语音控制整个家具的智能生活。这款超脑魔盒涵盖了影音、家居、英语学习、生活百科等多方面的功能,使之使用的场景基本覆盖了家居生活的方方面面。而根据现场的演示情形来看,超脑魔盒可以通过语音操控来支持切换、快进等设置,而且没有反应与操作的延迟。
当然,智能家居并不是一个新潮的概念,而近年来也出现了越来越多的智能家居产品。比如谷歌在今年的年度I/O開发者大会上,推出了能通过语音助理“声控”的Google Home。谷歌是希望用Google Home来建立一个生态系统,毕竟在它庞大的系统下,有着YouTube,有着Google Play这样可以融入到生活中的产品。
智能驾驶
至于智能驾驶领域,科大讯飞则是对智能车载系统进行了升级,推出了全新的飞鱼助理。通过将远场识别、方言识别等技术应用于汽车,驾驶者则可以通过语音进行通讯、导航的操作,也可以对车身进行控制和信息查询。据透露,科大讯飞目前已与30多个汽车厂商建立了长期合作,并已在100多款量产车型中搭载产品。
这套语音识别系统最大特点是讯飞人工智能在上下文理解方面的表现,尤其在汽车里的语音助手演示,很多时候,老司机并没有给它明确的指令,但它会给出一些你想要的结果。
比如说去长城,它会问你去八达岭还是慕田峪长城;比如你问附近有什么酒店,它会自动搜索八达岭长城附近的酒店并给出不同的价位段;比如你想在车里听一首《甜蜜蜜》,它能够调出邓丽君的,你想听鹿晗版的,它立马切换,当你想听“他和陶喆合唱的”,它会理解这个“他”指的是鹿晗,并且调出鹿晗和陶喆合唱的《请到长城来滑雪》;比如你晚上想去“中央财大”附近吃东西,它会搜索“中央财经大学”附近的参观,你说想吃火锅还想看电影,它就锁定了大钟寺的海底捞。
在汽车领域,有着太多的巨头裹挟着资本与人才融入进来,正如今年一直处在舆论浪尖的无人驾驶。像是特斯拉选择抛开一直合作的无人驾驶技术公司,自己投入巨大的人力物力,开发拥有“第5级自动驾驶的能力”的Autopilot 2.0;百度从载狗参加驾校测试,到在乌镇的互联网大会期间,高调宣传“云骁”无人驾驶汽车,在无人驾驶领域也力图谋得一方天下;更有谷歌无人驾驶汽车,行程已经突破了200万英里;Uber的无人驾驶汽车,也已经在美国上路测试。
总的来说,智能化是汽车领域未来的方向,而力图在车载环境下,通过语音实现多种控制的飞鱼助理,也是一种变相的解放驾驶员的智能方式。
科大讯飞的远景是人工智能,并且也提出了“讯飞超脑”计划,直接对谷歌大脑和百度大脑发起挑战。但更可以明确的是,科大讯飞在发展人工智能远景的同时,把握住了人工智能的落地入口,这就是语音交互,这是比无人车、机器人更能呈现人工智能的刚需入口。
谷歌和百度在人工智能、脑科技方面发力已久,科大讯飞凭什么能挑战巨头?刘庆峰认为,科大讯飞最大的优势在于专注,专注于语音交互技术、专注于语音技术与智能家居硬件的结合。
正如刘庆峰所认为,人工智能的发展不会是一蹴而就的,创业者要有坚守的心态、毅力和恒心。这一领域未来的趋势,是通过人机协同技术,聚焦人类智慧,提高各行业工作效率。