5G+AI,打造全场景沉浸式互动文学体验

2021-08-14 05:24信集
信息化建设 2021年6期
关键词:虚拟现实语音数字

信集

所带来的数字阅读、有声阅读、可视化阅读已然超越传统阅读体验,使人们看听学的方式大大改观,从二维到三维,从视觉到五感,从平面到多场景,从置身书外到沉浸其中

随着5G技术的落地、虚拟现实技术的提升以及人工智能的发展,打造全场景沉浸式互动体验成为数字阅读行业未来的发展趋势。咪咕数字传媒有限公司(简称“咪咕数媒”)顺应新技术发展趋势,依托中国移动5G领先技术,凭借咪咕数媒在内容生产、内容传输、用户基数等方面的优势,加强5G、人工智能、增强现实等前沿技术与阅读的深度融合,基于智能语音、VR/AR 阅读、超高清无损音质、情境智能 TTS等技术研发,创新探索5G富媒书、AR互动阅读、24bit至臻听书、趣读等新产品功能,并在咪咕阅读、咪咕中信书店落地应用,致力于为用户提供5G场景下的全新阅读视听体验。

由咪咕数媒打造的基于5G+的数字文化融合创新应用项目,所带来的数字阅读、有声阅读、可视化阅读已然超越传统阅读体验,使人们看听学的方式大大改观,从二维到三维,从视觉到五感,从平面到多场景,从置身书外到沉浸其中。5G时代读书,不仅可以听,还可以演,还可以与书本AI交互,实现多场景、多维度的沉浸式体验。“水光潋滟晴方好,山色空蒙雨亦奇。欲把西湖比西子,淡妆浓抹总相宜。”相信在不久的将来,当读到这首时,眼前真的能出现杭州西湖的山水美景,耳边响起雨滴拍打湖面的天籁之音。

趣读:5G+4K/8K+人工智能

趣读软件App面向家庭中的幼儿园到中学生用户,基于机顶盒和电视机屏幕,向用户提供智能语音朗读和个人朗读评分等功能。

趣读软件App在5G模式下,有电视、手机、智能手表等多种版本客户端,以实现趣味朗读交互体验、打造知识付费为目标,优化原有智能语音技术,研发主播原声领读、用户朗读、语音测评、错误修正等主要功能技术,通过听—读—写等方式实现趣味互动。以国学为依托,提供沉浸式分场景朗读体验的大小屏互动。分角色朗读、超高清视频朗读等特色模式生动还原作品意境,让用户获得身心沉浸的阅读感受。此外,借助AI语音评测系统来分析朗读音频,生成流利度、语调、重音等多维度的评分报告,更加专业、直观地帮助用户提升语言表达技巧。

值得注意的是,趣读软件在该领域属于少见产品,具有先发优势。同时后续可面向学校、教育机构、政府、企事业单位的智能陪伴、知识培训、中/英文教育学习等领域拓展。

富媒书:5G+AR数字内容

富媒书基于咪咕中信书店软件和咪咕阅读软件,侧重于亲子阅读和科普文、课程,适合K12学生和学前幼儿。富媒书将AR与电子书相结合,这在行业内尚属首创。对于电子书中的抽象場景,如天文、动物、人体、试验等场景,现场观众仅凭一部手机就能唤起和书中内容相匹配的AR场景,寓教于乐,满足了读者对抽象概念和模糊场景的具象理解,让阅读不止于字里行间的主观想象。通过研发基于5G网络下的AR数字内容汇聚能力系统,提供富媒书(AR数字内容)的在线渲染服务: 研发AR技术并结合现有电子书技术,在咪咕阅读和咪咕中信书店软件里推出富媒书,对于读者理解困难的场景,可用手机唤起对电子书内容匹配的AR场景,并且互动,寓教于乐,满足读者对抽象概念和模糊场景的具象理解,给读者全方位的阅读体验。

在5G 规模化覆盖后,富媒书将迎来发展良机。根据Greenlight Insights数据显示,2018年全球虚拟现实(VR)市场规模超过700亿元人民币,其中,虚拟现实整体市场超过600亿元,增强现实(AR)市场超过100亿元。AR与实体书结合方面,企鹅萌萌AR绘本系列累计出售超过80万册,小熊尼奥AR口袋动物园系列月销30万套。

至臻听书:AI情感智能识别

近年来有声读物已占据了相当一部分数字阅读的市场份额,咪咕阅读推出的至境听书与至臻听书(24bit),在有声书的相关功能上进行了优化。

至臻听书基于AI语音技术,对小说、剧本等大量含有情境信息的文本进行了合成发音,通过特殊音效和背景音的添加、多角色的朗读来模拟剧情中的具体场景,为读者带来更加丰富真实的听书体验。至臻听书采用了24bit采样深度及FLAC无损格式储存,对听书音质进行了升级优化,音效配乐和人声也更具层次感,宛若置身朗读现场LIVE秀,真正实现声临其境。

至臻听书是市场上首家提供24bit无损音质听书在线播放的产品。目前已在北京、上海、广东、浙江等22个省份,40余家中国移动营业厅落地5G业务展示,结合5G手机终端、高解析音频设备,推广24bit至臻听书内容。预计在5G规模化覆盖后将迎来发展机会。

未来:优势丰厚,前景可期

作为中国移动旗下的新媒体公司,咪咕数媒无论是在内容生产、内容传输、用户基数等方面都有着得天独厚的优势,如5G跨地域无延迟分角色朗读,即在 5G 环境下,实现跨地域无延迟的多角色朗读实时演绎;智能语音评测,即用户通过遥控器、客户端或智能音箱进行朗读,系统对朗读结果以声韵、声调、流利度、完整度等维度进行智能评分;AR 数字内容在线渲染和服务。

目前咪咕数媒平台的电子书数量超过50万册,App月活超过3000万,合作的出版社和图书公司等超过1000家。本项目利用5G技术与AR/VR、人工智能等技术在数字文化领域的融合应用,使文字之外的拓展内容成为数字阅读的新载体,为公众带来前所未有的虚拟现实沉浸式体验。咪咕也将在此基础之上打造更具有可持续发展能力的产业体系,成为数字文化行业的实践者、领跑者。

此外,通过实施5G+的数字文化融合创新应用项目应用,还能带来丰富的经济和社会效益,预估到2022年累计可产生销售收入5900万元。同时,咪咕数媒也将在此基础之上打造更具有可持续发展能力的产业体系,成为数字文化行业的实践者、领跑者,继续引领产品升级,推动5G场景下的数字文化领域的生态建设。

猜你喜欢
虚拟现实语音数字
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
REALITY BITES
虚拟现实技术向科幻小说借灵感
浅谈虚拟现实
数字变变变