黄嘉桐 回姝 丁冠源 郑红丽
(中国第一汽车股份有限公司研发总院,长春 130013)
缩略语
A2B Automotive Audio Bus
IRQ Interrupt ReQuest
GPIO General-Purpose Input/Output
I2C Inter Integrated Circuit
SDA Serial Data
SCL Serial Clock Line
DSP Digital Signal Processing
A2DP Advanced Audio Distribution Profile
VR Voice Recognition
FM Frequency Modulation
AM Amplitude Modulation
汽车行业向着智能化趋势发展,在人车关系变革的时代,汽车成了用户生活的“第三空间”,用户对信息娱乐性的要求不断提高,使车载信息娱乐系统在丰富车内娱乐生活方面发挥越来越重要的作用。
“听觉”是驾乘人员高级感官之一,车载娱乐系统中的音频娱乐系统是驾乘人员经常使用的车内设备,但是汽车音频播放功能的局限,极大影响了车载娱乐系统性能的发挥[1]。汽车用传统模拟音频双绞线对座舱内音频信息传输容量有限,与此同时,传统模拟音频传输方式抗干扰能力差,线阻高,音频传输衰减大,已经无法满足用户对高品质整车音效的追求。如何减少线束用量并提升信息传输效率,加强信号抗干扰性,提升音质及感官体验是红旗品牌及行业亟需解决的问题。
本文建立了一种基于数字音频总线技术(Automotive Audio Bus, A2B)的音频架构设计,通过车载信息娱乐音频播放系统,实现多音源混合播放,基于用户体验的音源增益降低策略,旨在提高车载音频播放系统的娱乐性和功能性,提高用户体验[2]。
信息娱乐系统的音频链路主要由信息娱乐控制器、功率放大器(简称“功放”)以及音频线束组成,在整体架构设计上,音源类型的区分以及音源的混音、增益策略均在信息娱乐系统中实现,功放主要用于音频源的叠加及音效处理工作,下文通过硬件连接及软件实现2个维度进行详细阐述。
首先,需要建立车载信息娱乐系统和功率放大器间的音频传输链路。信息娱乐控制器和功放直接建立连接,第一步先确保双方硬件中的车载数字音频(Automotive Audio Bus,A2B)芯片建立通信。其中,信息娱乐系统中的A2B 芯片作为主节点(Master),功放中的A2B芯片作为从节点(Slave),如图1所示。
图1 A2B链路连接方式
A2B芯片在控制器通电后,先完成自身初始化工作,同时A2B总线实时进行错误检查。如果检测到错误,A2B会通过中断要求(Interrupt ReQuest,IRQ)中断反馈给主芯片(System On Chip, SOC),SOC 通过读取A2B芯片寄存器数据识别错误类型[3]。
整体系统接口如图2 所示,信息娱乐系统和功放系统间由A2B线束连接。除传递音频信息外,A2B总线协议支持串行总线(Inter Integrated Circuit, I2C)通信数据和输入输出信号(General-Purpose Input/Output,GPIO)数据透传(图2)[4]。
图2 系统接口
信息娱乐系统和功放系统间音频链路的通信建立在A2B通道上。首先信息娱乐控制器侧通过I2C总线控制A2B Master 设备,再通过A2B 总线透传I2C 通信来控制A2B Slave设备[5],主从设备建立连接后,2个控制器的通信即被打通。
I2C 总线数据信号线(Serial Data,SDA)和数据控制线(Serial Clock Line, SCL)信号线同时处于高电平时,总线属于空闲状态[6]。主机在SCL为高电平时,将SDA从高电平转换为低电平,从而发出具有开始条件的传输开始信号[7]。主机完成与从机通信后,通过在SCL 为高电平时将SDA 从低电平转换为高电平来发出停止条件,然后总线空闲以进行下一次传输。
接收方在应答时钟脉冲期间拉低SDA,在时钟脉冲高电平期间,SDA线稳定在低电平。当主设备向从设备发送数据时,由于从设备是接收方,因此从设备会生成确认位。当从设备发送到主设备时,主设备会生成确认位,因为主设备是接收方[8]。
A2B Master 和A2B Slave 数据传输过程中,I2C 写数据传输格式如图3 所示[9]。I2C 读数据传输格式如图4所示。
图3 I2C写数据传输格式[9]
图4 I2C读数据传输格式
1.3.1 音频通路分配
信息娱乐控制器作为主节点通过A2B 总线连接整车功放。A2B 总线可传输上下行多路数字音频信号,其中下行通道方向为信息娱乐控制器到功放,称为A2B 播放主通道[10];上行通道方向为功放到信息娱乐控制器,称为回声消除,参考音频通道。
A2B 播放主通道为功放发声的唯一数据通道,8路音频详细分配如表1所示。
表1 音频通路声道分配
A2B参考音频通道是由于语音识别的要求,由功放将其末端输出音频截流,发回信息娱乐控制器进行回声消除而设计的通道,信息娱乐控制器将8路音频输入给功放,功放将音频处理,生成2 路参考音(左、右),反馈给娱乐主机,主机将参考音发送给回声消除模块[11],如表2所示。
表2 参考音通路声道分配[11]
信息娱乐系统支持4 路模拟信号麦克风,实现紧急救援电话(E Call)、一键电话救援(B Call)、人工座席电话(I Call)。麦克风分别安装于车厢前左、前右、后左、后右,并支持4 音区的麦克风拾音,以实现4 音区定位。信息娱乐控制器连接此4路模拟信号麦克风,并将模拟信号通过编解码器(Codec)芯片转换为数字信号,传输到主芯片进行后续语音识别或蓝牙电话功能输入[12]。当E Call、B Call、I Call激活时,主驾驶位麦克风用于通话,以支持E Call、B Call、I Call的上行数据传输。而E Call、B Call、I Call的下行数据则以模拟信号的方式将音频从无线网关(Telematics Box, T-Box)传输到信息娱乐控制器,并由Codec芯片进行模拟至数字信号转换后,与麦克风通路合并传至主芯片,最后由主芯片将此数据透传到A2B播放主通道的电话声道,最终由功放发出E Call、B Call、I Call下行声音 。
蓝牙电话通道包含2路音频信号。
一路为蓝牙电话下行信号,即从蓝牙芯片传输至主芯片,再由主芯片的软件模块传送至A2B播放主通道的电话声道进行发声。
另一路为蓝牙电话的上行信号,即从麦克风输入,经过蓝牙软件的回声消除算法处理或通过数字信号处理(Digital Signal Processing,DSP),由主芯片回传给蓝牙芯片,最终到远端手机发声。
蓝牙音乐通道则为单向通道,信息娱乐系统作接收端时,由蓝牙芯片经过串行口传输至主芯片,并由主芯片传送至A2B 播放主通道的多媒体声道进行发声。信息娱乐系统作发送端时,主芯片播放的音频通过串口传输至蓝牙芯片,经蓝牙音频传输(Advanced Audio Distribution Profile,A2DP)通道到蓝牙耳机或音箱播放[14]。
1.3.2 音频流仲裁
车载信息娱乐系统内音频流众多,除部分音频流存在混合播放需求外,大多数音频流在播出前,均需在系统内完成声音仲裁工作,车内音频流仲裁逻辑如图5所示。
图5 车内音频流仲裁
仪表音频流:根据汽车所处的状态,仪表可能有不同的声音播放需求。通过仪表内置的仲裁模块,决定当前可以播放的音频类型。分为仪表报警音和仪表提示音。这些音源通过仪表仲裁后转交给中控进行2次仲裁,决定仪表音源是否可以通过汽车扬声器播放。
中控音频流:中控应用根据用户输入可以有不同的音源播放需要。音源包括电话音、导航音、语音识别音、多媒体播放音和收音机播放音。这些音源在中控仲裁下决定是否可以通过汽车扬声器播放。
仲裁结果如果涉及到Slot 7和8时,中控需要发送对应的总线(Controller Area Network,CAN)信号值。
1.3.3 混音策略
在车载信息娱乐系统中,无混合播放的声音可直接通过仲裁模块抢夺播放权限。但在车载用户实际使用过程中,存在多种声音同时输出的场景,因此在设计车载信息娱乐系统音频架构时,要考虑声音混音需求,对多路系统声音并发场景的混音要求及音量输出限制进行设定。
根据使用场景不同,音源分为驾驶安全类、通讯类、语音类、多媒体类和系统提示音。各主机厂对音源优先级定义主要为:驾驶安全类>通讯类>语音类>媒体类>系统提示音。音频策略仲裁原则是高优先级抢占低优先级,同优先级后者中断前者,通讯除外,后者不能中断前者。
多个音源混音规则:后发音源与之前已发音源两两混音,混音音量的基础是混音前的音量;多重混音增益降低时,只降低一次或执行最大的增益降低;如果多重混音存在不同的混音结果,按照屏蔽声音>增益降低>原有音量的原则执行。
安全类:警告播报音(Safety Alert)、仪表提示音(Chime)通常是一些简短的音源,如严重故障播报和驾驶辅助提示音。安全类声音优先级最高,不能被任何类型声音中断,除了同类型的后事件声音。
通讯类:E Call、B Call、I Call、蓝牙电话(BTCall)、来电铃声(Ring Tone)、网络电话(Voice over Internet Protocol,VOIP)为通讯类声音,在驾驶场景下优先级低于安全类,但对用户来说可能是很重要的信息,这类声音需要用户持续关注并做出反馈,不能被随意打断,采取跟安全播报混音的策略。
语音类:语音(Voice Recognition,VR)、导航(Navigation, Navi)和消息通知提示音(Notification)为语音类,语音类声音优先级低于安全类和通讯类,会被前2者抢占。语音类声音通常都是即时信息且信息密度高,系统在解码这些声音时,非常消耗资源,所以同时只能播放一路声音。
多媒体类:收音机调频电波(Frequency Modulation, FM)、收音机调幅电波(Amplitude Modulation,AM)、U 盘音乐(USB-Music)、蓝牙音乐(BT-Music)、在线音乐(Online Music)、在线电台(Online Radio)和在线视频(Online Video)为多媒体类,多媒体类声音和视频虽然优先级较低,信息重要程度不是很高,但如果经常被打断,断断续续地播放,用户体验不好,适合作为背景音播放。
系统提示类:系统(System)类声音短促而有节奏,传递固定的信息,可以跟所有其它类型包括自身混音播出。
1.3.4 增益降低策略
多音源在进行混音时,为了提升用户体验,需要系统针对不同音源音量值进行设计,实现混音时的音源增益降低。
增益降低策略:假设A、B为2个不同音源,A为非增益降低音源,B为增益降低音源。当A音源和B音源的音量值设置符合如下条件时,执行增益降低策略。
(1)当A或B音量值设置为0级时,则视为该音源静音,不执行增益降低策略;当A和B中音量值不为0级的音源正常按照所设置音量值发声。
(2)当A与B音量值都不为0级时,则执行增益降低策略。B 降到A 音量的60%,如果音源B 当前音量小于固定音量,则不执行降音。
当B执行完成增益降低策略后,立即恢复到增益降低前的音量。同时B 在执行增益降低或恢复过程中,要有渐入渐出处理以保证声音变化不突兀。
1.3.5 焦点抢占策略
Android 系统只有一个录音声卡设备,且不支持多个App打开同一个录音声卡设备,因此多个App使用录音功能时存在互相竞争的关系,为了管理这种竞争关系引入了录音用的焦点。因此在车载信息娱乐系统中必须遵守声音焦点的规则进行声音的播放处理。录音用的焦点同样遵循声音焦点的使用规则[15]。
麦克(MIC)焦点管理规则,应用必须遵守以下原则:
(1)申请并获得声音焦点后才可以开始录音;
(2)App被通知失去声音焦点后,停止录音;
(3)App 退出时释放(Abandon)掉自己申请的声音焦点。
MIC 在录音前也必须申请录音的声音焦点。同样App 退出或者不再使用声音焦点时要释放声音焦点。
声音焦点变更通知:App 需要在失去焦点时暂停或停止播放,如果是录音情况,要停止录音。在重新获得焦点时可以选择继续播放或者录音。
本文提出了一种基于用户体验的车载信息娱乐系统音频架构设计,可适用于车载信息娱乐系统的不同使用场景,实现多音源混合播放,通过增益降低策略灵活设计混音时音源状态,提升用户体验。当前该设计已经应用在红旗H9、E-HS9车型上,未来将分别从座舱内声音的功能性和娱乐性两方面继续深入研究,聚焦声音与场景匹配度、悦耳性以及车型的定位,进一步发挥汽车系统的智能化优势。