李圣普,王小辉
基于高频音讯的信息推广系统研究
李圣普,王小辉
摘 要:提出利用人耳听觉特性以声音为传输媒介,在高频中埋藏要传送的资讯,并实际应用在行动装置上,让使用者可以使用扬声器循环播放声音讯号,达到消费者靠近店家即可收到该店家的消费资讯的目的。在传送端使用18kHz 左右的音频,配合RS code、preamble encoder和PSK传递信号,并在接收端使用 preamble detection、PLL、RS decoder 解出讯号,让整个系统最后实现在iOS装置上,实验结果证实系统可以成功传递商家信息。
关键词:高频;声音信号;商家信息;广播系统
平顶山,467002
王小辉(1980-),女(汉族),河南滑县人,平顶山学院,计算机科学与技术学院,讲师,硕士,研究方向:人工智能及应用,平顶山,467002
随着智能机的普及,如何能在消费场所感知消费者的位置是否位于商家附近,进而提供商家最新消费信息至消费者手机上的方法,是现今热门的研究点。如图1所示:
图1 情景示意图
情境假设,消费者的智能设备安装由卖场提供的特定应用,当靠近一个商家时,行动装置可以立刻收到该商家的消费资讯。
因为使用一般的扬声设备就可以将信号推播,所以此系统可利用一般商家已有的扬声设备,传送人耳不易察觉的高频音讯讯号,并在其上承载商家特定的消费信息,消费者利用智能终端上已有的麦克风接收与解码此高频音讯讯号。最后在手机上即时显示消费信息通知,达到为此商家即时传递特定消费信息的目的。
以下进一步说明完成此高频音讯行动资讯广播系统,所需考虑的各种系统规格。
1.1 频带选择
为能利用人耳不易察觉的音讯讯号传递消费资讯,文中将调查人耳的听觉特性与背景环境噪音分布情形。首先综合各听觉研究文献的结论,找出人耳对各种频率的频率响应。基本上人耳最容易接受的范围在2~4 kHz左右,而在16 KHz以上,人耳的敏感度就急剧降低。 然后到卖场用频谱分析仪实际测量环境杂讯,发现大部份的卖场噪音皆分布在低频带部分,尤其是与人耳最易感知的2~4 kHz重叠。因此,根据上述调查结果,进一步以实际音讯讯号与环境杂讯,进行不同频带的人耳听觉测试。最后选择以16~20 kHz 的频带,作为主要音讯通讯讯号的载波频带。
1.2 封包方式
考虑连续传送封包,必须在每个封包的开头加上一段preamble,如图2所示:
图2 preamble 示意图
如此接收端可以依据该讯号作时序同步。
1.3调变方式选择
调变系统采用PSK作为基本架构,其中考虑PSK是因为它的效能通常比amplitude shift keying (ASK)和 frequency shift keying (FSK)好。佐证资料PSK、ASK 与 FSK 编码方式与其效能比较,如图3所示:
图3 调变系统比较图
在文中,依据上述设计,提出一个基于高频音讯通讯系统的特定消费信息传递系统。图4为这套系统的传送端架构。以下将逐一介绍此系统重点的方块图的功能和原理。
2.1 传送端
一开始会先把所想传送的商家资讯(网址),如
http://getlife.com.cn/mall/index,转换成 ASCII 码,由二进位码组成如图4所示:
图4 传送端架构
2.1.1 RS code
错误更正码可用来保护数位资料,主要目的就是在最小成本频宽内降低错误率。在已知的错误更正码中,RS (Reed-Solomon) code 对突发性的错误有很强的更正能力,主要功用是用来纠正随机杂讯(random noise)所造成的错误,此种错误的发生通常是零散的。虽然 RS code 能够纠错 t个未知错误(error),不过需要牺牲2t个冗余资料(redundant data)。另外,设定每笔资料(symbol)的位元数为 m,因此m 一组 code word 的长度(包括冗余资料)最多为 n=2 -1。
2.1.2 Preamble
Preamble是具有与白杂讯类似的自相关性质的0和1所构成的编码序列,此序列出现0 与1的机率各为50%,在所要传的资料开头加上 PN code,可让接收端知道资料的起始点。选用PN code 作为 preamble 的原因是它与所传的资料最不相像,这样接收端在搜寻头部时就不会出现错误 。
PSK 调变与 Root raised cosine filter
PSK调变选择使用QPSK,理想的QPSK讯号表示如公式(1):
需要选择一个波形来传送symbol,最理想的波形是raised cosine[3],第一可限制频宽,因为可以利用的频宽有限,使用 raised cosine 作为传送波型的频宽公式如公式(2):这里RS为符号传送速率,α为降滚系数,介于0到1之间,所以,可以借助这两个参数的调整来决定频宽大小。第二可对抗符号间干扰(ISI),将符号的最高点与第二个符号零点重叠,这样一来干扰可以减到最小。不同的α所描绘出的raised cosine的时域与频域图,如图5、图6所示:
图5 raised cosine 时域波形
图6 raised cosine 频域波形
2.2 接收端
接收端的架构图如图7所示:
图7 接收端架构
将把收到的Audio讯号经过PSK解调,preamble侦测同步,再做PLL同步频率与相位,最后经过 RS decoder 解出所传的商家资讯,如:http://getlife.com.cn/mall/index。以下逐一介绍各个模块功能与原理。
2.2.1 Preamble detector
因为可以事先知道 preamble 是什么,所以可以事先在接收端把 preamble 波形记录下来,侦测 preamble的起始点有两种方法,一种是single sliding window ,选定一个视窗的长度,对视窗内的取样点做自相关运算,然后藉由mn的大小判断是否达到门槛值,如公式(3):
这里n是资料的bin,k=0到L-1是preamble资料的长度。
判断mn是否有达到订定的门槛值,必须先知道杂讯的能量,而杂讯能量无法事先得知,所以用另一种侦测preamble 的方法,double sliding window,示意图如图8所示:
图8 double sliding window
使用这个方法不再是判断门槛值,而是直接取峰值。
2.2.2 PLL
讯号在接收端解调时,会碰到讯号的频率与相位与接收端不一致的问题,这里参考了 Feed-forward Compensation Algorithm[4]的方法,这个方法好处是完全可以使用 DSP 的方式实现出来,流程如图9所示:
图9 频率与相位补偿流程图
R(t)为接收端收到的讯号,可以表示成公式(4):
θ为相位差。在这里将低通滤波器设计成 raised cosine filter,一方面是此滤波器有低通滤波器的效果,一方面是与传送端做匹配。讯号经过滤波器可得到 I、Q 两个 channel,如公式(5)、(6):
补偿矩阵运算式如公式(7):
接下来将x1和x2,经过以下的运算得到 error function,如公式(10):
到这里就可以发现,要让x1( t ),x2( t )近似于I( t )与Q( t ),必须使e( t )的值接近零,也就是让θ补偿相位接近讯号的相位差,再来利用 loop filter 来调整的值。
3.1 iOS 程式架构及流程
APP 程式架构上是使用 iOS SDK 里的 audio unit 的framework 来实现录放音的动作,理由是audio unit是iOS里最底层的录放音单元,较容易存取 raw data,这对于需经常使用dsp来说,比较容易操作与实现。
虽然iOS的行动装置有支援传统的C语言,但如果使用传统的C语言来实现DSP运算,将会大大增加运算时间,如convolution的运算,经过测试使用传统C语言来撰写,将一个 4096长度的阵列与257 长度阵列做摺积运算,花费时间大约要五秒,而使用 iOS 提供的 vdsp系列的运算函式,运算时间极快,而传送端与接收端的程式计算时间分别只要一到两秒。系统实作流程图如图10所示:
3.2载波与频宽
频带的选择是依据讯号经由频谱分析仪的能量来决定,因行动装置的扬声器与麦克风的取样频率最高可达44.1kHz,而根据调查结果人对16kHz以上的audio的敏感度就急遽下降,19kHz以上的讯号因装置的频率响应能量有所衰减,所以将载波定在 18kHz。因所要传送的符号为 raised cosine,讯号的频宽可以依照公式(1)来决定,符号传送速率RS选择32/44100秒,也就是在取样频率 44.1kHz 的情况下,每32 个 bin 传送一次符号,α选择 0.5,所以讯号所占频宽大约等于 1033Hz。
3.3 资料与传送速率设定
要决定装置录放音的 buffer 大小,选择4096bit,如果使用raised cosine 做为传送波形,必须先将资料 upsample,upsample 多少取决于RS,所以一个buffer 可容纳的资料为 4096/32=128bit,而是使用QPSK 调变方式,可传送的资料就可达到 256bit。
因为在实际应用上,要传送的资讯只有一段网址或资料,依据ASCII的标准,一个字元是由8个bit所编码。preamble的大小选择 32bit,如果再加上错误更正码、保护码等,足以将一段完整的网址容纳在一个buffer里。
3.4实现结果
先测试不加保护码的情况,利用行动装置的录放音设备实际播放接收,并读取行动装置存下来的资料来验证算法的正确性,传送资料为http://getlife.com.cn/mall/index,图11
为行动装置解调完毕,经过相位补偿的星座图,依照星座图的结果,可以完整解出 http://getlife.com.cn/mall/index这段网址,如图11所示:
图11 经补偿星座图
3.5 实验环境
使用 iPhone 做为传送端,iPad 做为接收端的模拟结果,在iPhone上设定的载波频率是18kHz,在iPad上可以看到资料的载波在18Khz,资料的频宽大约2kHz,接收端运算与解调结果,在 iPad 上可以看到传送的网址及网页。
在文中提出了一个用高频音频讯号的行动资讯广播系
统,整个系统并实际实现在iOS装置上,且从实验结果来看,此系统确实可以成功传递商家信息。并让顾客可以用手机将信息完整解读出来。未来本系统将再实行RS 保护码,使资料量可以传送更多,可传送的距离更远,错误率更低。
参考文献
[1] Anil Madhavapeddy, David Scott, Alastair Tse,and Richard Sharp Audio Networking:The Forgotten Wireless Technology 2005 IEEE[C].
[2] Chuan Li, David A. Hutchins, and Roger J. Green Short-Range Ultrasonic Communications in Air Using Quadrature Modulation IEEE Transactions on Ultrasonics[C], Ferroelectrics, and Frequency Control, vol. 56, no. 10, October 2009.
[3] http://en.wikipedia.org/wiki/Raised-cosine_filter.
[4] Yinsheng LIU,Cheng TAO,Feedback compensation algorithm for BPSK/QPSK carrier synchronization[C],RADIOENGINEERING,VOL 19, NO 1,APRIL 2010.
Business Information Spreading System Based on High Frequency Sound Signal
Li Shengpu, Wang Xiaohui
(College of Computer Science and Technology, Pingdingshan University, Pingdingshan 467002, China)
Abstract:The paper proposes a new business information spreading system based on high frequency sound signal. Researching the sound transmission medium and the human ear hearing characteristics, the new business information spreading system hides spreading information in high frequency sound signal and applies on mobile devices to constantly broadcast voice signals by loudspeaker for stores. The consumers can receive consumption information of the stores if they are near. The sender uses audio around 18 KHZ, RS code, preamble encoder and PSK to pass information signal, and the receiving end uses the preamble detection, PLL and the RS to decoder signal. The whole system is finally implemented in the IOS device. The experimental results show that the system can transfer business information successfully.
Key words:High Frequency; Sound Signal; Business Information; Broadcast System
收稿日期:(2015.06.05)
作者简介:李圣普(1983-),男(汉族),河南封丘县人,平顶山学院,计算机科学与技术学院,讲师,硕士, 研究方向:无线传感器网络及应用,
基金项目:河南省重点科技攻关项目(142102210225);平顶山学院青年基金资助项目(PXY-QNJJ-2014007)
文章编号:1007-757X(2016)01-0030-03
中图分类号:TP391
文献标志码:A