张育瑜,赵 磊 ,郭文彬*,彭 涛 ,王文博
(1.北京邮电大学 信息与通信工程学院,北京 100876;2.通信网信息传输与分发技术重点实验室,河北 石家庄 050000)
无线电监测是一个讨论多年的热门话题,它能更有效地实现可用频谱资源的监测,增强频谱资源的管理,具有很强的应用价值。盲信号识别是无线电监测中一项重要的识别技术,它负责从一段频谱中提取出信号信息,在缺少足够的先验信息前提下,及时发现违法、异常和干扰信号,净化频谱资源环境,同时,它能够秩序化地利用空闲频段,实现频谱资源的高效利用。
大数据背景下的无线电监测需要考虑诸多问题[1]。一方面,基于网格化节点[2-4]监测产生的海量原始数据需要进行数据分析[5];另一方面,对于数据挖掘出的结果需要进行分布式存储[6-7]。文献[4]给出了海量数据背景下无线电监测的功能实现、平台构建和结果存储的一种方案,该方案缺乏对原始数据的全面分析,也没有结合诸多成熟的识别技术挖掘出完备的知识单元,使得存储数据含有大量冗余信息,不能很好地解决无线电监测所面临的问题。西华大学借助产学研联合实验室开展的无线电智能化监管研究探索了共享型无线电监测技术融合体制[3],一定程度上实现了智能化无线电监测平台,但还是缺乏对无线电监测数据的深入分析以及对原始数据的提纯。针对大数据背景的无线电监测数据处理需要能够结合相应识别算法对原始数据进行深度挖掘,提纯出有价值的知识信息替代原始数据[8],并对知识信息进行结构化梳理、规范化存储,进而实现机器智能化认知识别结果。结构化知识是大数据处理的高效方法[9],知识图谱作为一种结构化知识的架构,被广泛应用在涉及大数据处理的各个领域[10-12],取得了不错的成果。
结构化知识是核心[13],识别算法是关键。本文一方面在无线电监测平台上引入知识图谱架构,并结合ITU无线电监测内容[14],全面梳理盲信号识别的知识,构建知识间的拓扑结构,规范存储模板;另一方面,重点介绍了无线电监测中的盲信号识别流程,结合改善多种盲信号识别算法进行数据分析与挖掘,利用得到的知识实体对构建的盲信号知识模板进行知识填充,最终利用工程技术实现智能可视化无线电监测平台。第2节介绍了基于知识图谱架构的盲信号识别;第3节进行实验结果分析;第4节给出结论。
无线电业务的发展以及监测设备的增多,使得盲信号识别呈现出大数据的特点。盲信号实时监测平台所依赖的原始数据主要有以下3点特征[13]。
① 基于时空频的多域特性。一段频谱数据的标签信息包括监测时间、监测地点和监测频段以及监测设备等。智能化的监测平台需要能够从这3个维度展示识别结果。
② 基于多平台的同构异构数据类型。由于监测设备多样化,接入监测平台的数据类型复杂多样。这其中不仅包含不同设备对同一地区同一频段同一时间的原始数据,还包括除了频谱扫描数据之外的IQ数据、AD采样数据以及音频、测向定位数据等[15]。
③ 数据存在冗余,不利于批量存储。原始数据不能作为知识实体被机器所识别,无法实现智能化平台,需要结合相关算法,抽取出有用的知识实体进行存储。
针对上述特征,通过知识图谱的构建,赋予原始数据时空频属性、节点属性和数据类型属性等,对数据进行标识;利用频谱感知算法、信号识别算法挖掘提取有用知识实体。
盲信号知识图谱的核心在于形成结构化的知识,并采用高效的方式进行存储。从构建知识图谱的流程[12]以及知识库最终的呈现形态2个角度进行阐述。图1展示了知识图谱的构建流程。
原始数据主要分为结构化数据和非结构化数据2部分。结构化数据中的历史模板可以作为知识抽取的先验信息。知识抽取主要从非结构化数据中提取知识并生成知识实体,抽取出的知识需要与结构化数据知识进行知识融合,融合过程中利用时间、空间、频段和节点ID生成知识的唯一性标签,并对重叠实体部分进行消歧处理,初步形成盲信号知识的拓扑结构,并利用知识计算生成新知识,与原知识拓扑结构融合形成完备的知识图谱并存储至知识库,通过调度结构化知识库的数据进行智能化平台展示。
图1 盲信号识别知识图谱构建流程Fig.1 Blind signal recognition knowledge map construction flow chart
知识库是知识图谱的核心成果,它包含2个要点:模式层与数据层。模式层定义知识实体内的属性、关系,实体间的层级结构,盲信号识别知识库的模式层定义了知识入口类、背景知识类、实时信息类和单个信号类4大类;数据层则是模式层的具体实现,是数据呈现的一种方案。图2给出了盲信号识别知识库的模式层结构。
图2 盲信号识别知识库模式层Fig.2 Blind signal recognition knowledge base pattern layer
知识入口类包含3个知识单元:时间、空间和频带,它是所有知识的共有属性。时间指要检索的起始时间,空间指要监测的不同地理位置,频带指要检索的频段范围。知识入口类中的属性是每个知识实体的标签,将这些属性加上监测节点ID,生成唯一性标识ID。背景知识类包含3个子类:注册信息类、硬件信息类和信号模板类,它可以为知识挖掘和推理提供丰富的先验信息。实时信息类包含背景噪声功率、电磁波功率、频谱图和信号个数等7个属性,实时信息类用于收集实时频段中包含的知识单元。单个信号类包含3个子类:静态信息类、实时变化类和知识推理类,单个信号类是对单个信号详细属性的归类。图中的类定义了所有知识实体的共有属性,每个实体对象会存在属性差异,类之间的箭头显示了类的层级结构,对象指向的箭头显示该对象的属性,属性有实体属性和类属性2种。
原始数据的频谱是多信号共存的,不能直接用于调制信号识别,需要将需要识别的每个信号分离出来,再逐一识别。文献[16]提出一种基于迭代检测的宽带频谱自适应感知算法,它能够根据每个频点的统计平均值设置判决门限,频点判决结果能够更准确。
算法思路:根据大数定理,当统计次数足够多时,每个频点的幅值大小服从高斯分布,据此可统计每个频点的M次的平均值作为判决量,再预设检测率与虚警率,得到每个频点的判决门限与该频点平均信噪比以及频段底噪功率的关系,通过迭代计算得到频段底噪功率进而得到每个频点的判决门限。
考虑到M越大检测率越高,但M太大会影响感知时间以及算法的时间复杂度,原算法再对M进行迭代计算找到合适的值。框架中实时数据以流的方式存在,只需要设立全局变量存储每次数据叠加的结果,就能达到不断增大M的效果,随着监测时间的增长,识别结果就会越准确。故在将本算法应用于盲信号识别框架中,只迭代计算判决门限,大大减少了算法时间复杂度。图3展示了算法流程。
图3 基于迭代检测的宽带频谱感知算法Fig.3 Wideband spectrum sensing algorithm based on iterative detection
先初始化合适的M与判决门限,得到噪声功率,计算出判决量:
(1)
式中,n=0,1,2,...,N-1表示N个频点;Ynm为第n个频点功率值大小。根据信号底噪、每个频点信噪比以及设定的检测率、虚警率进行判决,并与上次判决结果进行比较,迭代计算直至满足要求,一方面输出结果,另一方面继续增加M,重新计算。通过改善基于迭代检测的宽带频谱自适应感知算法,识别出频段中每个信号的带宽信息、背景噪声功率、信号个数、频段使用率以及空闲频段信息。
由上节算法能够理想滤波出单个信号进行调试模式识别。模拟信号与数字信号的序列统计特征值存在较大差异,通过非线性变换法,二次小波变换法都能很好地区分开来。考虑到工程的时效性,本框架采用非线性变换法进行处理。设信号序列s(t),t=1,2,...,N。非线性变换得到Q(i)序列:
Q(i)=s2(i)-s(i-1)s(i+1)。
(2)
再对Q(i)进行差分处理得到P(i):
P(i)=Q(i+1)-Q(i)。
(3)
设置合适的门限,通过计算P(i)的方差即可进行模数判决。
识别的模拟信号有AM,DSB,FM,CW,LSB,USB六种类型。采用文献[20]中所提出的3个特征参数进行分类,利用包络变化特性特征值gmax区分出AM,DSB信号;利用谱对称性特征参数P区分出LSB,USB信号;利用序列点瞬时幅度统计特性sdp区分出FM,CW信号。
第1个特征参数gmax为:
gmax=max|FFT(Acn(i))|2,
(4)
式中,Acn(i)是该段信号第i(i=1,2,...,N)个归一中心化的瞬时幅度;A(i)为该段信号第i(i=1,2,...,N)个瞬时幅度。
第2个特征参数P为:
(5)
式中,X(i)序列为采样序列X的FFT;fcn+1代表载波所对应的点数。
第3个特征参数sdp为:
(6)
式中,An(i)>a表示信号归一化幅度An(i)大于门限a,即所谓的强信号;C为强信号的个数;fNL(i)为瞬时非线性相位。
在实验中,使用本文提出的知识图谱架构盲信号识别系统对实时环境进行频谱监测,搭建框架语言采用C++与QT结合的方式,后台存储部分采用Redis数据库集群。通过结构化知识库进行高效的数据交互操作,实现智能化的无线电频谱监测平台[17]。本系统采用如图4所示的系统架构[18]。
图4 智能监测平台架构Fig.4 Intelligent monitoring platform architecture
后端部分包括数据部分、服务集群、服务管理中心以及反向代理集群。数据部分包括数据库集群、传感节点网络以及传感节点管理中心;服务集群主要包括用户服务、产品服务两大类;服务管理中心集群负责监控管理服务调度的负载均衡,反向代理服务器用于设立网关和服务管理中心的负载均衡,从而实现高可用的无线电监测管理平台[19]。
实验数据的采集节点使用安捷伦公司生产的RF Sensor,覆盖30 MHz~6 GHz的带宽,可调数字中频带宽为20 MHz,支持输出I/Q(同相正交)时间序列和快速傅里叶变换(FFT)数据流,同时提供远程控制的可编程应用程序接口(API)[20]。所监测频段每间隔2 s刷新一次,每次返回10 000个实时数据点,实时分析结果每隔30 s刷新一次。实验检测地点为北京市海淀区北京邮电大学新科研楼6楼,检测频段为90~110 MHz频段,检测次数为100次。90~110 MHz授权合法信号的信息一部分来自于北京广播网,另一部分来自收音机实地实测数据。
图5为90~110 MHz频段的部分电台监测100次,得到统计的调制类型识别结果,其中,后6列数字表示识别成相应调制格式的次数。
中心频率/MHz电台名称AMFMDSBCWLSBUSB90.5中国国际广播电台环球资讯1189000091.5中国国际广播电台EasvFM196200192.3外语广播097012095.4故事广播193000698.2青年广播098200099.6中国交通广播0990100100.6新闻广播01000000101.8都市之声(四套)0970201102.5体育广播01000000
该频段的信号调制类型为FM,所有信号识别出FM信号的正确率为96.56%,达到了较高的识别效果。识别成AM的概率为1.33%,识别成其他信号占2.11%。上述识别的方式需要首先经过盲信号宽带频段的预处理,理想滤波出相应频段的单个信号,所以识别效果不仅取决于调制识别算法,也取决于频谱感知算法对信号带宽、中心频率等的识别精度。实验分析中,对中心频率的识别结果也进行了评估,达到了优良的识别准度,对中心频率为90.5 MHz的信号进行100次测量,得到平均值为90.503 MHz,方差为0.16。
利用构建的知识库,搭建出了一套智能化的可视化监测系统,部分可视化界面如图6所示:图6(a)中通过该界面能够进入单个信号的实时监测。图6(b)包括01数据流以及解码内容。图6(c)包括信号个数、噪声功率、电磁波功率、频段使用率和空闲频段等实时信息。图6(d)包括频道占用度、码元速率、调制方式和干扰类型。图6(e)包括背景噪声功率、电磁波功率、频段使用率和空闲频段。
图6 智能可视化平台Fig.6 Intelligent visualization platform
本文提出了大数据背景下利用知识库构建智能化频谱监测与管理平台的新思路,梳理并结构化了盲信号识别过程中的知识实体,并结合实际,利用相关算法提取了这些知识。实验结果验证了相关算法的准确性,可视化系统也进一步验证了框架的智能化特性,达到了优良的效果。