刘雨恬,何瑞珠
(1.中国卫星海上测控部,江苏 江阴 214431;2.中国电子科技集团公司第七研究所,广东 广州 510310)
近年来,由于各种不同用途的电子系统广泛使用,使得频谱资源日益紧张,电磁环境更趋复杂。纷繁庞杂、海量的感知数据已成为频谱管理的重要特征和挑战之一。
对于这些多源频谱感知数据的使用,存在一个重要的问题:电磁频谱数据来源于部署在空间内不同位置的各种不同频谱感知系统或用频系统,所采集的频谱感知数据具有离散分布和时变特性,其中包含大量的历史数据和实时数据,这些数据往往是相互叠加或彼此冲突的,数据质量和价值存在较大差异。来自各类传感器的异构感知数据存在严重的壁垒尚未破除,数据质量不一,各部门、各系统提供的数据交错、重叠、分布不均匀,从而形成数据漏洞,最终成为影响频谱管控安全和频谱保障效能达成的重大隐患。因此,在当前复杂的电磁环境条件下,正确地采集各类传感器数据,正确地融合处理所获得的感知数据,快速形成各种带有具体指向性的频谱感知信息融合产品,提供给频谱用户使用,是影响电磁频谱管控效率的重要因素,频谱感知数据质量评价成为其中重要的一环[1]。
本文所研究的频谱感知数据包括三种类型的数据:一是直接由电磁环境传感器对射频无线电信号进行测量后获取的数据,如电磁环境数据等;二是经过电磁环境传感器处理后生成的数据,如情报数据等;三是为实现对频谱感知数据的处理所需要的相关基础装备(目标、任务等)的参数信息,如设备工作参数、台站部署采纳数等。
数据质量的概念可定义如下:数据质量=(数据内容质量,数据的符号表示质量,用户效用质量)。其中,数据内容质量是指感知数据反映实体的真实程度;数据的符号表示质量描述数据符号所能表达数据内容的程度,如完整性、精确性、及时性、连续性等;用户效用质量是指数据满足用户需求的程度。
对于频谱感知数据来说,需要建立各种表示数据内容、分类、格式等的规范和标准,因此,数据的符号表示质量主要体现在数据的可视化程度方面。于是,数据质量的定义也可以改写为频谱感知数据质量=(数据的真实性,数据的可用性,数据的可视性)。其中,数据的真实性是指数据反映电磁信号特征的真实程度,是从理论和认知角度理解数据质量;数据的可用性是指感知数据对频谱需求的满足程度;数据的可视性是指实现数据共享和一致理解的基础,主要表现在各种传感器采集数据描述的异性,是态势一致应用的基础。
(1)数据规范(Data Specification):对数据标准、数据模型、业务规则、元数据和参考数据进行有关存在性、完整性、质量及归档的测量标准。
(2)数据完整性准则(Data Integrity Fundamentals):对数据进行有关存在性、有效性、结构、内容及其他基本数据特征的测量标准。
(3)重复(Duplication):对存在于系统内或系统间的特定字段、记录或数据集意外重复的测量标准。
(4)准确性(Accuracy):对数据内容正确性进行测量的标准。
(5)一致性和同步(Consistency and Synchronization):对各种不同的数据仓库、应用和系统中所存储或使用的信息等价程度的测量,以及使数据等价处理流程的测量标准。
(6)及时性和可用性(Timeliness and Availability):在预期时段内数据对特定应用的及时程度和可用程度的测量标准。
(7)易用性和可维护性(Ease of Use and Maintainability):对数据可被访问和使用的程度,以及数据能被更新、维护和管理程度的测量标准。
(8)数据覆盖(Data Coverage):相对于数据总体或全体相关对象数据的可用性和全面性的测量标准。
(9)表达质量(Presentation Quality):如何进行有效信息表达以及如何从用户中收集信息的测量标准。
(10)可理解性、相关性和可信度(Perception,Relevance and Trust):数据质量的可理解性和数据质量中执行度的测量标准,以及对业务所需数据的重要性、实用性及相关性的测量标准。
(11)数据衰变(Data Decay):对数据负面变化率的测量标准。
(12)效用性(Transactability):数据产生期望业务交易或结果程度的测量标准。
在评估数据质量过程中,需先选取合适的数据质量维度,再针对每个所选维度,制定评估方案,选择合适的评估手段进行测量,最后合并和分析所有质量评估结果[2]。
频谱数据质量评价模型主要包含以下四个模块:数据分析处理、效益评估指标量化、专家评价和综合评估,如图1所示。
图1 频谱数据质量评价模型组成
(1)数据分析处理。进行频谱资源使用效益分析之前需要对频谱资源数据进行数据分析处理,主要包括数据检验和数据标准化的处理。
(2)评价指标量化处理。针对建立的频谱数据质量评价指标进行量化处理,主要选取与频谱数据质量密切相关的参数,计算具体指标数值。
(3)专家评价。在频谱数据质量确定过程中可结合专家评价方法。专家评价流程:首先制定评价指标及打分规则,说明数据测试或试验的条件,并成立领域专家组;专家按评分标准对各指标进行打分,再进行主、客观权重的组合赋权,避免专家主观随意性对评分结果的影响,也克服样本数据客观信息缺失的情况,使得权重结果更加合理有效;最后完成评估结果的确定与分析。专家评价修订后的指标参数作为综合评估的计算依据。
(4)综合评估。建立综合评估分级管理规则,对频谱数据质量评价进行等级划分,得出评价结果。
首先将决策问题看作受多种因素影响的大系统,这些相互关联、相互制约的因素可以按照它们之间的隶属关系排成从高到低的若干层次,然后对各因素两两比较重要性,再利用数学方法对各因素层层排序,最后依据排序结果进行决策。根据频谱数据质量综合评价实际,使用基于一致性排序原理的方法进行指标权重值的计算。
针对评估指标重要性进行加权的指标聚合称为基于性能的指标聚合,其主要有线性加权综合法、非线性加权综合法、增益线性加权综合法、理想点法等成熟算法。结合频谱数据质量评价问题实际,频谱数据质量评价采用线性加权综合法和非线性加权综合法两种指标聚合方式。
综合考虑各项指标在数据质量评估中的作用,可以建立频谱感知数据质量的2级指标体系及权重分配,如图2所示。
图2 频谱数据质量评价指标聚合示意图
基于以上频谱数据质量评价指标及聚合方法,频谱感知数据质量可根据需求划分为多个等级,针对数据用途做出评估等级划分的一般性规定,不同的数据融合应用也可根据具体的数据使用要求重新确定等级划分和判断阈值。
本文针对频谱感知数据融合和应用对感知数据质量的实际需求,定义了频谱感知数据质量的具体内涵,结合频谱感知数据融合开展不同应用,建立了频谱感知数据质量评价指标,提出了有较强开放性、支持长期演化的频谱感知数据质量评价模型设计框架,综合考虑了客观数据和专家经验对综合评估的影响。构造递阶层次结构,通过线性加权综合法和非线性加权综合法两种指标聚合方式,确定了评估指标体系中各指标间的逻辑关系,满足频谱感知数据质量评价的需求。