温积群,钟尚染,王绍荃
(浙江图盛输变电工程有限公司温州科技分公司,浙江温州 325000)
在互联网技术高速发展的背景下,大数据技术发展迅速,这极大方便了人们的生活,但同时,人们也面临着隐私数据被泄露的风险。电力用户的隐私数据由电网公司保存,电网公司虽建立了电力用户敏感信息数据库,采用加密与数据脱密技术对电力用户的隐私数据进行了加密,但依然无法避免电力隐私数据被泄露出去,隐私数据涉及电力用户的个人信息以及用电信息,若被泄露,则会给电力用户带来损害[1]。
为了有效保护电力用户隐私数据,国内的专家学者们展开了相关的研究。有学者设计了基于匿名、加密技术的电力用户隐私数据保护系统,该系统采集了大量电力用户敏感属性数据,并对其进行处理,通过系统软件推测出了电网隐私数据库中隐私数据的存储方式,并通过实验进行了验证。该系统实现了隐私数据的加密,但保护精度较低,系统的安全性较差。有学者设计了基于多机密性的电力用户隐私数据保护系统,该系统将敏感属性与准标识符属性进行拆分,通过建立有损连接对电力用户的隐私数据进行保护与加密,该系统设计简单,实现较为容易,但系统消耗的时间较长,安全性较低[2-3]。
为了解决以上问题,文中通过硬件和软件两部分设计了基于敏感元组的电力用户隐私数据保护系统,最后通过实验研究验证了文中系统的实际使用性能。
文中设计的基于敏感元组的电力用户隐私数据保护系统硬件结构如图1 所示。
图1 系统硬件结构
在采集信号输入之前,需要将采集信号通过电路中的电压互感器调节到输入范围内。为了防止采集信号与处理信号发生串扰和混叠,需要提升文中保护系统的采样率,标准周波采样点为128 点,即采样率为6.4 ksps,提升后的周波采样点为512 点,采样率为25.6 ksps,这时需要启用电路内部6.5 V 的基准电压,额定电压值理论上不能超过12 V。在采集信号输入后,为了避免电流的振荡现象,并向系统其他硬件提供较为平坦的供电电压,选择电路中的10 个管脚,在每个管脚处连接10 μF 的去耦电容,每个管脚流过的电流不能超过8 A。当处理信号输出后,如果电路信号线中出现了较为明显的高频噪声,为了保证采集信号的稳定输出,设置电路的输出电压为6 V,输出电流为1.8 A[4-5]。系统电路图如图2 所示。
图2 系统电路图
文中设计的保护系统的采集模块主要负责采集电力用户的隐私数据信息,该采集模块使用的采集芯片为三星公司生产的SXG74K-6833,其内部设置了A/D 保持器与采样放大器,外部加设了高速处理器。采集模块的外部设置了外围电路,外围电路的额定电压为3.3 V,瞬时电压为4.8 V,额定电流为1.8 A,瞬时电流为2.5 A。采集器通过发送采集信号,采集电力用户隐私数据库中的隐私数据信息,采集完毕后通过移动终端发送至保护系统的服务器内。由于隐私数据信息量较为庞大,因此文中采用的采集器采集能力较高,以隐私数据种类100、信息量为2 000的数量为例,采集器需要一次采集隐私数据20 种,采集的信息量为500,采集时长控制在2 min以内,采集完毕后由保护系统的处理模块负责对隐私数据进行处理[6-7]。采集模块结构如图3 所示。
图3 采集模块结构图
文中设计的保护系统的处理模块主要负责处理采集器采集的电力用户隐私数据。处理模块的微处理器选用美国ADI 公司生产的AD6349 微处理器,该款微处理器具有6 个通道,属于8 bit 高精度逐次逼近型微处理器,具有高压半导体工艺,能承受高达48 V 的电压。为了更好地处理电力用户隐私数据,微处理器的每个通道都设置了一个采样放大器,可通过采样放大器对隐私数据信号进行处理和放大。在对处理信号进行转换时,微处理器的内部晶振需要对4 个管脚进行同步采样,以保证转换的正常进行。处理模块电路图如图4 所示。
图4 处理模块电路图
微处理器处理完电力用户隐私数据后,为了保证隐私数据的稳定输出,微处理器的外部设置了串行通信接口与并行通信接口。同时,由于该款微处理器封装尺寸较小,因此其功耗较低,在处理隐私数据信息时,处理效率较高[8]。
文中系统的存储模块主要负责存储处理完的电力用户隐私数据。存储模块中的存储器选用TI公司生产的TD7392,该存储器配有8 片并行的4 GB容量的Flash 芯片。微处理器处理完电力用户隐私数据后,经过系统的服务器传输到存储器中,由存储器的Flash 驱动层对隐私数据进行数据拷贝,拷贝过程中需要获取隐私数据坏块信息,以方便对拷贝的隐私数据进行初始化,实现数据的加密。在Flash 扇区写入隐私数据时,需注意坏块状态,避免部分隐私数据由于不稳定的坏块状态而发生丢失现象。初始化操作完成后,由存储器的管理层对隐私数据的坏块信息进行索引,并将其映射到坏块映射区内,这样可以保证被存储的隐私数据的稳定性和可靠性。存储模块的驱动层和管理层实现了电力用户隐私数据的存储和加密[9-10]。存储模块结构如图5 所示。
图5 存储模块结构图
基于敏感元组的电力用户隐私数据保护系统的软件流程如图6 所示。
图6 系统软件流程
软件流程可分为三步。
第一步:对电力用户隐私数据进行分级。电力用户隐私数据的安全性与隐私数据属性以及数据共享类型有关,数据共享类型不同,隐私数据被泄露的风险也不相同。为了实现对电力用户隐私数据的保护,采用隐私数据分级原理,对电力用户隐私进行等级划分。根据数据共享类型,将电力用户隐私分为三级,一级最高,三级最低。一级隐私数据涉及电力用户的大量隐私数据,需要采用最高强度的隐私保护,在查询、检索相关隐私数据时,访问的权限较高,泄露风险较小[11-12]。将二级隐私数据的保护强度设置为中等强度,同时将该级隐私数据信息的访问权限设置成中等级别,二级隐私泄露风险为中等级别。三级隐私数据包含的敏感数据较少,对其采用最低程度的保护,保护强度设置为低等,对该级隐私数据信息进行检索时,访问权限设置为低等,泄露风险较高。对电力用户隐私进行分级,可建立不同级别的保护措施[13]。
第二步:建立隐私保护库。基于以上隐私分级结果,对一级隐私数据采用差分隐私技术进行保护,并建立差分隐私数据库,数据库中设定访问控制权限;对于二级隐私数据,电力用户对其保护的需求相比一级隐私数据有所降低,可采用匿名技术建立匿名隐私保护库,该保护库可对二级隐私数据进行保护,其保护强度适当,既达到了二级隐私数据保护的目的,也避免了保护强度过高而导致资源的浪费;对三级隐私数据的保护,采用数据挖掘保护方法建立隐私数据挖掘保护库,该保护库保护强度较低,对低级隐私数据扰动情况可进行很好的保护[14-16]。
第三步:根据电力用户隐私等级选择保护算法。隐私保护库建立完成后,为了更准确地保护电力用户的隐私数据,在确定隐私等级、选择对应的隐私保护库后,选择隐私数据保护算法,保护算法可以对隐私数据进行加密保护,一、二、三级隐私数据对应的保护算法分别为局部扰动方法、隐私属性法与随机变换法。
为了验证文中设计的基于敏感元组的电力用户隐私数据保护系统的实际使用效果,将基于匿名、加密技术的电力用户隐私数据保护系统与文中系统进行对比实验。实验数据取自电网公司建立的电力用户隐私数据库,该隐私数据库含有2 000 个隐私数据。对该隐私数据进行分级,分成一、二、三级隐私数据集,隐私数据集的元组数设为10,采用文中系统与基于匿名、加密技术的电力用户隐私数据保护系统对电力用户隐私数据进行保护实验。
首先针对两种保护系统的保护精度进行实验。两种保护系统随隐私数据集元组变化结果如图7所示。
图7 保护系统隐私数据集元组变化结果
由图7 可知,基于匿名、加密技术的电力用户隐私数据保护系统的保护精度最高为0.85;而文中系统的保护精度最高为0.98。这是由于基于匿名、加密技术的电力用户隐私数据保护系统没有对电力用户隐私数据进行匿名化处理,导致保护精度急剧下降;而文中系统通过敏感元组对隐私数据集进行了匿名化处理,使电力用户隐私数据得到了很好的保护。另外,文中系统对敏感元组进行了概化并赋予了权重,使访问隐私数据的权限升高,对隐私数据进行了很好的保护和加密,提升了对敏感数据的保护强度。隐私数据集元组在任一数值时,文中系统的保护精度均高于基于匿名、加密技术的电力用户隐私数据保护系统,证明了文中系统具有较高的保护精度。
下面针对文中系统与基于匿名、加密技术的电力用户隐私数据保护系统的安全性进行实验。系统安全性的评估指标为两种系统的敏感元组密度,敏感元组密度过高,即超过标准密度2,则视为该系统安全性较低,隐私数据遭泄露的风险较高。通过对实验结果进行分析可知,文中系统对隐私数据进行概化分组全部采用的是敏感元组,对2 000 个隐私数据进行加权处理后,其敏感元组密度为1,证明文中系统的安全性较高,而在基于匿名、加密技术的电力用户隐私数据保护系统中,只利用部分敏感元组对隐私数据进行概化分组,并且对实验中的2 000 个隐私数据没有进行加权处理,造成部分隐私数据的泄露,敏感元组密度超过2,证明了基于匿名、加密技术的电力用户隐私数据保护系统的安全性较低。
最后对两种系统的时间消耗情况进行对比。在对2 000 个隐私数据进行保护的过程中,两种系统所消耗的时间情况如图8 所示。
图8 系统消耗时间实验结果
由实验结果可知,随着隐私数据集元组的增加,文中系统消耗的时间逐渐增加,增长较慢,最高消耗750 s;而传统系统消耗的时间随着隐私数据集元组的增加迅速上升,消耗的时间最高为900 s,由此可证明文中系统的工作效率较高,时间消耗较少。
文中利用敏感元组设计了一种新的电力用户隐私数据保护系统,对系统的硬件和软件进行了优化设计,经过实验可验证文中系统优于基于匿名、加密技术的电力用户隐私数据保护系统,且文中系统的保护精度较高、安全性较好,消耗的时间更短。