基于联邦学习的多源异构数据融合算法

2022-02-11 13:33莫慧凌郑海峰冯心欣
计算机研究与发展 2022年2期
关键词:异构特征提取模态

莫慧凌 郑海峰 高 敏 冯心欣

(福州大学物理与信息工程学院 福州 350108)

在信息化时代,海量的边缘数据将给以云计算模型为核心的数据集中化处理模式带来许多问题,一是将数据全部上传至云端的处理方式,不仅效率低下,而且造成额外的带宽开销,同时网络延迟也会增加.二是由于用户隐私意识的提高,边缘设备的数据很有可能在上传链路时泄密,个人隐私的安全问题无法得到保障.而分布式数据处理模式可以有效地解决传统云计算存在的时延和效率问题.同时,针对“数据孤岛”问题,谷歌公司首次提出了“联邦学习”这个概念.通过在多个边缘设备上利用各自的训练样本对模型进行单独的训练,并通过模型参数聚合实现在不透露用户隐私的前提下多源信息的共享.

此外,边缘设备的多样性使得设备采集到的数据在标注、语义和存在形式等方面都呈现多样性.多模态数据广泛存在.不同的模态数据可以从多个方面描述目标对象,通过消除冗余数据和融合各种数据源进行关联补充分析,数据可以涌现出更多有价值的新信息,从而实现1+1>2的效果.从互联网和移动设备收集的多媒体数据是典型的非结构化数据,与传统的易于存储的结构化数据格式存在显著差异.因此,对不同边缘设备采集到的多源异构数据处理成为大数据研究中亟需解决的问题.

在传统的多源异构数据融合算法中,数据集中化处理在实际应用中存在数据隐私泄露的风险.因此,对于不透露用户隐私前提下的多源异构数据处理还存在许多难题:首先,由于企业竞争和用户的隐私保护意识,使得数据互通长期处于闭塞状态,无法实现信息共享,从而无法充分发挥异构数据的价值.其次,利用神经网络对数据进行处理,根据数据设计的模型一旦确定后就无法更改.然而在边缘计算中,边缘设备所采集的数据结构和种类数目存在差异.若针对各个网络边缘设备上的数据设计适用于各自数据特征的神经网络,工作量极大,同时该模型只能适用于单一节点或者和该节点数据特征相同的边缘设备,普适性不高,也无法充分发挥物联网中其他的异构数据的价值.

为解决边缘计算中,在不泄露用户隐私的前提下实现多源异构数据的融合问题,本文提出了一种基于联邦学习的多源异构数据融合算法.从边缘设备采集到的数据结构特点入手,结合张量Tucker分解理论,研究能够在各异的边缘设备上自适应处理多源异构数据模型,解决联邦学习中由于处理异构数据的模型不统一带来的单一适应性问题.

1 相关工作

目前,针对联邦学习以及异构数据融合的研究已经取得了众多的成果.

1.1 联邦学习

由于移动设备和边缘设备的广泛使用,Yang等人提出的一种人工智能技术——联邦学习,是由一个中央服务器协调多个客户端在不公开数据的前提下,协同完成一个学习任务.

联邦学习有很多优点.首先,相比于云计算模型,联邦学习只发送更新的模型参数进行聚合,这极大降低了数据通信的成本,提高了网络带宽的利用率.其次,用户的原始数据不需要发送至云端,这避免了数据在上传链路时泄露用户隐私的可能.再者,联邦学习的模型训练可以在边缘节点或终端设备上进行训练和实时决策,时间延迟会比在云端进行决策时得到极大地改善.

在联邦学习中,数据安全是一个主要研究方面.Mcmahan等人提出了用户级的差分隐私训练算法,通过将隐私保护添加到聚合算法中,有效地降低了从传输模型中恢复个人信息的可能.另一方面,Beimel等人提出了差分隐私混合模型,通过用户的信任偏好对用户进行分区,从而减少所需用户基数的大小.Dong等人将梯度选择和秘密分享的算法结合起来,在保证用户隐私和数据安全的情况下大幅提升了通信效率.

在联邦学习中的资源优化方面,Tran等人考虑通过无线网络进行联邦学习,提出了优化能源消耗和全球联邦学习时间的问题.Wang等人提出了一种控制算法,可以在全局参数聚合和局部模型更新之间进行权衡,以在资源预算约束下将损失函数降至最低.Wang等人提出了一种联邦学习框架In-Edge-AI,以实现边缘计算中的智能资源管理.

1.2 多源异构数据融合

数据融合系统中的数据逐渐多元化且数量巨大,这迫使人们对系统效率的提高有了更高的要求.Microsoft研究院的Zheng将异构数据融合方法分为3种类型:1)基于阶段的数据融合方法;2)基于特征的数据融合方法;3)基于语义的数据融合方法.

基于阶段的数据融合方法是指在数据挖掘的过程中,不同阶段利用不同的数据进行分析.Pan等人首先使用GPS轨迹数据和道路网络数据检测交通异常,通过检索与交通异常位置相关的社交媒体信息(例如Twitter),最后分析交通异常的特定事件内容.这种融合方法的异构数据之间没有交互作用,失去了异构数据之间互补的优势,很难实现真正的内在数据融合.

基于特征的融合方法通过提取每个异构数据的特征,然后对特征进行分析和处理.因此,提取的特征质量以及融合方法都将对融合效果具有决定性的影响.Liu等人整合不同视图的面部信息,将不同维度的深度学习特征向量融合以实现基于深度异构性特征的面部识别.Ouyang等人将人类异构信息特征的3个来源进行非线性融合,可以更准确地估计身体姿势.Wang等人设计了张量深度学习计算模型,利用张量对多源异构数据的复杂性进行建模,将向量空间数据扩展到张量空间,并在张量空间中进行特征提取.Zadeh等人提出了张量融合网络用于解决多模态的情感分析,通过笛卡儿积的方式将多种模态进行融合,实现对情感的分类分析.

基于语义的融合方法了解每个数据集以及跨数据集的特征之间的关系,认为提取到的异构数据的特征是可解释的.Zheng等人提出了一种基于协同训练的模型来预测整个城市空气质量,利用空气质量具有时间以及空间的依赖性的特点,分别针对时空数据设计了2个分类器,通过将不同的时空特征输入到不同的分类器,从而在不同标签上生成2组概率,最大化地选择标签.

上述工作主要考虑了单一节点上的多源异构数据融合问题.而针对联邦学习中的多源异构数据融合问题,目前尚未有相关工作报道.

2 基于联邦学习的多源异构数据融合

本文主要针对网络边缘设备由于数据隐私性,无法进行数据通信情况下实现多源异构数据的融合进行研究.通过引入张量分解理论,构建一个具有异构数据空间维度特性的高阶记忆单元,在不透露用户隐私的前提下,利用记忆单元对多源异构数据进行有效地融合.同时,能够在不额外增加模型规模的条件下实现对多源异构数据的自适应学习.

2.1 联邦学习系统模型

本文针对异构数据在不进行数据互通前提下的融合问题,考虑在边缘计算中引入联邦学习,在不暴露用户自身隐私的前提下实现对多用户潜在特征的学习,其系统基本架构如图1所示.在该框架中,系统由边缘节点、物联网和云端服务器组成,其中边缘节点通过物联网(如网关和路由器)与云端服务器互联.

Fig. 1 The system model for federated learning图1 联邦学习系统模型

联邦学习是一种分布式学习框架,其中原始数据被收集并存储在多个边缘节点上,并在节点处执行模型训练,然后将模型通过节点与云端服务器的交互逐步优化学习模型.

基于以上框架,联邦学习可以从多个独立的边缘节点上使用本地数据协同训练一个泛化的共享模型,通过模型传输替代数据传输,规避了用户隐私泄露的风险.

2.2 算法的总体设计

如图2所示,本文所提出的基于联邦学习的多源异构数据融合算法主要分成特征提取模块、特征融合模块和特征决策模块.其中特征提取模块由各种异构数据对应的特征提取子网络构成.

在初始化阶段,中心控制节点对模型中的特征提取模块、特征融合模块和特征决策模块进行网络参数随机初始化,并下发至边缘节点.

在模型训练阶段,边缘节点接收到中心控制节点下发的模型后,根据本地节点上的数据集结构选择对应的特征提取模块,并利用本地数据集对特征提取模块、特征融合模块和特征决策模块进行训练.边缘节点新一轮训练的终止条件是本地节点训练轮数超过给定的训练轮数.待训练完成后将各自的训练模型返回至中心控制节点进行模型聚合.

在模型聚合阶段,对于特征融合模块和特征决策模块采用平均聚合算法,对于特征提取模块,则是根据得到的对应特征提取子模块进行平均聚合,以确保同一模态的数据提取的特征具有相似性.最后,将更新后的模型重新下发至边缘节点进行新一轮的训练.

Fig. 2 The overview of the proposed algorithm图2 算法总体框架

2.3 子模块设计

2.3.1 特征提取模块

本文假设待处理的异构数据分别为音频、视觉和文本数据.在特征提取模块,本节根据不同模态的特征,采用了不同的特征提取子网络分别对音频、视觉及文本信息进行特征提取.

1) 音频、视觉特征子网络.针对音频信息和视觉信息,分别采用了COVAREP声学分析框架和FACET面部表情分析框架对MOSI数据集进行特征采样提取(采样频率分别为100 Hz和30 Hz).

Fig. 3 Text feature sub-network图3 文本特征子网络

2) 文本特征子网络.口语文本在语法及表达上不同于书面文本,例如“我觉得挺好的……,不过,我觉得这个方法还有待改善”这种口语在书面语言中很少出现.处理口语这种具有多变性语言的关键在于建立能够在不可靠的情况下运行的模型,以及通过关注重要的词语来表现特殊的言语特征.如图3所示,本文提出的文本特征提取网络在编码部分先采用全局词向量对口语词进行预处理,同时使用知短时记忆(long short-term memory, LSTM)网络学习与时间相关的语言表示,并将其作为CNN网络的输入.在卷积层中,通过卷积核对文本信息实现细粒度更小的局部特征提取.

2.3.2 特征融合模块

Fig. 4 Heterogeneous data fusion based on Tucker decomposition图4 基于Tucker分解的异构数据融合

以图4为例,当待处理的异构数据特征分别为,,时,记忆单元为一个三阶张量,且此张量的3个维度分别对应于3种异构数据特征,,的特征空间

.

在本节提出的异构数据特征融合中,通过将异构数据特征与记忆单元对应的特征空间进行模乘,可得到具有该异构数据特征的记忆单元,并以此进行进一步的特征融合操作

.

融合操作主要分成3个阶段:首先,记忆单元沿着一阶与异构数据特征进行模乘,得到具有特征的新记忆单元

.

其次,记忆单元沿着二阶与异构数据特征进行模乘,得到具有和特征的记忆单元

.

最后,记忆单元沿着三阶与异构数据特征进行模乘,最终得到具有三者特征的融合张量

.

其具体过程可以表示为=((×)×)×,

(1)

2

.

3

.

3 特征决策模块针对融合后的数据,本节采用了传统的全连接层在全局特征的基础上进行决策,包括回归模型的预测和分类模型的概率预测

.

在该模块中,采用了

L

1范数损失函数

L

1

Loss

对目标值和预测值之间的误差进行了衡量

.

其具体表达式为

(2)

其中

l

的表达式为

(3)

2.4 基于联邦学习的多源异构数据融合

假设有

N

个边缘节点{

E

,

E

,…,

E

}参与共享模型的训练,且所有边缘节点共采集到

M

种异构数据

.

在初始化阶段,云端根据采集到的

M

种异构数据,设计对应的特征提取模块,特征融合模块,特征决策模块

.

则共享模型可表示为

(4)

(5)

其中,表示第

i

种异构数据的特征提取子网络

.

=

I

(;),=

I

(;|),

(6)

其中|表示在具有特征的基础上对的特征进行融合

.

在该过程中,模型首先利用记忆单元对特征进行记忆,得到具有特征的模型,并将此作为特征进行融合时的先验条件,从而在模型训练过程中,记忆单元不但能对各个异构数据的空间维度特征进行学习,还能对不同异构数据之间的潜在联系进行捕捉

.

Fig. 5 Multi-source heterogeneous data fusion based on federated learning图5 基于联邦学习的多源异构数据融合

节点

N

上的训练机制和节点1类似

.

上述过程可表示为

(7)

在模型聚合阶段,由于各个边缘节点采用特征提取器自适应选择机制对特征提取模块进行训练,因此在模型聚合时,需要先将各个边缘节点选择训练的特征提取子网络进行归并,再采用平均聚合算法得到具有全局异构数据特征的共享模型,该过程表示为

(8)

(9)

3 实验结果与分析

为验证本文算法的有效性,主要从单节点异构数据融合和多节点异构数据融合2个方面对本文算法的性能进行评估.基于Tucker分解的单节点异构数据融合实验,主要是通过单节点实现多源异构数据上的回归任务和分类任务对本文算法的性能进行评估,并与目前存在的几种主流异构数据融合算法进行了对比;基于Tucker分解的多节点异构数据融合实验,通过多节点实现多源异构数据上的回归任务和分类任务对本文算法的性能进行评估.

3.1 数据集设置和评价指标

本实验采用MOSI数据集,该数据集是YouTube上来自于视频影评的多模态情感数据集,包含了来自89位评论者的93个视频,每个视频的长度为2~5 min,包含了口语(字幕)、图像和语音3种信息.对于该数据集中的各个样本,均以人工方式对情绪进行评分,其分值位于[-3,3]之间.

本实验从回归任务和分类任务2个方面验证所提算法在多个任务上的有效性.在分类任务中,对分值量化如表1所示:

Table 1 Quantification of Emotional Score表1 情绪分值量化表

对于回归任务,本节实验采用平均绝对误差(

MAE

)和皮尔逊相关系数(

Corr

)对本文算法的性能进行分析,其对应表达式为

(10)

(11)

对于分类任务,本节实验采用精度(

Acc

)和

F

1指数对本文算法性能进行评估,其中表示类别的数目,其对应的表达式为

(12)

(13)

其中

TP

FP

TN

FN

分别为真阳性、假阳性、真阴性和假阴性的样本数

.Acc

越高,模型的分类的精度越高,性能越好;

F

1越高,模型对各个类别的识别能力越均衡,性能越好

.

3.2 单节点异构数据融合实验分析

本节实验对拥有3种模态的情感数据集MOSI分别进行了回归任务和分类任务的训练

.

设置3种模态的特征提取子模块的特征输出数为

R

,其中

k

表示为第

k

种模态

.

考虑到特征提取数

R

对于训练效率以及实验性能起到直接的作用

.

因此,本实验首先对比了不同的特征提取数的组合(

R

R

R

)分别对回归任务和分类任务的性能影响

.

在本实验中,设置各个模态的特征提取数集合为{8,16,32}

.

为验证本文算法的性能,从回归任务和分类任务2个方面对比了6种算法在单节点情况下的多源异构数据融合上的表现能力

.

3

.

2

.

1 回归任务回归任务中关于各个模态特征提取数的定量实验结果如表2所示

.

观察可知,本文算法在回归任务上的

MAE

主要集中在0

.

95~1

.

05之间

.

Table 2 MAE of MOSI Dataset Regression Task表2 MOSI数据集回归任务MAE

观察分析可知,对于回归任务来说,当3个模态的特征提取数的组合为(8,8,16)时,性能更为显著.

实验设置回归任务上各个模态的特征提取数分别为8,8,16.表3记录了本文算法与6种算法在回归任务上的性能对比.由表可知,本文算法与最优算法TFN在回归任务上性能相当,优于大多对比算法.虽然本文提出的异构数据融合算法在单节点上的回归任务性能低于LMF算法,但其旨在应用于联邦学习中对多源异构数据进行有效地融合,而现有的异构数据融合算法是在单节点上实现的,并不一定适合于联邦学习中.

Table 3 Performance Comparison of Regression Tasks on the MOSI Dataset

3.2.2 分类任务

对于分类任务来说,模型对各个模态特征提取数的敏感度会低于回归任务

.

因此,本实验中设置分类任务上各个模态的特征提取数分别为8,8,16

.

表4记录了本文算法与6种算法在分类任务上的性能对比

.

其中

Acc

_2和

F

1是二分类任务评价指标,

Acc

_7为多分类评价指标

.

由表4可知,本文算法在分类任务上性能优于TFN及大多数对比算法,而与LMF算法性能相当.

Table 4 Performance Comparison of Classification Tasks on the MOSI Dataset

讨论:虽然本文算法在单节点上性能表现并不是最好,但在联邦学习框架下有3个优势:1)对异构数据具有更强的自适应性.与其他算法相比,本算法在训练时不需要同时输入所有类型的异构数据,因此更适合在联邦学习中的不同类型的边缘节点中应用.2)更好地保护了数据隐私.本算法避免了将多种异构数据同时发送至同一处进行训练而可能存在的隐私泄露风险.3)大大降低了传输带宽.本算法只需传输提取该边缘节点拥有的异构数据对应的特征提取子网络模型参数,而无需传输提取所有异构数据特征的模型参数.

3.3 多节点异构数据融合实验分析

为验证本文算法在联邦学习框架下对多源异构数据融合的性能,本节实验将从2个方面对本文算法的性能进行评估:首先通过对训练子节点上的异构数据的部署来验证本文算法对异构数据的自适应能力.如表5所示,对于训练子节点上数据集的具体部署策略主要分成3类:1)单模态数据,即各个训练子节点上的数据集仅为单一结构的数据;2)双模态数据,即各个训练子节点上的数据集为任意2种结构的数据;3)三模态数据,即各个训练子节点上拥有所有结构的数据.其次,通过同一种多节点异构数据部署策略下训练的模型,在不同模态的异构数据上的表现,验证本文算法的普适性和泛化性.在本实验中,采用的特征提取数的组合(

R

R

R

)=(8,8,16)

.

Table 5 Multi-Node Heterogeneous Data Deployment Strategy

3.3.1 回归任务

对于回归任务,评价指标为

MAE

Corr

.实验结果如表6所示,对于回归任务来说,根据何种模态数据训练出的模型在该种模态数据上的性能表现最为显著.模型的预测值和样本的相关性随着训练模态数的增加而显著提升,且多模态训练模型对模态间潜在联系的学习具有向下兼容性.

在回归任务上,当训练数据的模态数越高,模型在与训练集模态数不同的测试集上的性能表现越好.这是因为多模态模型在训练的过程中,除了学习各个模态本身具有的特征以外,对各个模态之间的潜在联系也进行了学习,因此,对于高模态数的训练模型来说,学习到的各个模态之间潜在联系的组合种类也就越多,回归任务的性能就越好.

Table 6 Performance of Regression Tasks on the MOSI Dataset

3.3.2 分类任务

对于分类任务,指标为

Acc

_2,

F

1,

Acc

_7,其中

Acc

_2和

F

1为二分类任务评价指标,

Acc

_7为多分类任务评价指标.实验结果如表7所示,根据何种模态数据训练出的模型在该种模态数据上的性能表现最为显著.单模态训练模型对于多模态数据的融合是通过云端聚合方式实现的,模型学习到的只是各个模态上各自的特征,而学习不到各个模态之间潜在的联系,得到的只是具有本地训练模态特征的局部最优解;而对于多模态训练,不论是双模态还是三模态,模型训练的过程中除了各个模态本身特征的学习,同时还对模态之间的潜在联系进行了学习,云端聚合也通过信息共享扩大了对数据样本的学习.

Table 7 Classification Task Performance on the MOSI Dataset

4 总 结

本文提出了一种基于联邦学习的多源异构数据融合算法,该算法利用了Tucker分解理论,通过构建一个具有异构数据空间维度的高阶张量,实现对多模态数据的融合和记忆.相较于其他算法,该算法能够在不进行数据互通的前提下,对多源异构数据进行有效地融合,从而打破了由于隐私安全问题带来的数据通信壁垒.同时,该算法能够同时根据训练节点所拥有的异构数据结构,在不增加多余模型训练规模的前提下自适应地对不同种类的异构数据进行处理,从而在分布式训练中能够更高效地实现对通信带宽的利用率,减少不必要的传输,降低对网络边缘设备计算力和存储力的要求,同时,模型也具有更高的普适性和泛化性.

作者贡献申明

:莫慧凌负责方案的实施、实验结果整理与分析以及论文撰写与修订;郑海峰指导方案设计,把握论文创新性,并指导论文撰写与修订;高敏负责方案设计与实施,以及论文撰写;冯心欣参与方案可行性讨论.

猜你喜欢
异构特征提取模态
同步定位与建图特征提取和匹配算法研究
离散异构线性多智能体系统的输出一致性
联合仿真在某车型LGF/PP尾门模态仿真上的应用
试论同课异构之“同”与“异”
深度揭示小数本质的课堂教学——四位名师《小数的意义》同课异构的分析与启示
凝聚与铺张——孙绍振教授《以丑、呆为美》两岸同课异构教学观摩后记
模态可精确化方向的含糊性研究
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于滑动拟合阶次和统计方法的模态阻尼比辨识技术
基于曲率局部二值模式的深度图像手势特征提取