
2023-04-29 22:47万聪王英
吉林大学学报(理学版) 2023年2期

万聪 王英

摘要: 受注意力机制和直推式学习方法的启发,提出一种基于加权元学习的节点分类算法. 首先利用欧氏距离计算元学习子任务间数据分布的差异; 然后利用子图的邻接矩阵计算捕获子任务间数据点的结构差异; 最后将二者转化为权重对元训练阶段更新元学习器过程进行加权,构建优化的元学习模型,解决了经典元学习算法在元训练阶段所有元训练子任务的损失是等权重更新元学习器参数的问题. 该算法在数据集Citeseer和Cora上的实验结果优于其他经典算法,证明了该算法在少样本节点分类任务上的有效性.

关键词: 元学习; 注意力机制; 节点分类; 直推式学习

Node Classification Algorithm Based on Weighted Meta-Learning

WAN Cong,WANG Ying

(College of Computer Science and Technology,Jilin University,Changchun 130012,China)

Abstract: Inspired by attention mechanism and transductive learning method,we proposed a node classification algorithm based on weighted m

eta-learning. Firstly,Euclidean distance was used to calculate the difference of data distribution between subtasks in meta-learning. Secondly,

adjacency matrices of subgraph was used  to calculate and capture structural difference of data points  between subtasks. Finally,the captured information above

between subtasks were converted into weights  to weight the process of updating the  meta-learner in the meta-training procedure,and  an optimized m

eta-learning model was constructed to solve the problem that the loss of all meta-training subtasks in meta-training procedure of classical meta-learning alg

orithms was equal-weight to update the parameters of meta-learners. The experimental results of this algorithm on Citeseer and Cora datasets are superior to other classical algori

thms,which demonstrates the effectiveness of the algorithm on few-shot node classification task.

Keywords: meta-learning; attention mechanism; node classification; transductive learning

随着计算机算力和新算法的快速增加,尤其是对大数据的挖掘,使图深度学习得到了迅速发展. 但用户保护隐私意识的提升使数据变得有限,从而导致图深度学习面临两个问题: 1) 训练数据过少,模型的性能会急剧下降,并出现过拟合问题; 2) 人为标记大量数据费时费力. 通过元学习利用先验知识解决模型的过拟合问题,是解决少样本问题的有效方法,已广泛应用于图像分类[1-4]和语音识别[5-6]等领域.

目前主流的元学习方法是以MAML(model-agnostic meta-learning)[7]、 Reptile[8]、 FOMAML(first-order MAML)[9]为代表的经典算法,其中Meta-GNN(graph neural network,GNN)[10]和G-Meta(graph meta learning via local subgraphs)[11]是使用MAML完成節点分类任务的算法. 这类经典算法在面对几个少样本数据任务时,会先在大数据集的相关任务上进行预训练,然后进行微调[12-13]以适应这几个少样本数据的任务. 对应到元学习过程的描述中,在大数据集的相关任务上进行预训练的过程即是在元训练子任务上的元训练阶段,几个少样本数据任务即是元测试子任务. 上述经典算法在解决少样本数据任务的过拟合问题时取得了优异的成绩,但在上述算法的元训练阶段,多个元训练子任务的损失是等权重更新元学习器的参数,即多个元训练子任务通过元学习器传递给元测试子任务的信息是等权重的. 而在通常情况下,某个元训练子任务与元测试子任务越相关,则它传递给元测试子任务的信息越重要,因此上述经典算法仍有提升空间.

為解决上述问题,本文先利用欧氏距离[14]计算元学习子任务间样本特征的相似程度,捕获子任务间数据分布的差异程度,然后使用样本邻接矩阵计算子任务间样本子图结构的相似程度,捕获子任务间样本结构的差异程度,最后将这两种子任务间的信息转化为权重,融入元训练阶段,优化经典元学习算法. 实验结果表明,基于加权元学习的节点分类算法效果更好,分类更精确.

3 实验结果与分析


3.1 数据集

CiteSeer和Cora引文网络是由论文及其之间关系构成的网络,这些关系包括引用关系、 共同作者等. 表1列出了原始数据集CiteSeer和Cora的信息,包括本文实验过程中数据划分的元训练和元测试数据集的标签数.

3.2 实验结果

本文实验采用少样本学习[23]、 经典元学习节点分类算法Meta-GNN和加权元学习这3种算法进行性能对比. 为保证公平性和一般性,在每种算法下均使用了GCN(graph convolutional network),SGC(simple GCN),GAT(graph attention network),GraphSAGE等多种基本节点分类模型进行对比实验. 其中,少样本学习和经典元学习节点分类算法Meta-GNN的实验结果作为基线实验结果,由Meta-GNN[10]的公开代码及数据集环境复现得到. 3种算法在数据集上多种节点分类模型的精确度对比结果列于表2. 加权元学习算法对不同节点分类模型的精确度对比列于表3. 由表2可见,Meta-GNN算法相对于少样本学习算法的节点分类模型效果有提升. 在所有数据集上加权元学习算法中所有节点分类模型的效果都优于其他算法,在节点分类任务上性能更好. 由表3可见,加权元学习算法下,在所有节点分类模型中GAT模型的效果最好.

3.3 分离实验

为验证子任务间数据分布差异dist和子图结构差异struc的有效性进行分离实验. 实验结果如表4、 图3和图4所示. 其中WML-struc只使用struc计算权重; WML-dist只使用dist; 加权元学习二者均使用; MAML等权重,二者均不使用. 图3和图4中均使用GAT节点分类模型. 由表4及图3和图4可见,在所有的数据集上,MAML,WML-struc,WML-dist,WML的收敛精确度依次递增,表明dist和struc均能提升经典元学习算法的性能. 由于Citeseer和Cora都是一张图,数据划分后子图间结构差异较小,因此在本文实验中WML-dist比WML-struc效果好并不能证明dist比struc更重要.



