马从锂 黄飞虎 弋沛玉 王琳娜 彭舰
摘 要: 因果关系发现是因果推断的重要部分,其目标是揭示数据内在的生成机制,并以有向无环图的形式表示. 然而关于因果关系发现,现有方法很少考虑到观察数据存在缺失值的情况. 在实际场景中,大量数据集存在缺失值,因此估计缺失数据集中的因果关系成为一个亟需解决的问题. 本文提出了一种新的基于因果反馈的算法实现关于缺失数据集的因果关系发现,其中生成对抗网络被用于估计缺失數据集的分布,并利用基于Actor-Critic 的因果关系发现模块搜索最优因果图,设计了一个基于扩展贝叶斯信息准则的自定义奖励函数,引入分类误差引导模型加速探索过程,提升模型稳定性. 在模拟数据和真实数据上进行的大量实验结果表明,本文提出的方法在不同数据缺失率下优于现有方法.
关键词: 深度学习; 缺失数据补全; 因果关系发现; 有向无环图
中图分类号: TP183 文献标志码: A DOI: 10. 19907/j. 0490-6756. 2024. 022002
1 引言
因果推断被用来揭示事物的内在生成机制、发现事物的运行规律,在统计学、医学、经济学、法学等众多领域中都有应用[1]. 因果关系发现是因果推断领域非常重要的分支,旨在从数据中推导出一个因果关系模型,以揭示数据的内在生成机制[2].