郝志峰 陈薇 蔡瑞初 黄瑞慧 温雯 王丽娟
摘要:现有的无线网络性能优化方法主要基于指标间的相关关系分析,无法有效指导网络优化等干预行为。为此,提出典型因果推断(CCI)算法,并将其应用于无线网络性能优化。首先,针对无线网络性能由大量相关指标体现这一特性,采用典型相关分析(CCA)方法,提取指标中蕴含的原子事件;然后再采用因果推断方法,构建原子事件间的因果关系网络。通过上述两个阶段反复迭代,确定原子事件间的因果关系网络,为无线网络性能优化提出一个较为可靠和有效的依据。最后通过模拟实验验证了CCI算法的有效性,在某城市3万多个移动基站数据上发现了一批有意义的无线网络指标间的因果关系。
关键词:典型相关分析;因果推断;线性非高斯非循环模型;无线网络性能优化
中图分类号:TP181
文献标志码:A
0引言
随着信息技术的不断发展,无线通信网络逐渐普及,用户对网络服务质量的要求也越来越高,市场竞争也越来越激烈,如何对无线网络性能进行优化,并在网络出现问题之前进行有效的预警,是当前电信营运商和设备供应商非常关注的问题,同时也受到越来越多用户的重视。目前,无线网络性能的问题可以通过拨打测试、用户反映和网络指标等分析出来,其中,网络指标比较客观、全面地反映了无线网络性能的好坏程度。卢昶[1]对网络优化主要是通过分析全球移动通信系统(Global System for Mobile communication, GSM)中采集到的运行数据和指标,来找出移动通信系统中存在的问题;刘臣巍[2]对无线网络中移动交换中心(Mobile Switching Center, MSC)、基站控制器(Base Station Controller, BSC)分别进行了优化,用追踪选择错误(Error of Selection, EOS)代码的方式来解决网络问题,通过分析网络中性能指标来判断网络中可以优化的部分;刘占军[3]结合GSM运行原理与成都联通GSM的实际情况,针对性地提出了切合实际的网络优化方案。针对无线网络优化问题,当前主要是通过参数采集统计分析,信令跟踪[4]、路测信息采集分析等方法对整个无线网络进行综合分析,以得出无线网络性能的优化方案[5]。
最近的GSM研究[6-7]提出了一些新的无线网络性能优化技术,例如,基于关键业绩指标(Key Performance Indication, KPI)的GSM优化与数据挖掘分析方法[8-9]。目前这类分析方法主要停留在统计相关性方面,有时还需要对信令进行跟踪,这无疑会在一定程度上造成分析不全面、不必要的工作量增加等问题。虽然统计数据分析方法[10]主要是针对统计的各项数据指标实施分析,应用Matlab等数学工具软件进行数据排序以展现数据之间的相互关联,从而发现其中的问题,但是,利用统计的方法只能看到数据之间的相关关系,而无法提出优化干预措施,找出真正影响无线网络性能的源头。Cai等[11]提出的贝叶斯半监督算法(BAyesian Semi-SUpervised Method, BASSUM)也证明了相关关系不能指导干预的情况。因果推断是挖掘数据间蕴含的因果性的一种有效的方法。因果网络是一种对可观测数据进行强有力推理的工具,可以方便地表示以及分析确定性和概率性的事物,对干预行为效果进行预测,有助于提出干预措施。根据算法模型基础的不同,主流因果推断算法可分为两类:以IC(Inductive Causality)类算法为代表的全局结构推断方法[12]和以Hoyer等[13]提出的不对称性度量方法为代表的局部结构推断方法。在高维数据因果推断方面代表性工作包括Xie等[14]的递归分解结构学习策略、Han等[15]的重合分解策略、Tsamardinos等[16]的最大最小爬山法和Cai等[11]的半监督策略等。针对IC类算法在高维数据上的可靠性问题,Cai等[17]还基于V-结构间的冲突关系,提出了V-结构筛选和融合算法,有效提升了IC类算法的可靠性。局部因果关系模型的代表性工作则包括:基于噪声不对称性的加性噪声模型(Additive Noise Model, ANM)方法[13]和线性非高斯非循环模型(Linear Non-Gaussian Acyclic Model, LiNGAM)方法[18-19],基于数据分布不对称性的信息几何因果推断(Information-Geometric Causal Inference, IGCI)[20-21]和综合多种不对称性度量的后非线性(Post-Nonlinear, PNL)方法[22]等。这些局部结构学习方法突破了全局结构推断方法的发现能力限制,能够区分任意两个变量间的因果方向,如x→y→z, x←y←z, x←y→z等IC类方法无法判定的因果关系。
实际中的无线网络性能指标维数较大,指标之间相关性强,原子事件指标由大量指标体现,若直接对其进行因果推断,则网络指标内部的因果关系将变得毫无意义。Cai等[17,23]也通过研究发现,虽然有高维因果推断算法应用于高维数据的因果推断,但是仍存在因大量因果关系集中在原子事件指标内部,如果直接对网络指标进行因果推断,原子事件指标内部的指标之间的因果关系也将变得无意义。
针对上面的分析可以得出无线网络性能指标优化面临以下两个挑战:1)相关关系不能指导干预;2)直接对网络指标进行因果推断无法找到有意义的指标内部的直接因果关系。因此,本文提出典型因果推断(Canonical Causal Inference, CCI)算法,用于分析无线网络性能。该算法采用典型相关分析(Canonical Correlation Analysis, CCA)方法[24]提取无线网络的指标中蕴含的原子指标,并对其进行因果推断,经过不断地迭代上面提取原子事件指标和因果推断两个过程,得到原子指标间的因果网络图。通过学习到的原子指标因果网络图,可以对无线网络性能进行全面分析,同时能对干预效果作前期预测,及时对可能发生故障或影响的网络指标进行维护或维修。
1相关工作
1.1无线网络性能分析
无线网络性能的好坏主要通过网络指标来体现。网络指标主要包括:信令信道可用率、信令信道拥塞率、信道掉话率、话音信道可用率、话音信道拥塞率、话音信道掉话率、切换成功率、双频切换成功率、无线信道利用率、上下行语音质量等。对无线网络性能进行分析,很大程度上就是对无线网络运行指标的分析,从全网到小区,每个时段,进行整体到局部的分析,通过分析,进而找到提高无线网络性能的方法。
1.2典型相关分析
典型相关分析(CCA)是一种用于分析两组随机变量集之间相互依赖关系的多元统计分析方法,是一种很有价值的多元数据处理方法。其基本思想是:分别在两组指标中提取有代表性的两个综合指标U和V(U和V分别为两个指标组中各个指标的线性组合),利用这两个综合指标之间的相关关系来反映两组指标之间的整体相关性。其目的是识别并量化两组指标之间的联系,将两组指标的相关关系分析,转化为一组指标的线性组合与另一组指标线性组合之间的相关关系分析。其数学定义如下:
总的来说,LiNGAM算法依赖于独立成分分析(Independent Component Analysis, ICA)方法。ICA算法是一种混合信号的分离算法。LiNGAM算法首先通过ICA算法从观察数据中得到分离矩阵,再依据LiNGAM模型的假设对该分离矩阵进行处理得到因果顺序,最后采用最小二乘法求得系数矩阵;同时,该算法还利用剪枝算法对LiNGAM初步推断得到的近似为全关联的结构进行剪枝,得到与实际相符的较为稀疏的结构。
2利用CCI算法优化无线网络性能
2.1问题定义
2.1.1无线网络指标因果网络图
无线网络指标是衡量无线网络性能高低的一个主要标准。在无线网络中,一个指标可以由大量相关的子指标进行测量和表示。例如,原子指标就是由大量指标进行体现的。因此,我们对原子指标有如下定义:
2.2利用CCI算法优化无线网络性能的过程
利用CCI算法优化无线网络性能的基本流程为:
输入所有无线网络指标的数据,该算法先对这些指标进行预处理,然后分为两步:1)对评估同一主指标的一组相关指标Xti进行组合,与其余指标组成的一组指标进行典型相关分析,抽取原子指标Xt,再对抽取出来的原子指标集合用LiNGAM模型进行因果网络学习,得到初步的原子指标因果网络图;2)根据前面学习到的原子指标因果网络图,即结合原子指标之间的因果性,重新典型分析原子指标与其他相关指标的指标集合,抽取出新的原子指标,并不断迭代,直到学习到的因果网络图趋于稳定状态为止,最终得到完整的原子指标因果网络图。根据原子指标因果网络图中展现的原子指标间的因果依赖关系,分析影响无线网络性能的因素,从而得到无线网络性能优化的方案和干预措施。
3CCI算法
CCI算法是在CCA和LiNGAM算法的基础上提出的,它与CCA和LiNGAM算法的不同主要体现如下:
1)CCA是用于分析多元变量的相关性,而CCI算法则是采用CCA的主要思想来选择变量,抽取原子事件,有助于分析原子指标之间的因果关系,使原子指标内部指标的因果依赖也变得有意义,同时提高推断的准确度。
2)LiNGAM算法分析的数据是线性非高斯变量,而CCI算法则是用于分析多元变量典型相关分析而得到的典型变量,后者降低了变量的维度,同时降低了算法的时间复杂度。利用因果推断算法,也有助于对采取干预行为的效果进行预测,实现性能问题出现前的预警,提出合理的无线网络性能指标优化的干预方案。
根据以上分析,给定一个数据集,可以通过以下步骤利用CCI算法进行原子事件因果网络图学习:
步骤1
抽取原子事件。
对给定的数据集,首先利用相关专业知识,将数据集中表示相同或相近类型的变量进行分组,作为不同原子事件所对应的变量集合;再对每一组中的变量进行类似典型相关分析,抽取原子事件。与CCA不同的是,CCI算法的两组相关分析的变量是由原先知识组合得到的变量集合,与数据集中其余的变量组合而成的变量集合进行典型相关分析,找到一组wi和wj,使其满足以下条件:
例如,图4中的原子事件为1,其相关变量组为A={11,1.2,1.3}。它是A和A在数据集中的补集 的典型相关变量,并且其满足在两个变量组方程为1的约束下,事件1和事件1′之间的相关系数最大。
步骤2
初步因果推断。
对抽取出来的原子事件,利用LiNGAM算法进行因果结构学习,得到初步的原子事件因果网络图,获得初步的原子事件间的因果性。LiNGAM算法分为估计与剪枝两个阶段。
第一阶段是估计阶段,该阶段能够得出因果顺序以及初步估计出整个因果结构(即矩阵系数)。由式(1)可推出: Wx=e,W=(I-B)。其中:I为单位矩阵,W称为混合矩阵。
第二阶段是剪枝阶段。剪枝算法是对LiNGAM初步推断的近似为全关联的结构进行剪枝,得到与实际相符的较为稀疏的结构。LiNGAM模型的剪枝问题采取的剪枝算法分为两类:一类是基于统计学与最优化的相关理论,例如Resampling与Adaptive Lasso等;另一类是基于贝叶斯网络判断无向结构的相关算法,此类算法核心点是条件独立性测试,例如:PC算法[12],基于马尔可夫毯的BASSUM算法中的剪枝策略[11],Mooij等[25]提出的残差依赖最小化的方法等。
例如,在图4中的抽取原子事件的基础上,进行因果网络推断,得到图5所示的原子事件因果网络图。
步骤3
重新抽取原子事件,不断迭代,得到原子事件因果网络图。
对每个原子指标,分别求其与子节点指标满足式(2)的典型相关变量,将与它的指标集合线性相关的典型变量作为指标集合的原子指标,对原子指标进行基于LiNGAM算法的因果网络推断,得到另一个原子指标间的因果网络图。
例如,在图6的基础上,事件1与事件2进行典型相关分析,得到满足式(2)的典型变量1-1和2-1,则将变量1-1作为事件1新的原子事件。
其中:步骤3)是计算初始的原子指标;步骤5)是通过不断迭代,保证最终的原子指标因果网络图趋于稳定状态,得到最终的原子指标间的因果关系,Y′存储了最终的原子指标集合。
4实验结果与分析
为了对本文提出的算法进行验证和分析,分别用虚拟数据和真实数据进行了实验。
4.1虚拟数据实验
本文使用人工生成不同参数下的测试数据集,选取了典型偏相关(Canonical Partial Correlation, CPC)算法与本文算法进行比较。虚拟数据的生成分两阶段实现:
1)生成原子指标的因果网络图,其中单父亲节点个数为双父亲节点个数的2倍,并依照该图生成数据。
2)生成指标数据:随机生成每组指标的个数,每个指标的数据依照函数X=Y×Q-1生成,其中:Q为每个函数的权值,即原子指标与指标集合的相关系数,随机取值于0~1;Y为原子指标。在整个因果网络生成阶段,采用20维原子事件、50维指标变量分别生成300、400、500、600、700、800样本量的因果网络图,用来测试两种算法在不同样本量下的实验效果;采用25维原子事件和500样本量分别生成30、40、50、80、100维指标变量的因果网络图,用来测试两种算法在不同指标数下的实验效果;采用50维指标变量500样本量分别生成6、13、25、30、40维原子事件的因果网络图,用来测试两种算法在样本指标变量抽取为不同原子事件下的实验效果。
为了有效地评价该算法的性能,本文采用正确率(Precision)、召回率(Recall)和F1值对实验结果进行评估。正确率是指所有通过典型因果推断算法学习到的原子指标关系中正确的边数占原始因果图中所有边数的比例;召回率是指所有学习到的正确的边数占整个数据(学习到的和未学习到的)中真正正确的边数的比例。F1值通过以下公式来计算:
正确率主要是用来衡量因果网络图中节点间本来不存在的边被错误添加的程度;召回率是用来衡量节点间存在的边没有被发现的程度;F1则综合了前两个评价参数,用来评价本文方法的总体优劣。
在本节的实验中,用构造出的虚拟数据网络对CCI和CPC算法进行对比实验。图7表明,在25维原子事件50维指标变量中,样本数超过400之后,CCI算法的正确率、召回率和F1值都比CPC算法高。这说明在大量样本量的情况下,CCI算法具有较高的稳定性和准确性。从图8中可知,CCI算法在指标维度逐渐增加的情况下三个评分参数都比CPC算法高。这体现了CCI算法在高维的适用性,以及算法抽取原子事件这一策略是十分可靠和有价值的。实际中无线网络性能相关的指标维数一般较高,CCI算法中提出的抽取原子事件能使性能优化分析更加便捷。在同一指标维度下,抽取的原子事件维数多少也会影响CCI在实际中应用的正确率(如图9所示)。虽然随着原子事件维度的增加,CPC算法在三个评分上基本呈递增趋势,但是在原子事件维度越少的情况下,CCI算法体现了很好的效果。这体现了CCI算法将较多相关指标用原子事件表示这一方法的有效性。
4.2CCI算法在实际数据中的应用
4.2.1数据集说明
实验数据来源于某城市3万多个移动基站收集到的GSM性能指标数据。其中包含了42个无线网络性能指标(如:业务信道(Traffic Channel, TCH)话务量、半速率话务量、分组数据信道(Packet Data Channel, PDCH)使用数占比、TCH可用率、PDCH总复用度等),总共有30406个样本数据。由领域知识可知,该数据集可以提取出12个原子指标。
4.2.2数据预处理
本文使用的指标数据属性包括TCH话务量、半速率话务量、PDCH使用数占比、TCH可用率、PDCH总复用度等,每个指标对应的数据都是经过预处理之后,按照一定的方式作为输入数据;同时,对指标数据属性根据领域知识和指标间的相关性进行归类,可以结合为12个原子指标。如:原子指标“半速率话务比例”对应的相关指标为“TCH话务量、半速率话务量、PDCH使用数占比、TCH可用率”;原子指标“增强型数据速率GSM演进(Enhanced Data Rate for GSM Evolution, EDGE)技术和分组数据信道(PDCH)占比”对应的相关指标为“PDCH总复用度”等。由于采集数据过程中出现一些噪声,所以对数据集中数据值的预处理方法为,将数据为“#DIV/0!”、“#N/A”及空值用“0”替换之后,对数据进行标准化(均值为0,方差为1)。
4.2.3实验结果分析
1)使用本文的方法,对42个指标30406个样本数据,共12个原子指标的无线网络性能指标数据集中学习原子指标因果网络,得出无线网络性能优化的方案。算法在重新抽取原子指标过程总共迭代了2次,说明其收敛速度很快。这也证明了CCI算法抽取原子事件的方法具有高效性和有效性。通过算法学习和推断之后最终得到的原子指标因果网络图如图10所示,图中包含12个指标节点、17条边,每条边表示指标之间的因果依赖关系。
2)广东南方通信建设有限公司的专家结合其专业知识,将实验生成的因果网络图跟实际情况下无线网络的相关数据指标间的关系进行对比,指出本文方法有一定的指导性和启发性。例如,“独立专用控制信道 (Stand-Alone Dedicated Control Channel, SDCCH)拥塞率与SDCCH话务量在数据统计上呈现正相关关系,即SDCCH话务量增加时,SDCCH拥塞率也随着增长,进而导致SDCCH掉话率提高”。这个专业性的结论跟因果网络图中显示的“SDCCH拥塞率与SDCCH掉话率之间存在因果关系”的结果是相吻合的。学习到的原子指标因果网络图经由专家评测,足以证明本文方法具有可行性。
3)图10表明,影响该城市GSM性能高低的源头主要是“临时数据快流(Temporary Block Flow, TBF)建立成功率”,这个性能指标与“无线接入性” “EDGE流量占比”“EDGE PDCH占比”“半速率话务掉话比”这四个性能指标之间存在因果关系。若发现“EDGE流量占比”这个指标数据出现异常,那么可以考虑提高TBF建立的成功率。通过分析“TBF建立成功率”这个原子指标内部指标的因果性,就可以很快设计出一套无线网络优化方案。基于因果对干预行为效果预测的有效性,还可以提前对“EDGE流量占比”进行预警,制定好解决“EDGE流量占比”突然增大的应对方案,以消除其对无线网络性能造成的影响。
从图10中还可以看出,原子指标“半速率话务掉话比”受到原子指标“EDGE PDCH占比”的影响,而原子指标“EDGE PDCH占比”对应的相关指标为“PDCH总复用度”。根据专业知识可知,PDCH复用度是指有多少个用户在同一时间共同使用同一PDCH,它反映了PDCH信道的复用程度。它的值等于并发的TCH数目占用的PDCH的数目,主要是通过激活数量多少来衡量。而“半速率话务掉话比”对应的指标有“TCH话务量、半速率话务量、PDCH使用数占比、TCH可用率”,这说明PDCH信道的复用程度大小变化可以造成这些指标的变化,这个结论可以为无线网络性能的优化方案的制定提供指导性的作用。当发现TCH话务量较大时,可以对半速率比率进行调整;同时,还可以提前设置PDCH信道比率门限,根据TCH话务量等信息进行动态的评估和优化。
5结语
本文从已有的无线网络性能优化的方法和难点入手,提出一种基于典型因果推断(CCI)算法的无线网络性能优化方法,通过本文提出的算法学习到的结果对无线网络性能进行分析,得出了若干个有指导意义的结论。与现有的无线网络性能分析方法相比,本文采用因果推断方法,能解决相关关系无法指导干预的问题;同时,本文方法将同类型的相关指标进行融合,抽取原子指标,再进行因果网络学习,有助于解决无线网络指标数量多,与基于大量指标不易体现原子指标因果学习的结果,以及对原子指标内部指标因果关系无意义的问题。同时,采用LiNGAM因果推断算法,其中运用到的ICA算法可以消除指标间的相关性,减少指标相关性对因果推断的影响,提高无线网络的性能分析的准确性,这种方法也为无线网络优化提供了新的思路。但是,本文中对指标的初始组合是基于无线网络指标的领域知识,难免会受到人为因素的影响,后期将对指标组合的选择展开进一步的研究,发现潜在的影响无线网络性能的指标。
参考文献:
[1]卢昶.GSM网络优化综合分析系统的设计与实现[D].北京:北京邮电大学,2008:2-4. (LU C. The design and implementation of GSM network optimizing analysis system [D]. Beijing: Beijing University of Posts and Telecommunications, 2008: 2-4.)
[2]刘臣巍.GSM交换无线网络优化[D].长春:吉林大学,2009:1-6. (LIU C W. GSM exchange wireless network optimization [D]. Changchun: Jilin University, 2009: 1-6.)
[3]刘占军.GSM移动通信网络优化的研究与实现[D].成都:电子科技大学,2009:1-3. (LIU Z J. The design and implementation of GSM mobile network [D]. Chengdu: University of Electronic Science and Technology of China, 2009: 1-3.)
[4]白俊杰,何长艳. No.7信令网的网络优化[J].天津通信技术,2004(4):52-53. (BAI J J, HE C Y. No.7 signaling network optimization [J]. Tianjin Communications Technology, 2004(4):52-53.)
[5]吴宝栋,肖恒辉,陆南昌,等.无线网络智能优化系统及其应用[J].移动通信,2012(12):16-20. (WU B D, XIAO H H, LU N C, et al. Wireless network intelligent optimization system and its application [J]. Mobile Communications, 2012(12): 16-20.)
[6]卢纪宇,白波.GSM无线网络的优化[J].电信技术,2006(12):60-62. (LU J Y, BAI B. GSM wireless network optimization [J]. Telecommunications Technology, 2006(12):60-62.)
[7]周文静.无线网络优化方式新思路的探讨[J].广东通信技术,2006,26(12):2-6. (ZHOU W J. Discussion on new ideas for wireless network optimization approaches [J]. Guangdong Communication Technology, 2006, 26(12): 60-62.)
[8]AGRAWAL R, MANNILA H, SRIKANT R, et al. Fast discovery of association rules [M]// Advances in Knowledge Discovery and Data Mining. Menlo Park, CA: American Association for Artificial Intelligence, 1996: 307-328.
[9]王华奎,李艳萍,张立毅,等.移动通信原理与技术[M].北京:清华大学出版社,2009:1. (WANG H K, LI Y P, ZHANG L Y, et al. Mobile Communication Principle and Technology [M]. Beijing: Tsinghua University Press, 2009:1.)
[10]刘颖.GSM无线网络优化研究[J].中国新技术新产品,2012(4):36-36. (LIU Y. GSM wireless network optimization research [J]. China New Technologies and Products, 2012(4): 36-36.)
[11]CAI R, ZHANG Z, HAO Z. BASSUM: a Bayesian semi-supervised method for classification feature selection [J]. Pattern Recognition, 2011, 44(4): 811-820.
[12]PEARL J. Causality: Models, Reasoning and Inference [M]. 2nd ed. Cambridge, UK: Cambridge University Press, 2009: 49-51.
[13]HOYER P O, JANZING D, MOOIJ J M, et al. Nonlinear causal discovery with additive noise models [C]// Advances in Neural Information Processing Systems 21. Cambridge, MA: MIT Press, 2008: 689-696.
http://machinelearning.wustl.edu/mlpapers/papers/NIPS2008_0266
[14]XIE X, GENG Z. A recursive method for structural learning of directed acyclic graphs [J]. Journal of Machine Learning Research, 2008, 9: 459-483.
[15]HAN L, SONG G, CONG G, et al. Overlapping decomposition for causal graphical modeling [C]// KDD 12: Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012: 114-122.
[16]TSAMARDINOS I, BROWN L E, ALIFERIS C F. The max-min hill-climbing Bayesian network structure learning algorithm [J]. Machine Learning, 2006, 65(1): 31-78.
[17]CAI R, ZHANG Z, HAO Z. Causal gene identification using combinatorial V-structure search [J]. Neural Networks, 2013, 43: 63-71.
[18]SHIMIZU S, HOYER P O, HYVRINEN A, et al. A linear non-Gaussian acyclic model for causal discovery [J]. Journal of Machine Learning Research, 2006, 7: 2003-2030.
[19]SHIMIZU S, INAZUMI T, SOGAWA Y, et al. DirectLiNGAM: a direct method for learning a linear non-Gaussian structural equation model [J]. Journal of Machine Learning Research, 2011, 12: 1225-1248.
[20]JANZING D, MOOIJ J, ZHANG K, et al. Information-geometric approach to inferring causal directions [J]. Artificial Intelligence, 2012, 182/183: 1-31.
[21]JANZING D, STEUDEL B, SHAJARISALES N, et al. Justifying information-geometric causal inference [M]// Measures of Complexity. Berlin: Springer-Verlag, 2015: 253-265.
[22]ZHANG K, HYVRINEN A. On the identifiability of the post-nonlinear causal model [C]// UAI 09: Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. Arlington: AUAI Press, 2009: 647-655.
[23]CAI R, ZHANG Z, HAO Z. SADA: a general framework to support robust causation discovery [C]// Proceedings of the 30th International Conference on Machine Learning. [S.l.]: JMLR: W&CP, 2013, 28: 208-216.
http://jmlr.org/proceedings/papers/v28/cai13.html
http://jmlr.org/proceedings/papers/v28/cai13.pdf
[24]胡国定,张润楚.多元数据分析方法:纯代数处理[M].天津:南开大学出版社,1990:507-527. (HU G D, ZHANG R C. Multivariate Data Analysis Method: Pure Algebra Processing [M]. Tianjin: Nankai University Press, 1990: 507-527.)
[25]MOOIJ J, JANZING D, PETERS J, et al. Regression by dependence minimization and its application to causal inference in additive noise models [C]// ICML 2009: Proceedings of the 26th Annual International Conference on Machine Learning. New York: ACM, 2009: 745-752.