基于最大似然的网络拓扑推断技术研究(二)

2016-08-10 06:33张润生
数字通信世界 2016年7期
关键词:子树样本容量假设检验

王 黎,张润生

(中国电子科技集团公司第五十四研究所,石家庄 050081)

基于最大似然的网络拓扑推断技术研究(二)

王 黎,张润生

(中国电子科技集团公司第五十四研究所,石家庄 050081)

(接5月刊)

3.2 广义似然比算法

我们可以通过广义似然比(GLRT)算法[15]构造假设检验来推断两个样本集合的总体均值是否相等。设有两个正态总体f1,f2,均值分别为μ1,μ2,方差为σ12,σ2

2,来自两个总体的抽样集合为S1={x1i,i=1,…,m},S2={x2i,i=1,…,n},样本容量分别为m,n,可以构造如下假设检验

H0: μ1= μ2= μ , H1: μ1≠ μ2(3)

则样本数据关于参数集合{μ1,μ2,σ1,σ2}的似然函数为

假设σ1

2= σ2

2= σ2得到

在假设H1下,似然函数可以用(5)式表示,可得μ1,μ2,σ2的最大似然估计为

将(6),(7),(8)式代入(5)得

在假设H0下

由(9)可得μ和σ的最大似然估计为

可得广义似然比为

在假设H0下

可得

3.3 算法步骤

1)将所有叶子节点看成子树,即令S=D;

3)通过GLRT算法判断{ i , j }的合并方式,将{ i , j }合并成子树k,更新集合S,S=S{ i , j }k;

4)如果集合S中元素个数为1,则结束,否则返回步骤2)。

4 性能分析

通过分析第三节提出的算法,可以发现树状拓扑推断的正确概率由两方面决定,一是最相关子树寻找正确的概率;二是子树合并方式判断中假设检验的正确概率。

由于叶子节点相关性满足单调性,因此在理想情况下,寻找最相关子树不会发生错误,而实际中由于节点相关性测量误差的存在,在测量样本容量不大或者测量样本集合中存在较多野值时,最相关子树的寻找则可能发生错误,我们假设在序贯合并过程中,每次寻找最相关子树的平均错误概率为γ,则随着样本容量。

在判断子树合并方式的假设检验时,我们给定显著性水平为α,即检验犯第一类错误的概率(即两节点是同一节点的情况下,判定为非同一节点的概率)为α。下面我们推导犯第二类错误的概率(即两节点不是同一节点的情况下,判定为同一节点的概率),(14)(15)(16)式都是在假设H0的条件下得出,而在假设H1成立的条件下,设δ=μ1-μ2,则有

可得

通过分析可得,整个序贯合并过程需要寻找最大相关子树Nr-1次,需要进行M-1次的假设检验,其中Nr为叶子节点个数,M为真实拓扑中内部节点个数。因此,基于假设检验的序贯拓扑推断算法的正确推断概率。

(未完待续)

The Technology of Topology Based on Maximum Likelihood (II)

Wang Li, Zhang Runsheng
(The 54th Research Institute of CETC , Shijiazhuang Hebei 050081, China)

10.3969/J.ISSN.1672-7274.2016.07.009

TN911 文献标示码:A

1672-7274(2016)07-0022-02

猜你喜欢
子树样本容量假设检验
一种新的快速挖掘频繁子树算法
广义书本图的BC-子树计数及渐近密度特性分析*
采用无核密度仪检测压实度的样本容量确定方法
书本图的BC-子树计数及渐进密度特性分析∗
基于覆盖模式的频繁子树挖掘方法
统计推断的研究
双幂变换下正态线性回归模型参数的假设检验
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
统计学教学中关于假设检验问题探讨
广义高斯分布参数估值与样本容量关系