刘文昊
摘要:数学结构作为客观世界数量关系与空间形式的反映是有规律的。概率模型构造法为证明解题提供了新的途径。概率的研究起源于实际生活问题,目前广泛应用于各领域。概率论的发展凝结了数学家的心血。概率论在数学模型建立中有着重要的地位。
关键词:概率预测;网络数学模型
一、预测模型的建立
交叉概率预测就是依据某些事件间的相互影响进行分析,当某一事发生时其他事件受影响发生变化的方法。事件间相互影响关系常用矩阵形式表达,各事件变化程度用概率值描述。因此此法称为交叉影响概率法。
移动平均法是一种简单的适应模型,算术平均不能反映数据的变化趋势,原始数据可能是零散的。移动平均法克服了上述弱点。以N=5为例:
移动平均法重要的是移动周期N的选择,N为数据点数。
移动平均修匀后方差随N加大减少,N越大,对原始数据修匀力越强。
二、概率生成模型的网络数据分类
本节描述网络数据分类方法,探讨网络的概率生成模型,将未知类别节点的类别作为模型潜在变量,将网络视为模型观察变量,通过求解模型计算潜在变量取值,得到未知类别节点类别。
1.类别传播分布
网络概率生成模型是描述网络生成的概率模型。网络由节点间的边组成,网络概率生成模型需描述网络中边的生成过程,因此建立网络模型生成关键是给出2点间边的概率。
同质性程度高的网络中,大多相连节点类别相同。类别相同点间有边的概率较大,可用2节点描述边的概率。低同质性网络大多相连节点类别不同,2点间有边概率不因类别相同增大。本文考虑2节点相邻结论对2节点间有边概率的影响。若点Vi邻节点属Lc,点Vi有与类别Lc节点相连的趋势。Vi邻点中,属类别Lc的点越多趋势越强,本文用点Vi邻点类别与点Vj描绘点Vi与点Vj有边概率。点Vj类别是Lc,点Vi邻点属类别Lc点越多。点Vi与点Vj概率越大。
设有K各类别,点Vi有Ni邻点,Ni邻点有Nic各点的类别是Lc,点Vi邻点属类别Lc比为Nic/Ni记θic,向量为点Vi 的类别传播分布。记θi。
一点类别分布由点邻点类别决定,点类别传播分布表现点邻点属各类别的概率。点Vi类别传播分布中类别Lc对应分量θic大,说明Vi邻点属类别Lc概率大。如点Vj连类别是Lc,θic越大,点Vi与点Vj相连概率越大。本文就点Vi类别传播分布与点Vj类别描述点Vi与点Vj间有边的概率。点Vi与点Vj 间有边概率为点Vi类别传播分布在点Vj 类别的分量。
2.基于类别传播分布网络概率生成模型
网络数据用无向图G=
网络概率生成模型是描述网络生成过程的概率模型,网络由点间边组成,可将边作模型观察变量。通过描述网络中边的生成描述网络生成。本文概率生成模型将类别传播分布作模型参数。用类别传播分布描述边产生概率。点Vi与点Vj间边概率为Vi的类别传播分布在类别Lyj上的分量θiyj,2点间有边概率依赖其中一点类别。网络中存在部分未知类型的点。本文模型中将未知类别点类别作潜在变量。产生边前通过均匀分布抽取潜在变量取值。得到未知类别点类别。利用类别分布描述边生产概率。
在有N点与K点类别网中,从a为参数产生每点类别传播分布。对每未知类别点从[0,K-1]上均匀分布中产生整数,将其作该点类别索引。对点Vi与点Vj间边,从伯努利分布中产生。参数为点Vi的类别传播分布在类别Lyj上的分量θiyj
網络生成过程
y表示未知类别点类别索引组成的集合。联合概率分布为未知类别点是潜在变量,类别传播分布是参数,网络中边是观察变量,模型求解即通过观察变量计算潜在变量与参数取值。
用吉布斯采样方法需得到潜在变量后验概率,本文模型后验概率为其中y-u表示除点Vu外所有点类别索引。
结论:本文提出给予概率生成模型网络数据分类方法,提出传播分布概念,用以表现节点相邻点属各类别概率,用类别传播分布提出描述网络生成过程的概率生成模型。通过求解模型得出未知类别点的类别。
参考文献:
[1]郑炜,张科,汪芳等.概率预测的网络数学模型及其应用[J].计算机工程与应用,2014.45(18):59-61,69.