基于相空间的社交网络舆情智能化检测方法

2019-06-06 01:19周红志冯莹莹刘红梅
关键词:相空间舆情重构

周红志,于 干,冯莹莹,刘红梅

(阜阳师范学院 a.信息工程学院;b.实验实训管理中心,安徽 阜阳 236041)

随着社交网络规模的不断扩大,社交网络的信息量与日俱增,社交网络作为人们交流和信息共享的重要平台,社交网络上的舆情一定程度上反映和网络用户的心声,需要对社交网络舆情进行准确检测,引导积极的舆情,杜绝消极舆情和谣言[1-2]。研究社交网络的舆情检测方法对促进网络的健康发展方面具有重要意义[3]。

对社交网络的舆情智能检测算法研究是建立在对社交网络的用户群体信息挖掘和时空位置信息感知基础上,结合大数据信息处理技术,加强主动检测的性能。当前,典型的算法主要有模糊网格舆情智能检测方法、博弈论的舆情智能检测方法、关联规则舆情智能检测方法等[4-5]。社交网络舆情中的采样时间序列是一组非平稳和相位随机序列,结合社交网络舆情序列的统计分析方法,能提高社交网络舆情智能化检测的信息处理和统计特征信息分析能力,从而确保网络安全和健康。文献[6]中根据社交网络舆情数据,构建非线性时间序列分析模型,利用概率熵获取定量递归图,完成对社交网络舆情的检测检测,但该方法无法保障舆情数据爆炸式增长条件下的检测精度。

针对上述问题,本文提出一种基于相空间重构的社交网络舆情智能化检测方法。实验结果验证了改进方法针对舆情检测的有效性和可行性。

1 社交网络舆情相空间的重构

1.1 基于非线性时间序列分析的舆情数据处理

社交网络舆情数据可以按照非线性时间序列的形式进行处理,引入非线性时间序列分析方法,能够较好的实现对社交网络舆情数据的检测、统计及分析。通过采集社交网络舆情的关联性特征量,分析社交网络舆情的发展趋势,完成对社交网络舆情的准确检测和信息分析,从而实现社交网络舆情的智能检测[7]。基于相空间重构的社交网络舆情非线性时间序列分析流程如图1所示。

利用非线性时间序列分析社交网络舆情采样统计序列的关联特征量,在多个网络空间环境下,根据社交网络用户的位置和时间信息,采用联合估计方法进行干扰抑制[8],为了使得社交网络舆情采样统计序列离散数据离散解析化,结合相位重构和统计分析重组方法,得到社交网络舆情采样统计序列的解析模型:

图1 基于相空间重构的社交网络舆情时间序列分析流程

式中,x(t)为社交网络舆情采样统计序列的实部,y(t)为社交网络舆情采样统计序列的虚部,a(t)为社交网络舆情数据的向量幅值,干扰项采用n(t)表示,采用相空间重构方法,对社交网络舆情数据进行相位随机化处理[9]。处理步骤描述为:

Step 1:对社交网络舆情采样统计序列进行时频特征分解和小波尺度变换[10],得到x(k)。

Step 2:测量社交网络舆情采样统计序列的关联信息特征,用{xn}表示单变量社交网络舆情的分布时间序列,引入ARMA(autoregressive moving average)特征估计算法,再对关联信息特征相位进行随机离散化处理[11],处理结果用x′(k)表示。

Step 3:考虑社交网络舆情采样统计序列的自相似性,采用多维空间重组方法对社交网络舆情采样统计序列进行特征分析[12],生成替代数据,对社交网络舆情采样统计序列的替代数据x′(k)求m维功率谱密度特征,得到x′(n)。

对采样序列进行非线性结构重组,得到

设Z=(U,V)由单分量社交网络舆情时间采样序列xi的统计平均值确定,在重构的相空间中提取社交网络舆情采样时间序列的统计平均值和信息熵,进行智能化检测的算法设计[13]。

1.2 相空间重构

假设U符合K分布函数,社交网络舆情模型的相空间重构模型为

参照舆情状态特征向量集,构造非线性舆情状态特征分布列,结合(5)知,且

其中,G(U|μk,Σk)为社交网络舆情分布的统计平均值,对社交网络舆情数据序列进行特征重组,在重组的特征空间中任取一点Xn,社交网络舆情检测的状态转移方程表示为

上式中,s(n)表示社交网络舆情数据的矢量,对社交网络舆情检测的统计概率密度函数为

计算社交网络舆情采样统计序列的位置信息序列特征

其中,xn表示社交网络舆情采样统计序列的非线性时间序列,d表示相空间重构的延迟,对于Φ:M→R2d-1,通过社交网络舆情监测,根据用户的社会关系构建社交网络用户节点的时间和位置联合分布模型,构造混合核函数和全局核函数进行社交网络的舆情动态检测[14],舆情智能检测的控制目标函数为:

2 舆情检测算法优化

2.1 特征提取

在上述相空间重构的基础上,进行社交网络舆情检测优化设计,提出一种基于相空间重构的社交网络舆情智能化检测方法。采用混沌非线性时间序列分析方法进行社交网络舆情采样序列的回归分析[15],采用支持向量机方法进行社交网络舆情的状态评估和标准性对比,完成舆情智能检测[16]。社交网络舆情检测的混沌概率分布模型为

其中

提取社交网络个性化偏好数据的规则性行为特征量为x(t),t=0,1,…,n-1,考虑用户的社会关系,利用邻近用户的舆情信息进行线性预测,得到社交网络舆情特征分布的网格区域函数为

其中,c1和c2分别表示观社交网络舆情采样统计序列的行为特征系数和签到系数,Length(C)表示相空间重重构信息长度,Area(inside(C))表示社交网络的覆盖区域的大小,考察社交网络舆情采样统计序列的时间分布特性,利用时间段之间的相似度构建局部核函数进行舆情的相似性预测,表达式为:

其中,Kpoly=[(xxi)+1]2表示地点类型集合核函数,表示舆情采样统计序列的相空间核函数。根据平滑处理后舆情特征分布进行模糊聚类处理[17],得到舆情智能检测的聚类输出

式中,f1g(z)表示用户空间相似性特征量,对采集的社交网络舆情采用判决反馈均衡调节方法进行社交网络舆情统计特征量混频处理,提取社交网络舆情的统计信息特征量[18],为舆情检测提供输入数据基础。

2.2 舆情智能化检测

分析社交网络舆情输出序列的叠加波,此时对第k+1段社交网络舆情采样时间序列的检测问题可以描述为:

式中τ'为一未知量,在相空间中进行舆情特征序列的关联规则重组,这一实现的过程描述为

其中,[Vmin,Vmax]是社交网络模糊舆情智能检测的特征分布区间,在关联规则约束控制下,考虑用户评分的相对误差,采用支持向量机方法进行社交网络舆情的状态评估和标准性对比,得到社交网络用户舆情的标准性对比结果为

其中,bj(ot+1)表示社交网络舆情轨迹跟踪的相似性特征集,βt+1(j)表示用户节点的个数,aij表示社交网络舆情智能检测的模糊测度信息,计算用户时空相似性方差δ2,并判断δ2<H是否成立,得到社交网络智能舆情智能检测的回归分析模型

选取权值最大的谱峰值作为基函数,采用较小阈值寻优方法得到最优匹配参数x(t)∈L2(R),社交网络舆情分布的线性输出满足,K(xi,xj)=1,结合用户名属性提取社交网络用户的跨层属性特征集[19],社交网络的融合性舆情智能检测问题转换为如下的最小二乘问题:

从而得到社交网络舆情序列的检测值为:

综合上述算法步骤,完成了基于相空间的社交网络舆情智能化检测方法的研究。

3 实验结果与分析

为了验证基于相空间的社交网络舆情智能化检测方法的有效性,实施一次仿真实验,社交网络舆情统计序列采样的长度为2 000,训练样本集为3 000,舆情聚类的分布空间为4,相空间重构的嵌入维数为5,重构时延为13,用户节点相对位置dPR,PT=3,dST,PT=1,dPR,ST=2,dSR,PT=1,对社交网络舆情数据通过相空间重构方法迭代10 000次,初值取x0=2,y0=2,z0=2,参数[σ,r,b]=[10,28,8∕3],根据上述仿真参量设定,进行社交网络舆情检测,得到原始采样序列如图2所示。

以图2数据为研究对象,进行相空间重构,得到重构参数计算结果如图3所示。

取最佳嵌入维数为3,提取社交网络舆情的统计信息特征量,采用支持向量机方法进行社交网络舆情的状态评估和标准性对比,结果如图4。

根据图4可得,改进方法能有效预测社交网络舆情分布,社交网络舆情的轨迹在相空间中得到有效展开,提高了检测能力,测试不同方法进行社交网络舆情智能检测的精准度,实验对比结果如表1。对表1进行分析得知,改进方法进行社交网络舆情智能检测的准确性较高。

图2 社交网络舆情原始统计序列

图3 相空间重构的嵌入参数

图4 相空间重构结果

表1 舆情智能检测精度对比

4 小结

提出一种基于相空间重构的舆情检测算法,采用社交网络舆情采样序列的非线性处理方法重新构建相空间,采用混沌非线性时间序列分析方法进行社交网络舆情采样序列的回归分析,对采集的社交网络舆情采用判决反馈均衡调节方法进行社交网络舆情统计特征量混频处理,提取社交网络舆情的统计信息特征量,采用支持向量机方法进行社交网络舆情的状态评估和标准性对比,在重构的相空间中实现社交网络舆情智能化检测。研究得知,采用该方法具有很好的检测效果,社交网络舆情的轨迹在相空间中得到有效展开,提高了检测能力,检测精度较高。

猜你喜欢
相空间舆情重构
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
北方大陆 重构未来
北京的重构与再造
消费舆情
舆情
舆情
非对易空间中的三维谐振子Wigner函数
舆情
相空间重构和支持向量机结合的电力负荷预测模型研究