胡俊红
【摘要】随着网络技术的发展,数据库技术的发展也随之提高,而海量的数据系统使得大数据分类与处理显得尤为重要,而现有的数据统计分类方法存在一些缺陷,准确度以及效率都达不到要求,本文简要探讨基于概率统计下的大数据分类方法,希望可以对读者有一定的帮助.
【关键词】概率统计;大数据分类方法;微分方程;二项-泊松模型
大数据分类方法目前主要应用于故障诊断、情报检索以及识别信息等领域,而基于概率统计下的大数据分析主要是运用泊松模型以及概率密度估计和泊松微分方程等进行分析数据,通过特征值的计算,从而对大数据进行准确直接的分类,本文简要从大数据分类泊松模型进行简要叙述.
一、大数据分析二项-泊松模型
(一)二项-泊松模型概念及计算思路
进而通过柯西收敛性条件,求证大数据收敛性成立.
通过本文的介绍,可以看出基于概率统计下的大数据分类是一个较为复杂的过程,主要运用到二项-泊松模型以及各类微分方程以及行列式的计算统计方法,而模型的建立只是数据处理的步骤之一,概率统计下的大数据分类将是一件具有挑战性的事情,相信在不久的未来,大数据分类将会更加便利、准确,为数据分析和人类发展做出一份贡献.
【参考文献】
[1]刘俊,刘瑜,何友,等.杂波环境下基于全邻模糊聚类的联合概率数据互联算法[J].电子与信息學报,2016(7):1432-1438.
[2]于化龙,顾国昌,赵靖,等.基于微阵列数据的癌症分类问题研究进展[J].计算机科学,2010(1):116-122.