基于LabVIEW的数据分析技术研究

2020-01-15 05:31惠国娟吴从焰
航天制造技术 2019年6期
关键词:数组测试数据正态分布

惠国娟 徐 雷 吴从焰 江 晨

(上海航天精密机械研究所,上海201600)

1 引言

LabVIEW 是建立在Windows 基础上的图形化仪器开发系统,是目前应用最广、功能最强的图形化软件,广泛用于测试系统的开发。测试数据是测试系统运行后采集或计算得出的数据,随着测试数据的长时间积累,对数据的统计分析必要性愈显。在数据分析中,数据的波形显示因其可视性和直观性而成为必不可缺的部分。波形显示的形式多种多样,LabVIEW 软件本身提供了现成的波形显示控件,应用软件对测试系统产生的测试数据进行处理,并得到可用于波形显示的输入数据,将使数据分析更加便捷高效。数据分析中通常根据需要应用各种波形图来显示数据特性,如数据散点图、直方图、正态分布图,使用LabVIEW软件自带的波形显示控件及数学概率分析统计函数,通过函数与控件结合使用,可实现各种需求的波形图显示,从而实现数据的可视化分析。

2 数据的直方图生成

直方图,又称质量分布图,是一种统计报告图,是数值数据分布的精确图形表示。直方图在平面直角坐标系中,横坐标表示测试数据值,纵坐标表示数据出现的频次数。应用LabVIEW 生成数据直方图,将需要显示的一维数组转换为动态数组作为输入,选用函数中“数学”/“概率与统计”中的“创建直方图”函数,即可得到直方图显示输出,直方图生成程序设计流程如图1所示。以某一测试灵敏度直方图为例,程序生成的直方图如图2所示,测试数量共有206 个,直方图横坐标为灵敏度值,分布在-140~-130,纵坐标为每个数据子样对应出现的次数,从灵敏度直方图可看出,其中灵敏度为-137 的数据子样最多,依次为-138、-136、-135、-139,数据分布情况从图中一目了然。

图1 直方图生成程序设计流程图

图2 灵敏度直方图图样

3 数据的正态分布曲线生成

正态分布是一个在数学、工程等领域都非常重要的概率分布,在统计学上有着重要的意义。数据统计量在大样本时近似正态分布,正态分布公式为:,记为N(u,σ2),其中u为均值,σ为标准差,σ2为方差。正态分布曲线以u为对称轴,左右完全对称,σ体现了数据的离散性,σ越大,数据越分散,曲线越扁平,反之,σ越小,数据越一致,曲线越瘦高。使用正态分布曲线,可对不同批次的数据比对整体特性。

图3 正态分布曲线生成程序设计流程图

图4 灵敏度正态分布曲线图图样

以某一数据两个批次曲线生成为例,LabVIEW 正态分布曲线生成的程序设计流程如图3所示,选用函数中“数学”/“概率与统计”/“概率”中的“概率密度函数”,并选取函数中的正态分布函数。本函数用于计算符合给定u和σ的正态分布特性下,输入某一数据值,输出为对应的概率值。为了得到完整的曲线,程序需建立一个循环,输入批次某一数据的一维数组及批次数组的u和σ,经过正态分布函数后,循环后输出即为对应的概率输出数组。对两个批次数据的正态分布曲线绘制,只需运用两个循环,得到两个批次的概率数组,分别捆绑横坐标数组和批次概率数组,形成两条曲线作为波形输入,即得到两个批次的正态分布曲线。以某一测试灵敏度正态分布曲线图为例,如图4批次正态分布曲线图所示,实曲线(本批次)比虚曲线(前批次)中心点更小(即均值更小),曲线更狭窄(即标准差σ更小),因此,本批次数据比前批次数据整体略偏低,本批次数据比前批次数据离散性更小,数据一致性更好。

4 数据的散点图生成

散点图是指在回归分析中,数据点在直角坐标系平面上的分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形。它可以揭示格网上所绘制的值之间的关系,还可以显示数据的趋势,当存在大批量或多批次数据时,散点图的作用尤为明显。

4.1 单批次数据散点图生成

单批次数据散点图生成程序设计流程如图5所示,将需要显示的数据整理提取为一维数组后,数据以一维数组形式作为输入,通过数组函数获取数组大小,即数据个数,再使用指标的最大值、最小值分别进行初始化数组操作,形成两条指标线数据数组,并和测试数据的数组整合后作为波形显示控件输入数组,输出的波形即为单批次数据散点图波形,散点图图样如图6所示,通过单批次数据散点图显示,可显示指标上下限、批次数据散点图,从而得出单批批次数据分布特性。

图5 单批次散点图生成程序设计流程图

图6 单批次数据散点图图样

4.2 多批次散点图生成

对多个批次数据以不同颜色按批次平铺显示,能更清楚得显示各批次特性及差异性。多批次数据分批次散点图通过LabVIEW 软件的实现,首先使用波形控件属性节点对波形y坐标范围进行设置(可取指标最大最小值作为坐标轴范围)。再对各批次数据进行处理,以某一项数据为例,先将各批次数据合并为一个一维全批次数组并计算数组大小,再取一个极大值(远超过坐标最大值作为无穷数组,此处取1010)初始化形成一个全批无穷数组,然后通过查找各批次数据在数组中的位置后进行各批次数据子数组替换,形成各批次曲线二维数组,再增加两条指标数据线,最终的二维数组作为波形控件的输入,此部分功能实现的程序设计流程如图7所示。

最后,在程序前面板对每个批次的波形曲线进行属性设置,包括曲线颜色、线条样式、线条宽度、点样式等均可分别设置,为了区分每个批次数据,可对每个批次的曲线进行不同颜色或不同样式设置,通过以上属性设置,运行软件后最终可得出如图8所示的多批次分批散点图曲线图样,通过各批次数据散点显示,可更直观地体现各批次数据的关联性、差异性等,从而为数据分析提供更详细的比对分析信息,从图中可看出某项数据共4 个批次的数据,每个批次以不同样式的散点显示,从图中可看出生7 批的数据一致性最好。

图8 多批次分批显示散点图图样

5 结束语

大批量测试数据的分析,关键在于对数据的处理,形成可用于显示的波形数据,本文针对基于LabVIEW如何生成不同需求的波形数据提出了实现方法,使用LabVIEW 结合数据提取技术对测试数据进行统计和分析,替代原来使用excel 对数据逐项绘图分析的方式,大数据处理分析效率得到较明显的提升,避免了不必要的人力投入,此方法在导弹测试数据分析中得到了广泛应用,并取得了较好效果,为产品质量评估提供了技术支撑,具有较高的应用价值。

猜你喜欢
数组测试数据正态分布
基于ID3决策树算法的大学生体能测试数据管理系统设计
JAVA稀疏矩阵算法
JAVA玩转数学之二维数组排序
生活常态模式
测试数据管理系统设计与实现
更高效用好 Excel的数组公式
基于自适应粒子群优化算法的测试数据扩增方法
空间co-location挖掘模式在学生体能测试数据中的应用
寻找勾股数组的历程
二项分布及其应用、正态分布