庄亿农
方差是刻画一组数据偏离平均数程度的统计量.方差越大,数据的波动性就越大,数据就越不稳定.常用计算公式s2=[(x1-[x])2+(x2-[x])2+…+(xn-[x])2]来求数据x1,x2,…,xn的方差.由于公式中用到的数据较多,所以计算比较烦琐.下面,我们介绍几种简化运算的技巧.
一、简化计算公式
因为n[x]=x1+x2+…+xn,而(x1-[x])2+(x2-[x])2+…+(xn-[x])2=x12-2x1[x]+[x]2+x22-2x2[x]+[x]2+…+xn2-2xn[x]+[x]2=x12+x22+…+xn2-2[x](x1+x2+…+xn)+n[x]2=x12+x22+…+xn2-2n[x]2+n[x]2=x12+x22+…+xn2-n[x]2.所以s2=(x12+x22+…+xn2-n[x]2)=(x12+x22+…+xn2)-[x]2.从化简后的公式可以看出,这里数据的平均数没有参与到较复杂的运算中,这样就使计算过程大为简化,特别是当一组数据的平均数是分数时,利用这个公式求方差就更方便.如求数据3,-1,2,1,-3,3的方差时,先求其平均数[x]=(3-1+2+1-3+3)=,若用原公式计算方差,就会出现很多分数的平方,计算起来比较麻烦.但若采用化简后的公式,则s2=[32+(-1)2+22+12+(-3)2+32]-
2=-=,这样就避免了多次计算分数平方的情况.
二、数据加减后的方差
若一组数据x1,x2,…,xn的平均数为[x],方差为s2,把这组数据都加上同一个常数a,得到一组新数据x1+a,x2+a,…,xn+a,其平均数为[x]+a,方差为[(x1+a-[x]-a)2+(x2+a-[x]-a)2+…+(xn+a-[x]-a)2]=[(x1-[x])2+(x2-[x])2+…+(xn-[x])2]=s2,即方差不变.同样,把这组数据同减去一个常数a,得到一组新数据x1-a,x2-a,…,xn-a,其平均数为[x]-a,方差仍然为s2.利用方差的这个特点,可以简化方差的求解过程.比如求数据2 011,2 007,2 010,2 009,2 005,2 011的方差时,如果直接计算,运算量较大,容易出错,观察发现,可以先将每个数据减去2 008,得到一组新的数据3,-1,2,1,-3,3,再求这组数据的方差就很容易了.
三、数据放缩后的方差
若将一组数据x1,x2,…,xn(其平均数为[x])同时乘以m(相当于放缩),得到一组新数据m x1,m x2,…,m xn,其平均数显然为m[x],方差为[(mx1-m[x])2+(mx2-m[x])2+…+(mxn-m[x])2]=[m2(x1-[x])2+m2(x2-[x])2+…+m2(xn-[x])2]=m2s2,即将一组数据同时乘以m,其方差按照m2作相应的放缩.利用这个特征,一样可以简化方差的求解过程.如求数据18,-6,12,6,-18,18的方差时,可以先将每个数据乘以,得到数据3,-1,2,1, -3,3,易求得这组数据的方差为s2=,则数据18,-6,12,6,-18,18的方差为62s2=173.