陈雄新
(湖南环境生物职业技术学院 医学院,湖南 衡阳 421005)
用Excel建模做基于样本统计量的双因素方差分析法
陈雄新
(湖南环境生物职业技术学院 医学院,湖南 衡阳 421005)
在生态学与医学领域的科研工作中经常需要对实验数据做双因素的方差分析,在已知样本例数、平均数、标准差等样本统计量的前提下,如果利用Excel软件制作方差分析模板,可为研究者提供方差分析结果的方便快捷手段,同时,也为我们在审阅论文数据时,如何判断其结论的真实性提供了新方法.图7,表3,参5.
双因素方差分析;样本统计量;Excel建模;生态学研究;快捷分析与判断
在生态学与医学领域的科研工作中我们经常需要对实验数据做方差分析,尽管统计软件有许多,但是多需要提供原始数据.当我们在阅读科研论文时,经常遇到文中并没有提供原始数据仅列出了样本例数、平均数、标准差等样本统计量,而报告了方差分析的F值及其q检验结果的情况.那么,有没有一种方便快捷手段提供方差分析结果并判断其论文数据的真实性?笔者介绍一种基于样本统计量并利用Excel建模做双因素方差分析快速方法.
为探讨Rg1对镉诱导大鼠睾丸损伤的保护作用,研究者按照窝别把大鼠分成10个区组,然后将同一区组内的3只大鼠随机地分配到3个实验组,分别给予不同处理,一定时间后测量大鼠的睾丸的MT含量(μg/g),数据如表1所示[1].试比较三种不同处理对大鼠MT含量有无差别.
表1 三组大鼠MT含量值(单位:μg/g)
2.1双因素方差分析
打开一个Excel工作表的窗口,将原始数据按下图的方式列出,见A1-D11的格子,见图1.三组大鼠MT含量值的原始数据截图.
在Excel中其操作步骤为:①单击Excel 菜单“工具”栏,→选择“数据分析”功能项,→②选择“方差分析:无重复双因素分析”分析项,→单击“确定”按钮;③出现 “无重复双因素分析”对话框,在“输入区域”,选中包括原始数据A1-D11的所有格子,在标志位于第一行处打“√”,在“输出区域”,可任意选择某一区域,如果选中$A$16,单击“确定”按钮;④在被任意选中的$A$16区域出现无重复双因素分析结果,见图2[2].
图1 表1三组大鼠MT含量值的原始数据截图Fig.1 Original data screenshot of three groups of rats’ MT content value in tab.1
图2 表1三组大鼠MT含量值的双因素分析结果图Fig. 2 Two-factor variance analysis result of three groups of rats’ MT content value in tab.1
2.2双因素方差分析Excel模板的编制
2.2.1无重复双因素分析公式
对于随机区组设计的数据资料,一般使用原始数据进行双因素的方差分析,若仅给出各处理组的平均数、标准差,而未给出各随机区组的平均数和标准差时,无法完成双因素的方差分析,当给出各处理组、各随机区组的平均数和标准差时,则可以进行双因素的方差分析[3].参考公式如下:
MSb=k·sb2,
2.2.2“无重复双因素方差分析”模板的编制
第一步:输入样本统计量.在$A$18-$F$35区域输入各处理组的观察数、平均数、标准差;输入各随机区组的观察数、平均数、标准差;输入总例数、总平均数、总标准差;输入比较组数k、区组数b.见图3.
图3 各处理组、各随机区组及合计的观察数、平均数、标准差的模板图Fig.3 Template figure of every treatment group, every randomized block group and the total of observation, the mean and standard deviatio
第二步:建立“无重复双因素方差分析”的Excel模板.按照方差分析参考公式在$A$36-$F$41区域建立Excel分析模板,在$B$37、$B$38、$D$36、$D$37、$D$38、$D$39、$F$36、$F$37、$F$38、$F$39、$B$40、$B$41、$D$40、$D$41、$F$40、$F$41格子内按照以下公式编制:出现图4的分析结果,作为模板保存以备今后使用.
νz=B33*B34-1,
νcl=B33-1,
νb=B34-1,
νe=D36-D37-D38
MSz=F37+F38+F39,
MScl=B37*B34,
MSb=B38*B33,
MSe=(F30^2+F31^2+F32^2-F38)/(B33-1)
Fcl=F37/F39,Fb=F38/F39,
F0.05界值(cl) =FINV(0.05,D37,D39),
F0.05界值(b) =FINV(0.05,D38,D39),
P值(cl) =FDIST(B41,D38,D39),
P值(b) =FDIST(B40,D37,D39).
图4 双因素方差分析模板截图Fig.4 Template screenshot of two-factor variance analysis
第三步:建立“多个样本均数间的两两比较q检验”的Excel模板.在$A$43-$H$47区域按下列公式编制模板,见图5.
$C$45=E32-E30,
$C$46=E31-E30,
$C$47=E32-E31,
$D$45=SQRT((F39/2)*(1/B30+1/B32)),
$D$46=SQRT((F39/2)*(1/B30+1/B31)),
$D$47=SQRT((F39/2)*(1/B31+1/B32)),
$E$45=C45/D45,
$E$46=C46/D46,
$E$47=C47/D47.
图5 无重复双因素方差分析两两比较q检验模板截图Fig.5 Template screenshot of Q test by comparing each other
2.2.3“无重复双因素分析”模板的保存与应用
按上述方法可以列出更多组比较的数据,将模板适当命名后将Excel工作表文件格式保存,以便今后使用.下次在使用时只需要将待检验的样本统计量(各处理组、各随机区组及合计的观察数、平均数、标准差的模板样本例数、平均数和标准差)数据代入图3.各处理组、各随机区组及合计的观察数、平均数、标准差的模板中$A$18-$F$35区域以替换原来的相应数据,从图4双因素方差分析模板中就可立即得到数据更新后的方差分析结果.与此同时,从图5无重复双因素方差分析两两比较q检验模板中可得到相应的两两比较q检验结果.
3.1双因素方差分析与两两比较q检验结果的验证
如某厂医务室测定了10名氟作业工人在工前、工中、工后4小时三个不同时间的尿氟浓度(μmol/L),问氟作业工人在这三个不同时间的尿氟浓度有无差别[3],见表2.
表2 氟作业工人不同时间的尿氟浓度(单位:μmol/L)
经统计描述得出10名氟作业工人、在三个不同时间的尿氟浓度的样本统计量数据结果见表3.
将表3的10名氟作业工人、在三个不同时间的尿氟浓度的样本统计量数据中的各处理组、各随机区组和合计的观察数、平均数、标准差数据分别代入已经保存好的图3.各处理组、各随机区组及合计的观察数、平均数、标准差的模板图之单元格$B$19-$B$35、$D$19-$D$32、$F$19-$F$32位置处,马上出现双因素方差分析与两两比较q检验结果,见图6和图7.
表3 10名氟作业工人、在三个不同时间的尿氟浓度的样本统计量数据
图6 10名氟作业工人、在三个不同时间的尿氟浓度双因素方差分析结果Fig.6 Results of two-factor variance analysis from 10 fluorine workers in three different time of urinary fluoride concentration
图7 10名氟作业工人、在三个不同时间的尿氟浓度两两比较q检验结果Fig.7 Results of Q test by comparing each other from 10 fluorine workers in three different time of urinary fluoride concentration
本文通过两个实例论证并说明了在生态科学与医学领域科研中基于样本统计量之下的随机区组设计双因素方差分析的Excel建模运用结果.其应用前提是使用者必须对统计学基本概念和基本方法以及Excel的基本功能都有所了解.当我们学会利用Excel公式编辑功能的这一方法后,尤其是学会自己编制单因素与双因素分析方差分析的模板后,将为我们在科研中节约时间;更为重要的是它还可以帮助我们对科研论文中仅仅提供样本统计量所做的方差分析结果的可靠性做出迅速判断;利用Excel软件还可以快速和批量地做χ2检验[4],t检验[5]、u检验和相关分析等;而且利用Excel软件它可以与Word、SAS、PowerPoint、FoxPro和SPSS等软件之间进行数据的交换,使之发挥更多的作用.
[1] 陈雄新.医学统计学[M] 北京:北京出版社,2015.
Chen Xiong-Xin,editor.Health Statistics [M].Beijing: Beijing House,2015.
[2] 陈雄新.利用Excel软件做统计描述和方差分析的方法[J].湖南环境生物职业技术学院学报,2008,(3): 17-19.
Chen Xiong-Xin.By Using Excel Software to Do Statistical Description and Analysis of Variance Method [J].Journal of Hunan Polytechnic of Environment and Biology,2008,(3):17-19.
[3] 贺石林,陈修.医学科研方法导论[M].北京:人民卫生出版社1998.
He Shi-Lin,Chen Xiu.editor.[M].Beijing: People's Medical Publishing House,1998.
[4] 陈雄新.Excel在t检验中的实用技巧[J].实用预防医学,2006,(1) :202-205.
Chen Xiong-Xin.Excel in Test and Practical Skills [J].Practical Preventive Medicine,2006,(1) :202-205.
[5] 陈雄新.Excel在四格表χ2检验中的应用技巧[J].现代预防医学,2006,(10): 1 667-1 670.
Chen Xiong-Xin.The Application of Excel in Four Table Chi-square Test Techniques [J].Modern Preventive Medicine,2006,(10): 1 667-1 670.
Biography:CHEN Xiong-xin,born in 1964,male,professor,medical statistics and epidemiology.
Using Excel Modeling to Make Two-Factor Variance Analysis Based on Sample Statistics
CHEN Xiong-xin
(Hunan Polytechnic of Environment and Biology Hengyang 421005,China)
In the scientific research of ecology or medicine,we often need to do two-factor variance analysis of the experimental data.Under the premise that sample cases,average,standard deviation and other sample statistics are known,if using Excel software to produce variance analysis template,it can provide researchers with convenient and efficient means of variance analysis as well as a new method for us to judge the authenticity of its conclusions while reviewing the paper data.7figs.,3tabs.,5refs.
two-factor variance analysis; sample statistics; Excel modeling; ecological studies; quick analysis and judgment.
2016-06-07
陈雄新(1964-),男,湖南长沙人,教授,研究方向:卫生统计学与流行病学.
2095-7300(2016)03-040-06
R195.1
A