史春薇,田 强,葛 骞,鲁传涛
基于SPSS统计软件在多元线性回归校验数据中的应用
史春薇1,田 强2,葛 骞3,鲁传涛4
(1. 辽宁石油化工大学,辽宁 抚顺 113001; 2. 中国联合网络通信有限公司抚顺市分公司,辽宁 抚顺 113006;3. 中国石油抚顺石化公司乙烯化工厂,辽宁 抚顺 113006; 4. 中国石油抚顺石化公司石油三厂,辽宁 抚顺 113001)
SPSS软件应用余多元线性回归在因素分析、统计预测、调整混杂因素等方面应用有着较好的使用效果。本文针对科技期刊编辑在校验科技论文数据时的困难,介绍了SPSS 统计软件的功能及基本使用方法, 并举例说明了SPSS统计软件多元线性回归在科技期刊校验数据中的应用。
多元线性回归;SPSS软件;科技期刊;校验数据
在科技期刊刊载的科技论文中, 很多都涉及到数据处理的内容[1-4],其中大部分的数据处理都要用到与统计学相关的学科的知识,对于这些数据的真伪验证一般是由外审专家把关[5,6],但是论文一旦送审,就涉及相关费用,如果数据是假的,那么外审必然无法通过,就浪费了专家的时间和编辑部的经费。因此,科技期刊编辑应该学会利于统计学软件来验证数据的真伪,在初审阶段就把有问题的论文作退稿处理,这样就节省了期刊的费用和专家的宝贵时间。
传统的SAS、SATA 等软件都需要编程,对于非计算机专业的人员来说,学起来很吃力,但是SPSS软件客服了这些原有软件的不足,只需按照操作说明进行比较简单的电脑操作,在一分钟之内就能得到对论文中数据的分析结果,从而判断数处理的真伪,将SPSS软件应用于科技期刊的校验数据,编辑人员易学好用,非常适宜[7]。
SPSS 软件集数据整理、分析过程和结果输出等功能为一体。采用窗口操作界面, 统计分析方法涵盖面广, 用户操作使用方便, 输出数据表格图文并貌。
变量名应遵循下面几条原则:
(1)变量的首字符必须是英文字母,其后可为字母、数字、“_”及“.”, “_“可以放在最后,“.”不可放在最后。
(2)变量名不能使用SPSS 的保留字。SPSS 的保留字有: AND, all,OR, not, IQ, TO ,AB, GT, le,LT, BETWEEN, WITH 及一些常用的函数符号等。
数据录入就是把原始的数据录入到数据文件的二维表格中,数据录入界面如图1所示。
图1 数据录入界面
设与因变量有关的自变量有个, 记为1,2, …,。则多元线性回归方程为:
=0+11+22+···+T
其中,0,1,2,···,为待定系数。
图2 多元线性回归对话框
SARS的产生和蔓延对亚洲乃至全世界的经济、社会、文化、医疗卫生、新闻舆论等方面都产生了巨大的影响,从这个病例中,全人类都学习到了重要的经验和教训,即要认真地、定性、定量地认识和研究病毒的传播方式、传播途径和传播规律,从而为预测和控制病毒及传染病的蔓延创造条件的重要性,作为科技期刊,有义务发表这种有意义的论文。
例:2003年,北京地区6月3日—6月23日SARS病人的情况感染、治愈、死亡和出院的人数情况。请依据具体数据对SARS 的传播建立数学模型。
解:设回归方程为:=0+11+22+33,用SPSS 统计软件进行统计分析如下:
第一步: 单击SPSS的Analyze,打开,单击Regression,弹出二级菜单,找到Linear,然后单击图标,弹出Linear Regression对话框,如图2所示。
第二步: 将图2中的bloodsi调入Dependent下的矩形框, 将变量hairsi调入Independent下的矩形框。Method中选择Enter, 把选择的自变量全部代入方程。
第三步:点击图2的stat ist ics按钮, 弹出Linear Regression: stat ist ics对话框。
第四步:1.在图2中选择Estimates;2.选择Model fit,给出复相关系数、决定系数2及方差分析结果。将变量调入Dependent下的矩形框, 将变量1、2、3输入 Indepentent 下的矩形框,点击OK按钮, 回归系数见表1,其中为概率。
表1 多元线性回归系数表
从表1中可知:0=-686.130,1=1.769,2=-0.005529,3=1.532。回归方程为:= - 686.130 + 1.7691- 0. 0055292+ 1. 5323与文献[8]中的结果相符,说明结果正确。
SPSS软件的统计功能强大, 在科技期刊校验数据方面应用的较多, 与手工计算相比, 能大量节省编辑的工作时间, 极大地提高工作效率, 且结果更为精确。综上所述,在科技期刊的编辑中推广使用SPSS软件进行统数据的校验,有比较大的意义和价值。
[1]将王健,戴琳,李克春. 气象观测站调整问题的实证分析[J].科学技术与工程,2011(25):20-23.
[2]刘洋,亢新刚,郭艳荣,等. 长白山主要树种直径生长的多元回归预测模型:以云杉为例[J].东北林业大学学报,2012(2):3-6.
[3]谢秀红. 统计软件SPSS在石油测井行业中的应用[J].科技创新导报,2011(34):74-74.
[4]张红兵. SPSS 宝典[M].北京:电子工业出版社,2007.
[5]杜志渊.常用统计分析方法[ M ] . 济南: 山东人民出版社,2006.
[6]杜志渊.常用统计分析方法[ M ] . 济南: 山东人民出版社,2006.
[7]朱伟.SPSS统计软件在科技期刊编辑中的应用[J].辽宁石油化工大学学报,2005,25(3):76-79.
[8]潘淑霞, 孙王杰, 张若东.用SPSS实现多元线性回归在疾病预防中的应用[J].吉林医药学院学报,2007,28(1):39-39.
Application of SPSS Statistics Software in Multiple Linear Regression Calibration Data
1,2,3,4
(1. Liaoning Shihua University, Liaoning Fushun 113001,China; 2. China United Network Communications Corp. Fushun Branch,Liaon Fushun 113006,China; 3. PetroChina Fushun Petrochemical Company Ethylene Plant,Liaoning Fushun 113006, China; 4. PetroChina Fushun Petrochemical Company No.3 Refinery, Liaoning Fushun 113001, China)
SPSS software has better use effect to factor analysis, statistical forecasting, and adjustment for confounding factors in multiple linear regressions. In this paper, according to the difficulty of data check for science and technology papers of sci-tech journals, SPSS statistics software function and basic using method were introduced, and application of SPSS statistical software in multivariate linear regression in science and technology periodical data check was discussed.
Multiple linear regression; SPSS software; Sci-tech periodical; Calibration data
TQ 115.6
A
1671-0460(2014)06-1112-02
抚顺市科学技术发展资金计划项目(FSKJHT201255)。
2013-11-26
史春薇(1981-),女,辽宁抚顺人,编辑,硕士,2007年毕业于上海大学无机化学专业,研究方向:从事化学信息技术工作。E-mail:c08271827@126.com。