■赵金兰
本文通过对某单位90位职工的月薪、工作月数和受教育程度的数据信息,以回归分析方法中的最小二乘法为基础,以python软件为工具,比较细致地讨论了职工的月薪随工作月数和受教育程度的变化规律,建立了一元线性回归、二元线性回归和多元非线性回归模型,最后通过分析、比较和验证,确定了较理想的多元非线性回归模型,此模型为该单位优化人员结构,适时招聘适岗的从业人员研判提供了遵循和指导。
职工薪金与人员结构有着直接的关联,事关一个单位运营效率、经营效益。月龄大、经验丰富以及高学历者可担负重要岗位的重要工作,但需要支付的工资成本相对较高;次要岗位、一般性工作选择使用月龄小经验尚有欠缺以及学历较低者,即可保证完成其岗位需要的工作任务,也可节省一定的工资支出。优化配置合理的人员结构,按照成本至上的原则,优化学历结构和月龄结构,对有效控制运营成本,提高经营效率具有十分重要的意义。针对“追求高学历、倾向聘用有经验的老人、培养新人”等不同价值取向的用人思维导向,经过本数学模型的建立,对一个单位选人用人提供了比较科学的清晰的理论依据,根据本单位经济基础和发展目标较好地提出适时适岗适职适薪的招聘方案,有效规避不合理择人思维,也便于决策层执行层统一思想,提高工作效率。
具体假设如下:
1.月薪与工作月数和受教育程度存在相关性;
2.数据的记录是客观的。
在建立月薪、工作月数和受教育程度关系之前,符号做如下约定:
X1,X2是自变量,分别表示工作月数和受教育程度;Y是因变量,表示月薪的自然对数,为了描述方便,以下简称Y为月薪,其中X2的类型有大学学历和研究生学历及以上,是两分类的定性变量,也称为哑变量,定性变量进入模型首先要解决的问题是要把文字信息转化为数字信息,编码如下:X2=0(表示大学学历),X2=1(表示研究生学历及以上)。
在回归分析中,以一元线性回归为基础,然后推广到二元线性和多元非线性回归。在以下模型建立的过程中,首先构建一元线性回归模型,其次是二元线性回归模型,最后提升到多元非线性回归模型。
模型一:首先,利用p y t h o n和一元线性回归探讨月薪随单个因素的变化规律,建立模型为:
对月薪Y与工作月数X1利用参数的最小二乘估计做一元线性回归,p y t h o n运行结果为:
同样,对月薪与受教育程度做一元线性回归,python运行结果为:
β0=7.3451,β1=0.1159,由于R2=0.240,说明模型拟合效果很不理想,,因为,说明月薪与受教育程度没有明显的线性关系。
在模型一的讨论中,月薪与受教育程度没有明显的线性关系,故一元线性回归模型不能反应月薪与受教育程度之间的关系,说明月薪与多个因素相互关联,应由多个自变量的最优组合共同来预测或估计因变量将更有效,更切合实际。
模型二:在模型一的基础上,再利用python和二元线性回归分析讨论月薪与工作月数和受教育程度的关系,建立月薪与工作月数和受教育程度的二元线性回归模型为:
对月薪与工作月数和受教育程度利用参数的最小二乘估计做二元线性回归,python运行结果为:
二元线性回归模型只是我们自己的假定,Y与X1,X2之间是否真的存在线性关系,需要进行整体显著性检验和单个回归系数检验。下面构造F统计量,
来检验整体的显著性。
第一步 提出假设:
原假设:H0:β1=β2=0(Y与X1,X2之间的线性关系不成立,表示X1,X2不需要进入模型,要从模型中去掉)
备着假设:H1:β1≠0或β2≠0(Y与X1或X2之间的线性关系成立,X1或X2需要进入模型)
第二步 选取检验统计量:
即在原假设成立(β1=β2=0)时,统计量服从第一自由度为2,第二自由度为87的F分布。
第三步 计算检验统计量的实现值及值如下表所示:
方差分析表
其中,均方是平方和除以自由度,F值即为F统计量的实现值,是两均方的比值。
F=159.1,F的值增加了,且,说明整体的显著性也有所提高。另外,由python运行结果可知,在单个回归系数β1和β2的t检验中,p的值都等于0,也就是都小于0.05,所以认为X1及X2与Y的线性关系是显著的,说明回归方程是显著的。
为了进一步弄清楚月薪和工作月数之间是否存在着二元关系,对模型二进行修改。
模型三:通过对模型一、模型二不断深入地讨论,添加上自变量X1的平方项,建立一个多元非线性回归模型为:
在模型三的基础上分别加上自变量X2的平方项或自变量X1,X2的交叉项X1X2,分别建立一个多元非线性回归模型,从python运行结果来看,以及的系数对应的p值都大于0.05,且它们系数的置信区间都包含零点,说明职工受教育程度的二次项本身对他们的月薪没有显著影响外,还说明职工的工作月数和受教育程度无交互效应。其它参数的p值都小于0.05,且它们置信区间不包含零点。决定系数R2的值几乎不变,但F=178.8,F的值又有所下降,说明显著性又降低了。
经过分析对比上述模型可知,模型三:
最理想,表明只有职工的月数及其二次项和受教育程度本身对他们的月薪有显著影响。研究人员可以根据职工未来的工作月数及受教育程度,对职工未来的月薪进行预测。同时,人事部门可以核算成本,合理引进人才,进一步优化人员结构。
本文通过对某单位90位职工的月薪、工作月数和受教育程度的数据信息,所建模型只能较好的反映单位90位职工的情况,还有更多的提升空间。为了进一步提高模型的准确性和使用性,可以进一步细化受教育程度以及职工岗位级别,建立一个影响因素更多的多元回归模型。