初冰茹 马用浩
摘要:随着我国正式进入经济与社会转型关键时期,各地区对科技人才的重视程度便不断提升,2017年以来我国多地出台的优秀高层次人才购房补贴政策便源于这种重视程度的提升,基于此,本文建立了四维度随机森林法回归分析框架,并应用随机森林法设计了天津市科技人才吸引影响因素的Logistic回归模型,希望由此确定的主要影响因素、提出的相关建议,能够为天津市的更好发展提供一定支持。
关键词:天津市;科技人才;随机森林法
中图分类号:C962 文献识别码:A 文章编号:1001-828X(2018)021-0477-03
前言
结合2018年初北京出台的“近十年最宽松的落户政策”、上海表态“要聚天下英才而用之”不难发现,我国各大城市的人才竞争激烈程度不断提升,2018年5月11日起实施的《天津市人才引进落户实施办法》也提出了一系列吸引优秀人才的政策优惠,而为了保证天津市能够在科技人才的竞争中拥有更出色表现、推动天津市长期可持续发展实现,正是本文围绕天津市科技人才吸引影响因素开展具体研究的原因所在。
一、四维度随机森林法回归分析框架
1.相关文献研究总结
城市科技人才吸引影响因素研究最早可追溯到上世纪70年代,Mobley建立的Mobley模型分析人才流动的影响因素属于其中典型,但结合现有研究笔者发现,不能够全面系统分析人才吸引力影响因素、地区性相关研究较少属于相关研究存在的不足,因此本文首先结合国内外研究总结了基础环境、事业环境、家庭保障、生活质量共四个维度的城市科技人才吸引影响因素,具体因素如下所示:(1)基础环境维度。治安环境与社会环境、生态环境(气候、自然条件、地理位置等)、基础设施条件(地方公共产品供给)。(2)事业环境维度。就业机会、产业与经济发展水平、创新氛围、企业文化、人员编制、市场化水平、知识溢出、培训机会、工作条件、管理机制。(3)家庭保障维度。住房条件、户籍政策、档案管理、配偶就业机会、收入水平、子女教育环境、家庭关系。(4)生活质量维度。交通环境、生活成本、生活舒适度、文化环境。
2.回归分析框架建立
结合现有研究与天津市实际,本文研究首先建立天津市科技人才吸引影响因素四维度分析框架,该框架由基础环境维度、事业环境维度、家庭保障维度、生活质量维度组成,精简后的影响因素如下所示:(1)基础环境维度。基础设施、生态环境、治安环境。(2)事业环境维度。产业发展、企业条件、职业发展。(3)生活质量维度。生活成本、交通状况、休闲娱乐。(4)家庭保障维度。收入水平、住房条件、户籍政策、配偶就业、子女教育。
考虑到天津市科技人才吸引影响因素研究涉及一定量经济问题,聚类分析、支持向量机算法、贝叶斯分类法等传统数据分类算法可能无法满足研究需要,因此本文选择了随机森林模型用于本文研究,该模型具备泛化性、拟合性、稳定性等特点,并能够实现多维度条件下连续与离散数据的同事处理,同时具备的分析各预测因子对分类影响的重要性能力也使得随机森林模型可更好满足研究需要。
基于随机森林模型的回归分析框架建立流程可描述为:“设定原始样本集T→利用独立分布的随机向量序列一通过K轮筛选训练、得到分类模型序列”,其中设定原始样本集为T、样本容量为N,并使用Bootstrap抽樣法抽取K个样本集,由此完成样本集中利用并生成随机向量决策树:
利用独立分布的随机向量序列则可以描述为:
由此结建立天津市科技人才吸引影响因素评价决策树模型:
模型中的X为筛选出来用来研究人才吸引力的影响因素自变量,而通过K轮筛选训练,可得出分类模型序列:
由此构建维度分类模型系统,即可应用公式:
进行最终分类结果的计算,公式中的hi、Y、CR=CI/R1分别为分类模型中单个决策树、输出的目标变量、随机森林组合分类模型,由此生成的随机森林便可以用于进行多维度复杂数据的分类,由此设原始样本集为T、样本容量为N,通过Bootstrap重复抽样法,即可得到K个样本集并构建K个回归树,同时未被抽到的样本需组成b个袋外数据集用于作为随机森林的测试样本集。设定叶节点的最小尺寸nodesize为5、一般参数定位为λmax,最终通过生成随机森林模型(b棵决策树组成)并运用袋外数据,可实现残差的预测:
二、变量设计与模型实证
1.样本数据与变量设计
本文研究使用的数据源于2017年天津市科技人才吸引影响因素调查问卷,问卷调查对象为天津市科技类企事业单位中高层管理人员、技术研发核心人才、高级技工三大类,调查共发放问卷1000份,回收985份,提出无效问卷与数据不完整问卷后,共获得967份有效调查问卷。此外,研究还确定了表1所示的天津市科技人才吸引影响因素变量解释及其统计描述,其中用虚拟变量进表示因变量是否具备吸引力,不具有吸引力的因变量赋值为0,具备吸引力的因变量赋值为1。
2.建模与实证分析
结合调查问卷数据开展统计、分析、筛选、测量、评价等一系列处理,即可了解各影响因素对天津市科技人员吸引的影响方式,因此本文选用了R-Plus软件中的Random Forest程序包中的Oufiler程序配合随机森林法开展分析,由此即可通过计算得出整体数据集异常点度量阀值与样本点,由此删除占全体样本总数0.93%的9个异常样本(剩余样本数为958个),根据随机森林法要求可以确定mtry 结合表2可发现,生产环境、住房条件、子女教育、配偶就业、产业发展、交通状况六方面因素对天津市科技人员吸引的影响较为显著,该影响可使用如下模型展示: 三、结果分析与相关建议 1.结果分析 结合上文研究,可确定住房条件、生态环境、产业发展属于天津市对科技人才吸引具有显著正向影响的要素,其中住房条件对天津市科技人才吸引的正向影响最强,系数估计值为2.201,这意味着天津市住房条件每增加1%,天津市对科技人才的吸引程度便能够提升2.201%,这种情况的出现与全国以及天津当地存在的房价飞涨现象联系紧密;而配偶就业、子女教育、交通状况则属于对科技人才吸引具有显著负向影响的要素,其中子女教育对天津市科技人才吸引的负向影响,系数估计值为-1.975,这意味着天津市科技人才子女接收良好教育的困难程度每提升1%,天津市对科技人才的吸引程度便会降低1.975%。值得注意的是,不显著变量对天津市科技人才吸引的影响均不显著,这是由于天津市治安水平较高、人们休闲娱乐要求不断提高等现状的影响。 2.相关建议 结合上述研究结果,本文建议天津市从住房保障、配偶就业、子女入学、生态环境、交通状况五个角度入手提升科技人才吸引力,2018年5月11日起实施的《天津市人才引进落户实施办法》、2018年5月16日发布的《天津市加快推进智能科技产业发展的若干政策》与《天津市“海河英才”行动计划》,便属于这类探索的典型,而结合现有经验,本文建议天津市进一步加大住房与租房补贴力度、放宽对科技人才配偶进入企事业单位的编制限制、降低科技人才子女入学难度、加大环境污染惩罚力度、加快交通路面改造与优化,由此即可为天津市的长期可持续发展实现提供有力支持。 四、结语 综上所述,围绕天津市科技人才吸引影响因素开展的研究具备较高现实意义,在此基础上,本文围绕住房保障、配偶就业、子女入学、生态环境、交通状况五个角度提出的相关策略建议,则提供了可行性较高的天津市科技人才使用效率提升路径,而为了进一步推动天津市发展,科技人才评价标准的完善、全面激励制度的建立也需要得到高度关注,这些都能够为天津市科技人才吸引力的提升提供有力支持。