胡霖
摘 要: 针对大数据下的人力流动区域的估算问题,提出基于大数据分析的人力流动区域估计仿真模型。引进了K近邻非参数估计仿真模型,對大数据背景下的人力流动区域进行标准估算。同时能够对K值进行预留计算,避免大数据干扰的发生,优化了分类近邻子集生成模块,有效地提高了估算能力以及估算的范围,对人力流动区域的估算准确性有极大的帮助。并进行实验分析,由实验分析可知,提出的方法能够准确地对人力流动的区域进行系统的估算。
关键词: 大数据分析; 人力流动区域; 估计模型仿真; K近邻非参数估计
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)24?0074?03
Abstract: In allusion to the estimation problem of human resource flow region under the background of big data, an estimation simulation model based on big data analysis is proposed for human resource flow region. The K?nearest neighbor nonparametric estimation simulation model is introduced to perform standard estimation of human resource flow region under the background of big data. The K value is reserved for calculation to avoid the occurrence of big data interference. The classified nearest neighbor subset generation module is optimized to effectively improve the estimation capability and estimation range, which is of great help to the estimation accuracy of human resource flow region. The experiment was carried out. The experimental analysis results show that the proposed simulation model can perform systematic estimation of human resource flow region accurately.
Keywords: big data analysis; human resource flow region; estimation model simulation; K?nearest neighbor nonparametric estimation
0 引 言
人力资源在区域内流动可以推进该区域的经济发展以及城市化建设,而人力资源的流动过程又会产生一定的流动副产品[1?2],人力资源的流动可以提高区域劳动力以及区域的文化交融水平,极大地刺激了物质文化的各个领域。所以,需要利用大数据分析的方法对区域人力资源的流动情况进行预计以及估算[3?4],这样可以有效地根据人力资源的流动情况进行资源的预计调配以及优化使用。
在人力资源的流动过程中,人力资源本身是一种资源的数据概括量,具有很大的流动性以及不确定性。通过使用大数据的分析方法能够对人力资源的流动进行属性定位以及条件限制[5],这样便可以使用对应的数据估算方法进行系统的预算[6?7]。传统的数据模型由于使用过程中需要对数据采集分量进行设置,所以使用起来比较复杂。因此,提出基于大数据分析的人力流动区域估计仿真模型系统,使用K近邻非参数估计仿真模型对人力资源的流动进行估算,避免了使用数据采集分量的可能性。为了检验本文设计的基于大数据分析的人力流动区域估计仿真模型的有效性,设计了对比仿真试验,通过实验可以证明,改进的估计仿真模型,能够有效准确地对区域人力资源的流动进行估计。
1 人力流动区域估计模型设计方案
1.1 仿真模型硬件设置
本文设计的基于大数据分析的人力流动区域估计仿真模型,其硬件设计的结构主要有三层,由于人力资源数据是一个非线性序列,设计的三层结构可以对非线性序列进行一定的处理计算。第一层是人力资源大数据的采集层,为了减少计算的复杂程度,运用SIYB采集系统;第二层为数据运算处理层;第三层为数据存储层。除此三层结构以外,仿真模型中还包括电源系统、控制系统、显示模块、入录模块以及认证识别模块。设计的基于大数据分析的人力流动区域估计仿真模型结构图如图1所示。
1.2 引进K近邻非参数估计仿真模型
基于大数据分析的人力流动区域估计仿真系统适用于K值近邻参数的估算方法,可提高数据采集的准确程度,同时避免了采集过程中采集分量设置。近邻参数公式如下:
式中: 为大数据的趋势度;为大数据的采集分量;为采集数据的规模参量;为规划数据参量;为预处理的假使参量。通过近邻参数的计算可以达到采集数据的条件限制,对大数据的参量进行估算前还需要对大数据的变量进行趋势预测,公式为:
式中:为恒定参数;为高趋势的起始量;为高趋势的终止量;是大数据的突变几率。经过上述的处理便可以进行K值的近邻非参数的估算,公式为:
式中:表示数据的流动变化参量;表示数据特征的附属函数;是限制数据的坐标参量;表示数据预计结果;是数据的轴向系数;为数据的采集走势。endprint
1.3 近邻子集的优化设计
为了保证本文设计的基于大数据分析的人力流动区域估計仿真模型计算的准确性,优化了近邻子集。近邻子集是对数据使用条件限制,能够有效解决数据干扰的问题,优化过程为:
式中:为残差序列;为限定误差修正项;反映变量之间的数位差;是衡量变化大小的参数。对近邻子集的误差修正为:
式(5)是为大数据进行一阶差分计算。这样可以对人力流动的区域进行选集的设定,引入了修正后的子集时间,保证计算的准确性,公式为:
经过优化的邻近子集满足时间条件的限制,能够提高计算的准确性,同时完善了本文设计的基于大数据分析的人力流动区域估计仿真模型的限定能力。
1.4 构建F统计量
构建F统计量能够保证仿真模型的估算过程中不会受到参数的过度限制,这样有助于本文设计的仿真模型的参量计算,由于大数据区域估算具有一定的随机性,因此构建了F统计量。预处理过程为:
式中:为F值波动起始量;为数据的随机参量;为模型适应参量。若系统模型的数据接收量的极限为,则模型接纳能力饱和。若为空集,那么模型将无法计算。F统计量集合限定条件为:
对集合进行限定,是保证设计的基于大数据分析的人力流动区域估计仿真模型能够在计算的过程中正常运行,对运行矩阵进行限定是保证数据采集准确性的关键,限定条件为:
式中:为人力流动饱和总量;为估计仿真模型的特征函数;为人力流动临近矩阵;为模型限定参数;为人力流动数据权重;为模型调整参数;为随机干扰函数。
根据不同情况需要对计算参量进行调整,参量变化条件是由决定,参量调整条件为:
通过上述的公式调整能够保证数据的有效性,通过对使用条件的限定保证了设计的模型能够正常的运作,限定的使用条件保证计算的准确性,参量的限定保证了设计过程能够更加精准地对人力流动区域进行计算。
2 仿真模型的实现
2.1 参数设定
根据上述仿真设定的参量以及环境设定,进行实验,结果分析如下。
2.2 结果分析
实验结果如表1所示。
分析表1结果得知,本文设计的基于大数据分析的人力流动区域估计仿真系统,避免了采集分量的限制,能够通过大数据分析出人力资源的变化趋势。
3 结 语
本文设计的基于大数据分析的人力流动区域估计仿真系统,引进了K近邻非参数估计仿真模型,对大数据背景下的人力流动区域进行标准估算,避免大数据干扰的发生,同时优化了分类近邻子集生成模块,有效地对人力流动区域进行划分,保证了人力流动区域的分配更加的完整,解决了传统估算方法的局限性。通过实验的数据可以证明本文设计的仿真模型能够准确的进行区域人力流动的估算。
参考文献
[1] 高昭昇,曹晋军,冯柳,等.基于大数据的传染病爆发、预测和预警等应用分析[J].中国卫生事业管理,2016,33(4):270?272.
[2] 王雪蓉,万年红.基于跨境电商可控关联性大数据的出口产品销量动态预测模型[J].计算机应用,2017,37(4):1038?1043.
[3] 朱轶婷,李霖,韩玉巧.基于大数据分析的多馆制图书馆文献资源典藏策略研究[J].图书馆工作与研究,2016,1(4):77?82.
[4] 王勇,董恒新.大数据背景下中国季度失业率的预测研究:基于网络搜索数据的分析[J].系统科学与数学,2017,37(2):460?472.
[5] 牛方曲,刘卫东.基于互联网大数据的区域多层次空间结构分析研究[J].地球信息科学学报,2016,18(6):719?726.
[6] 蒋小荣,汪胜兰.中国地级以上城市人口流动网络研究:基于百度迁徙大数据的分析[J].中国人口科学,2017(2):35?46.
[7] 邓中亮,张森杰,焦继超,等.CCF BigData 2015+222基于高精度室内位置感知的大数据研究与应用[J].计算机应用,2016,36(2):295?300.endprint