郜攀峰
摘 要: 在高校毕业就业情况分析的过程中,由于数据量过于庞大,原有分析方法的分析结果精度较差。因而,文中提出基于大数据分析技术的高校毕业就业分析方法。采用大数据网络设定数据获取渠道完成数据采集工作,统一数据样本格式,制定数据处理流程,获得处理后的数据样本。采用大数据分析技术中的关联性分析方法,完成对高校毕业就业情况的分析工作。至此,基于大数据分析技术的高校毕业就业状况分析方法设计完成。设计调查问卷,选择数据处理设备,得到问卷调查结果,通过原有方法与此方法获得问卷分析结果。与原有分析方法相比,所设计方法分析精度更高。综上所述,此方法更适用于就业分析工作。
关键词: 高校毕业; 就业分析; 大数据分析; 数据采集; 关联性分析; 云计算
中图分类号: TN919?34; TP391 文献标识码: A 文章编号: 1004?373X(2020)18?0047?03
Abstract: As the amount of data is vast in the process of analyzing the employment situation of college graduates, resulting in the poor accuracy of analysis results in the original analysis methods, a method of the college graduates employment analysis based on big data analysis technology is proposed. The big data network is used to set the data acquisition channel, so as to accomplish data acquisition, unify data sample format, lay down data processing process, and obtain the processed data sample. The correlation analysis method in the big data analysis technology is adopted to complete the analysis of employment situation of college graduates. So far, the design of college graduates employment analysis method based on the big data analysis technology is completed. The questionnaire was designed and data processing equipment was selected to obtain the questionnaire results. The questionnaire analysis results are obtained by means of the original method and this method. This method has higher analysis accuracy in comparison with the original analysis method. To sum up, the designed method is more suitable for the employment analysis.
Keywords: college graduates; employment analysis; big data analysis; data collection; correlation analysis; cloud computing
0 引 言
分析高校畢业生就业状况,对于我国经济发展与就业市场的宏观调控至关重要。以高校就业情况为基础制定未来就业调控是维持我国就业市场规范化的重要手段[1?3]。
就目前毕业生数目庞大的现状,大数据分析最为适合分析毕业生就业情况。通过采用常用的软件对毕业生就业信息进行捕捉、管理以及处理,以此分析出毕业生的就业状况、就业方向以及决定就业的因素。在分析的过程中,采用大规模并行处理技术、数据挖掘方法、分布式文件管理、综合性数据库、云计算等技术,提高大数据分析的速度与质量,由此保证毕业生就业状况分析的精度与准确度[4?6]。
1 大数据分析技术的高校毕业就业状况分析方法
就高校毕业就业状况而言,每年高校毕业生数目庞大。采用普通的数据采集与处理手段无法对庞大的数据群进行精确分析。因而,采用大数据技术中的关联性以及大数据网络完成数据收集处理过程,并根据处理结果,完成对高校毕业就业的分析工作。就业状况分析流程如图1所示。
采用上述流程完成就业情况分析方法的设计工作,在设计中注重数据采集的完整度以及数据整合的规范性,以此为数据分析提供基础。
1.1 高校毕业就业状况数据采集
在此利用数据网络采集到的数据与各院校之间的公开数据库或大数据平台进行数据交换,丰富数据网络的数据内容。构建大数据网络中的信息挖掘数据库,对数据库内的信息处理整合。形成相应的数据样本,并对其进行输出汇总。大部分的就业信息通过专线完成数据的获取与交换。在此过程中,需运用众多渠道,其中包括政府公共数据发布、高等院校数据公开[7]、学信网数据统计毕业生就业协议数量及报道地点信息。部分信息获取渠道列举如图2所示。
科学应用上述渠道完成信息获取,通过采用其他方式采集来自其他系统的海量毕业生信息,设定相同的表名,保存至数据库中,结合由专线获取到的基础就业信息,作为高校毕业就业状况基础数据。
1.2 就业状况数据统计与处理
在此次数据处理的过程中,以数据库中的数据项为基础。由于就业状况的数据项较为复杂,采用数据项的基本项,描述毕业生就业的情况与方向。在数据项设计中需包含大量的毕业生个人信息,为保证处理后的信息符合此次设计,就数据项所含内容进行设定。具体内容如表1所示。
采用上述数据项设定后,对数据库内信息进行处理整合。通过数据清洗[8?9]、数据集成、数据变换[10]以及数据规约完成数据预处理。在预处理过程中,着重注意数据变换工作,将数据库中的多个数据源整合为一个数据形式,应用数据规范化处理,对数据库内的无效、错误数据清除,保证数据样本的有效性。
1.3 实现就业状况分析
通过上述的信息数据的预处理结果,采用大数据分析技术实现大学毕业就业状况分析。分析过程除大数据分析技术外,还需相应的设备实现分析工作,通过服务器获取数据库内部信息。在分析设备内安装多核处理器[11?13],实现数据的高度运转分析。采用此设备完成获取数据库信息及大数据中的关联性分析,并完成就业情况研究。应用关联性分析中的因子[14]分析方式研究其情况,将数据库中相关性高的数据构成一个基本分析结构,即公共分析因子。使用此因子可以得到数据关联的线性组合,即:
对式(2)进行转化,可知在就业情况分析的过程中分析因子与信息量之间的关系。
式中:[C]为变量矩阵;[χ]为特殊分析因子[15]。采用上述公式,完成对高效毕业就业状况信息的分析工作。至此,基于大数据分析技术的高校毕业就业状况分析方法完成。
2 实例论证分析
2.1 实验准备过程
在此次的实例分析中,采用问卷调查的形式完成分析方法研究过程。调查问卷的设计除常用的信息外,增加就业方面的相关问题,以此作为评定2种分析方法区别的重要样本数据之一。调查问卷采用纸质问卷与电子问卷相结合的方式。将问卷发放1 000份,并积极回收。将回收到的数据进行处理分析得出相应的结果。为有效控制实验过程,设定使用的设备与软件。具体参数如表2所示。
采用上述问卷以及数据处理设备完成对原有方法与本文设计方法之间的对比分析结果研究,将结果通过表格描述。
2.2 实验结果分析
根据上述内容,完成此次实例分析。将处理后的数据通过表格显示,具体内容如表3所示。
将问卷数据整理结果作为实验样本,采用原有方法与本文方法对其分析,得出相应分析结果如表4所示。
在此次问卷设计中,共发放问卷1 000份,回收问卷950份,有效问卷950份。其中,男性为450人,女性为500人,年龄大部分为25~45岁之间,问卷的受访人群多来自东南沿海城市。采用原有方法与本文方法对数据进行分析得出每一个问题的分析精度。从结果可以看出,使用本文方法对数据的分析结果精度均高于原有方法。在分析过程中,本文方法的数据处理过程可以有效剔除无用的信息,提高分析能力,保证分析结果的精度。综上所述,本文设计方法在分析效果以及使用性能上都优于原有方法,应对其普及推广。
3 结 语
采用大数据分析技术对高校毕业就业情况加以分析,可有效提升使用者的用户体验以及分析方法的分析能力。在原有分析方法的基础上,增加数据采集的来源与预处理的方式,提升海量数据的分析处理速度。此次方法设计的重点在于数据的分析,应用大数据技术中的分析控制理论完成此工作。通过实例分析可知,本文设计方法优于原有方法。因而,将其推广应用可提升对就业情况的研究与发展。
参考文献
[1] 李端超,王松,黄太贵,等.基于大数据平台的电网线损与窃电预警分析关键技术[J].电力系统保护与控制,2018,46(5):143?151.
[2] 杨彬.大数据分析技术的研究[J].电子测试,2017(21):123?124.
[3] 杜若,谢川,吴群艳.电力环保大数据平台开发及智能运用[J].电力大数据,2017,20(8):64?67.
[4] 门威,丹国萍.智慧校园环境下的学生轨迹数据分析技术[J].漯河职业技术学院学报,2017,16(5):7?9.
[5] 赵丹.基于大数据分析的运动损伤估计模型设计[J].现代电子技术,2017,40(17):101?104.
[6] 叶润国,吴迪,韩晓露.地理信息大数据安全保障模型和标准体系[J].科学技术与工程,2017,17(36):105?111.
[7] 聂瑞华,王欣明,李卓越.从概念走向实践:基础教育大数据的框架与实现研究[J].中国电化教育,2017(3):70?75.
[8] 季惠斌.大数据时代思想政治教育思维方式的转变[J].东北师大学报(哲学社会科学版),2017(1):150?155.
[9] 蔡雄飞,王济,梅再美,等.环境科学硕士研究生就业分析及培养模式探讨:以贵州师范大学环境科学专业为例[J].广东化工,2018,45(5):257?259.
[10] 王莹莹.劳动力空间集聚的就业效应:基于中国城市面板数据的经验分析[J].云南财经大学学报,2018,34(2):36?47.
[11] 张帆,向首艳,陈敏,等.医科大学营养学专业本科生就业情况分析[J].中华医学教育探索杂志,2018,17(6):645?648.
[12] 胡明月,张岳,陈东明.护理科学学位和专业学位硕士研究生同向性就业现状分析[J].护理学杂志,2017,32(4):64?67.
[13] 吴林阳,罗蓉,郭雪婷,等.CPU和DRAM加速任务划分方法:大数据处理中Hash Joins的加速实例[J].计算机研究与发展,2018,55(2):289?304.
[14] 李刚,黄斌,颜耀,等.基于云计算的海洋综合性试验船大数据处理模式探讨[J].舰船科学技术,2018,40(3):90?95.
[15] 李炎,马俊明,安博,等.一个基于Web的轻量级大数据处理与可视化工具[J].计算机科学,2018,45(9):60?64.