K-Means聚类分析在高职高专院校招生中的应用

2020-01-07 08:12李宝霞
数学学习与研究 2020年19期
关键词:录取分数

李宝霞

【摘要】聚类分析是一种按照中心点或分层的方式对样本数据进行归并的数学方法.本文在分析高职高专院校各专业招生计划人数、录取人数以及录取分数的基础上,结合K-Means聚类,从定量的角度对高职高专院校各专业如何科学制订招生计划进行综合分析,进而改进招生策略,制订更科学、合理的招生计划,提升高职高专院校生源质量和录取率.

【关键词】K-Means聚类分析;招生计划数;录取分数

【中图分类号】F222.33 F064.1 【文献标识码】A

高等学校的招生工作是高校发展的生命线.因此,我们应该把招生工作当作一项系统工程来对待,认真加以研究.在招生过程中,必须坚持公开、公平、公正的原则;必须坚持原则性与灵活性的结合.近年来,由于高考生源人数的变化及招生选拔标准提高,一些师范类高职高专院校招生计划分配未能及时适应招生形势,造成热门专业过热, 从而有一些优质生源流失;从专业学科来看,近年来艺术类考生报考人数虽有激增,但生源质量并未受其影响.这样一类学科若继续增加招生计划,显然不合理.因此,改进招生策略,制订更科学、合理的招生计划,这就显得十分重要.

下面,笔者以山西省某師范类高职高专院校2019年的招生情况作为主要研究对象.

一、现状分析

2019年某校高考招生总计划数为1450人,实录取1257人,计划完成率为87%.从图1、图2中可以看出:小学教育专业和语文教育专业实录取人数最多,分别为288人和286人,超出录取计划149人,占山西总录取人数的46%,计划完成率分别为180%和110%;数学教育专业和英语教育专业录取人数较去年有所下滑,平均计划完成率仅为56.6%;艺术类专业招生计划过多,录取率明显下降;现代教育技术、文秘、旅游英语、国际标准舞四个专业实录取人数最少,占山西总录取人数的1.2%.这说明,2019年某校的招生计划分配并不是很合理,致使在录取过程中出现热门专业过热、冷门专业过冷的两极分化现象.

从图3中可以看出,2019年某校山西文史类最低分数线为257分,较2018年的159分,提高了61.6%;理工类最低分数线为130分,较2018年的152分,下降了14.5%;艺术类专业分数线较去年变动不是很大.整体来看,在总录取1257人中,400分以上有24人,[300~400]分有547人,[250~300]分有467人, [200~250]分有160人,[150~200]分有51人,150分以下有8人.整个分数主要集中在[250~400]这段,共计1014人,占总录取人数的80.7%.这说明某校2019年高考各专业录取分数整体情况较2018年虽有所提高,但增幅不是很明显.

二、数据分析

本次聚类分析的样本数据选取山西省某师范类高职高专院校2019年各专业招生计划数、录取人数、文化分数线、专业分数线4个指标为主要研究对象.本次聚类分析对数据相关性、缺失值、异常值要求比较高,同时,数据单位和不同的量级在分析时是无法进行比较的.所以,在聚类分析之前,我们先要对原始数据进行标准化处理,并对处理后的数据进行系数相关性检验、异常值检验.

(一)系数相关性检验

对标准化后的数据进行相关性检验,从表1可以看出,数据间相关系数最高为0.82036,这个值并不是很大,因此,其在进行数据分析时可不做处理.

(二)异常值检验及箱线图

从表2的数据异常值和图4的箱线图检验结果中可以看出,数据中异常值的个数并不是很多,其可能是由于各指标所代表的含义不同造成的(即计划数与录取数代表人数,文化线和专业线代表录取分数),因此,其在进行数据分析时可不做处理.

(三)聚类分析

本次聚类分析采取K-Means均值聚类的方法对样本的最终分类结果进行综合评估.从表3中可以看出,样本数据的最佳聚类结果为5类,平均轮廓系数为0.672998554.结合图5的分析可以发现,当簇的个数分别为2、3、4、5时,轮廓系数的数值不断升高,特别是当簇的个数为5时,轮廓系数的数值最高,为0.672998554;而后,轮廓系数的数值随着簇个数的增加越来越低.从图6中簇数量与簇内误方差相关分析也可以看出,随着簇数量不断增加,簇内误方差的数值越来越小,特别是当簇数量在[2~5]这个区间时,簇内误方差大幅下降;而在[5~10]这个区间内,簇内误方差虽有下降,但降幅不是很明显.因此,将样本数据的最佳聚类结果定为5类是合理的.

(四)结果分析

从表4的数据透视表分析结果中可以看出,整个样本数据的聚类结果分为5类.

0类专业的文化分数线最高,但专业计划数与录取人数最不理想.这类专业主要包括文秘、空中乘务、物联网工程技术、高铁乘务等.对于以师范教育为主的高职高专院校来说, 这些专业都属于非师范专业,其优势远不如师范类专业,因此,在今后的招生中,高职高专院校应适度降低这些专业的计划招生数,以保证录取率.

1类和4类专业虽然专业分数线比较高,但招生计划人数和录取人数并不突出.这类专业主要指一些艺术类专业,包括美术教育、舞蹈教育、音乐教育、体育教育等.虽然,近年来,艺术类考生在高考中报考人数有所增加,但高校对艺术专业线和文化线的要求标准并没有降低.因此,在今后的招生中,高职高专院校应依据当年的形势,适度控制各专业的招生计划人数,必要时可在不同的艺术类专业中做适度调整.

2类专业虽然招生计划人数比较多,但录取人数并不理想,文化分数线居中.这类专业主要指数学教育和英语教育.对一些专科生而言,在高考时,其文化课成绩不理想,因此在专业选择上,他们更倾向于那些轻松易懂的专业.所以,在今后的招生中,高职高专院校应依据当年的高考形势,适当调整或降低这两个专业的招生计划人数.

3类专业在招生计划人数和录取人数方面都特别占优势,这类专业主要指小学教育和语文教育.这两个专业均属于师范类特色专业,近年来受国家教育政策和就业形势影响,当下的小学教育要求必须是全科教学,凭借专业优势和就业优势,这两个专业的报考人数近年来不断增加,因此,在今后的招生中,高职高专院校应适当增加这两个专业的招生计划人数,以吸引更多优秀考生报考,进而提高招生录取率和就业率.

【参考文献】

[1]崔红芳. 模糊聚类分析在高校招生中的应用[J].数学学习与研究,2019(14):115-116.

[2]罗璐. 湖南省硕士研究生生源质量研究[D]. 长沙:湖南师范大学,2018.

猜你喜欢
录取分数
基于 LSTM 的高校高考录取分数预测研究
Comparison of juvenile growth of wild and hatchery-raised olive flounders Paralichthys olivaceus as examined by otolith microstructure
学在财校,终得成材
学在财校,终得成材
示范校建设对高职院校生源质量的影响
选择近几年最低录取分与模考分数相近的院校是不是就能保证一定被录取?
基于SVM的高校录取分数预测模型
大学评价对高校录取分数排名影响的列联分析
录取数据:分数区间显大学认可度