彭世辰
摘 要: 高考志愿填报多年来一致困扰着广大考生和家长,成为除考试成绩外影响考生进入高等学校的最重要因素。文章提出了一种基于智慧决策的高考志愿辅助填报方案,该方案由数据预处理、录取分数预测和志愿匹配三部分组成。数据预处理对相关信息进行初步处理,使得处理结果可以直接用于后续的分析和决策。录取分数预测根据历史录取分数、一分一段表、招生计划等信息预测每一个学校当年的录取分数线。志愿匹配根据志愿填报人的分数、意愿等相关信息,为申报人提供符合要求的学校或学校列表,并按照高考志愿填报格式为申报人提供不同的志愿组合,可以直接作为申报人的志愿。采用该方案可以有效提升填报志愿的录取率。
关键词: 智慧决策; 分数预测; 高考志愿; 辅助填报
中图分类号:TP301 文献标志码:A 文章编号:1006-8228(2017)12-05-03
A novel voluntary reporting aided scheme for college entrance examinations
based on smart decision
Peng Shichen
(Chengdu Foreign Languages School, Chengdu, Sichuan 611731, China)
Abstract: Voluntary Reporting for College Entrance Examinations perplexes examinees and their parents, which becomes the most important factor to examinees except for examination mark. This paper presents a voluntary reporting aided scheme for college entrance examinations based on smart decision. The scheme is composed of data preprocessing, enrollment mark forecasting, and voluntary matching. Data preprocessing deals with the original data to support subsequent analysis and decision. Enrollment mark forecasting dugs the current enrollment mark based on historical enrollment mark, mark-segment table, and enrollment plan. Voluntary matching creates voluntary list for examinees based on mark, requirements, and so on. The scheme could promote the acceptance rate for examinees.
Key words: smart decision; forecast; voluntary; aided reporting
0 引言
近40年來,高考历经了几代人,无数普普通通的人通过高考改变了自己的命运,也有很多人因为志愿填报失误而错失进入高等学校学习的机会。随着网络技术、计算机技术的发展,网上阅卷、网上填报志愿等信息系统开始广泛应用,为教育部门、招生部门减轻了大量的工作量。但是,如何合理的志愿填报仍然是困扰广大考生的重要问题。
每逢高考结束,各地都会涌现出各种志愿填报专题讲座、辅导班等,为考生和家长介绍志愿填报的技巧。然而,这些讲座、辅导班是根据讲授人的经验进行介绍,容易造成一些人填报志愿时的“扎堆”或“失灵”现象。此外,由于辅导班收费高以及农村地区偏远等原因,有很多考生及家长连这样的讲座、辅导班也接触不到。
随着信息技术的普及应用,高考志愿填报智慧辅助决策系统为考生志愿填报带来了新的解决途径。高考志愿填报智慧辅助决策是利用计算机技术、网络技术、数据分析技术等,基于历史数据和考生的意愿,利用智慧决策方法进行分析决策,最终形成符合考生意愿的高考志愿,为众多没有“外援”的考生填报志愿提供帮助。
近年来,高考志愿辅助填报的研究受到广泛关注。杨凯博等人提出了基于遗传算法的高考志愿排序方法,将考生志愿按照录取结果利益最大化排序[1]。徐刚强等人提出基于数据挖掘的招考志愿填报辅助决策系统,通过对高考历史数据的全面分析对考生志愿填报进行辅助决策[2]。肖灿等人基于商务智能研究高考志愿填报,综合考虑成绩、学校、家庭等多种因素,为考生确定填报志愿[3]。贾海生等人基于SSH2框架,设计了志愿征集填报系统[4]。曾铮等人基于数据仓库和联机分析技术,对平行志愿填报方式进行了评估,得出了平行志愿可以保护高分考生等目标[5]。
上述高考志愿辅助决策系统,从不同的侧面辅助考生进行志愿填报。然而,这些系统还没有充分考虑考生的需求和拟填报学校的历史信息等。因此,本文从考生需求、拟填报学校分数预测、志愿匹配等方面入手,提出基于智慧决策的志愿辅助填报系统,可较好地满足广大考生志愿填报的需求。
1 志愿填报辅助决策方案
本文提出了高考志愿辅助填报决策方案,该方案由数据预处理、录取分数预测和志愿匹配三部分组成。数据预处理的功能是对相关信息进行初步处理,使得处理结果可以直接用于后续的分析和决策。录取分数预测的功能是指根据历史录取分数、一分一段表、招生计划等信息数据预测每一个学校年的录取分数线。志愿匹配的功能是指根据志愿填报人的分数、意愿等相关信息,为申报人提供符合要求的学校或学校列表,并按照高考志愿填报格式为申报人提供不同的志愿组合,可以直接作为申报人的志愿。endprint
1.1 数据预处理
在高考志愿填报过程中,涉及的信息主要有学校信息、考生填报志愿影响因素以及最后的志愿信息等。
⑴ 学校信息:学校类型(如985、211、一流大学、一流学科学校、普通一本、普通二本、普通三本等)、地区(东南、西南、中原、西北、东北等),城市、学院、系、专业、历年录取分数、就业情况等。
⑵ 影响高考志愿填报因素:学校类型、地区,城市、学院、系、专业、考生分数、预测录取分数线等。
⑶ 志愿信息:由学校和多个专业组成的序列,具体可填报学校、专业个数与当年志愿填报具体规定相关。
对于学校信息和影响志愿填报因素,其各个分量的类型不同,在进行决策的时无法进行对比衡量,需要对二者进行归一化处理。具体处理方法如下。
第一步 假设学校信息和影响志愿填报因素的各个分量的集合为S={T1,T2,…,Ti,…,Tn},S为有限集,其中S的每一个元素Ti也是一个集合,表示其某一具体因素,如学校类型、地区、城市、专业等。
第二步 使用近似最优哈弗曼编码函数Φ,对T中元素T1中的每一个元素进行编码,则
Φ(T1)={c1c2 … ci … cm}
其中,Φ(T1)是T1中的元素经过编码后的编码值集合,Φ(T1)中的每一个元素ci对应T1中一个特定元素的编码。
第三步 将Φ(T1)中元素按照优先级从高到底排序,得到一个m维向量V1:[v1,v2,…,vi,…,vm]。
第四步 将S中每一个元素Ti都按照第二步和第三步处理,则可以得到Φ(Ti)={c1c2 … ci… ck}和对应的按照Φ(Ti)中元素优先级排序的k维向量Vi:[v1,v2,…,vi,…,vm]。因此,集合S经过归一化编码后转换为V={V1,V2,…,Vi,…,Vn}。其中,Vi是一个Ti中元素编码按优先级高低排序的向量。
经过信息预处理后,学校信息可以标识为一个m维向量U:[a1,a2,…,am],其中每一个元素ai表示学校的一个属性,其取值为对应类型编码向量Vi中的一个分量。影响志愿填报信息可以表示为一个n维向量Q:[q1,q2,…,qn],其中每一个元素qi是一個具体的影响因素,其取值为对应类型编码向量Vi中的一个分量。最后生成的志愿可以表示为一个k元组V((u1,m11,m12,…),(u2,m21,m22,…),…,(uk,mk1,mk2,…))。其中,u1,u2,…,uk表示学校,m11,m12,…,m21,m22,…表示专业。
1.2 录取分数预测
本节提出了一个根据某学校历史数据、当年招生计划、一分一段表预测其当年录取分数线的方法,为志愿填报提供基础支撑。
假设将某一学校某一年每个专业的录取信息构建为一个多维向量,(Major,Mark,CandNum AdmiNum, PlanNum,Rank),每个分量分别表示专业、录取分数线、报考上对应专业批次人数、录取人数、计划人数、录取最低分在一分一段表中的排名。下面以某一个具体专业为例介绍录取分数线预测的过程。
第一步 确定参考年限参数。此年限参数设置为5,表示参考近5年的录取情况,年限参数一般设为[3,5]。
第二步 计算预测录取排名基准值。计算报考当年前5年该专业一分一段表中录取分数线对应排名的平均值。
第三步 排名基准值调节。对进行如下调整:
⑴ 计算参考5年中每一年的PlanNum-AdmiNum,如果该值大于0,则根据该年一分一段表向后调节PlanNum-AdmiNum个考生,获得相应排名;否则向前调节PlanNum-AdmiNum个考生,获得相应排名。
⑵ 计算参考5年中每一年的CandNum-AdmiNum,如果该值大于0,则根据该年一分一段表向前调节CandNum-AdmiNum个考生,获得相应排名;否则向后调节CandNum-AdmiNum个考生,获得相应排名。
⑶ 根据⑴和⑵调节后的排名,确定报考当年一分一段表中录取分数线的排名。然后,计算报考当年招生计划人数与前5年招生计划人数最大值的差额,如果该值大于0,则在报考当年一分一段表向后调节相应差额个考生,获得最终排名;否则,则在报考当年一分一段表向前调节相应差额个考生,获得最终排名。
⑷ 根据获得的最终排名,取整,查阅报考当年一分一段表,即可获得该专业预测的录取分数线。
1.3 志愿匹配
本节提出了根据预测的录取分数、填报人的实际考分以及填报人的需求进行志愿匹配的方法,填报人的需求可以包括学校类型、学校所在地区、学校所在城市、学校、学院、系、专业、就业情况、学校排名等。填报人可以从这些影响因素中选择一个或多个因素,并调节这些因素的优先级,生成自己个性化的志愿需求PQ:[pq1,pq2,…,pqN]。其中,一个分量pqi表示一个具体的需求,如专业等,pq1是最重要的志愿填报影响因素,pq2是次重要的志愿填报影响因素,然后重要性依次下降。这里PQ:[pq1,pq2,…,pqN]的分量是Q;[q1,q2,…,qn]的分量的子集。下面介绍志愿匹配的基本过程。
第一步 从志愿填报人的个性化需求PQ:[pq1,pq2,…,pqN]中选取第1个需求因素pqi,并根据pqi匹配从学校信息数据库中的学校信息U:[a1,a2,…,am],筛选出满足条件pqi的大学的集合SU1。
第二步 从志愿填报人的个性化需求PQ:[pq1,pq2,…,pqN]中选取第2个需求因素pq2,并根据pq2匹配集合SU1的学校信息U:[a1,a2,…,am],筛选出满足条件pq2的大学的集合SU2。
第三步 重复到第i次时,从志愿填报人的个性化需求PQ:[pq1,pq2,…,pqN]中选取第i个需求因素pqi,并根据pqi匹配集合SUi-1的学校信息U:[a1,a2,…,am],筛选出满足条件pqi的大学的集合SUi。endprint
第四步 重复到第N次时,从志愿填报人的个性化需求PQ:[pq1,pq2,…,pqN]中選取第N个需求因素pqN,并根据pqN匹配集合SUN-1的学校信息U:[a1,a2,…,am],筛选出满足条件pqN的大学的集合SUN。
第五步 SUN即为满足考生要求的学校集合。
第六步 如果填报人选择自动生成最优志愿,则从SUN中选取最靠前的x个学校(x为当年允许填报的学校数),并为每个选中的学校选取PQ中的专业,生成一个志愿项(u,m1,m2,…,my)。其中,y是一个学校允许填报的专业数。如果PQ中的专业数大于或等于y个,则选取PQ中最优的个y专业;如果PQ中的专业数小于y个,则再从该学校中选取若干个最优专业,与PQ中专业一起构成y个专业。最终形成志愿V((u1,m11,m12,…), (u2,m21,m22,…), …, (uk,mk1,mk2,…))。
第七步 如果填报人选择自动生成随机志愿,则从SUN中随机选取x个学校(x为当年允许填报的学校数),并为每个选中的学校选取PQ中的专业,生成一个志愿项(u,m1,m2,…,my)。其中,y是一个学校允许填报的专业数。如果PQ中的专业数大于或等于y个,则随机选取PQ中的个y专业;如果PQ中的专业数小于y个,则再从该学校中随机选取若干个专业,与PQ中专业一起构成y个专业。最终形成志愿V((u1,m11,m12,…),(u2,m21,m22,…),…,(uk,mk1,mk2,…))。
第八步 如果填报人选择自定义生成志愿,则由填报人手动从SUN中选取x个学校(x为当年允许填报的学校数),并为每个的学校选取y个专业,生成一个志愿项(u,m1,m2,…,my)。最终形成志愿V((u1,m11,m12,…),(u2,m21,m22,…),…,(uk,mk1,mk2,…))。
2 结论
随着信息技术的发展,目前国内出现了许多高考志愿辅助填报系统,试图解决考生的志愿填报问题。然而,这些系统大多没有充分考虑考生的具体需求,生成的志愿比较宏观。本文从考生需求、拟填报学校分数预测、志愿匹配三个方面入手,层层递进,基于拟填报学校的历史信息、当年一分一段表等信息,形成满足考生个性化需求的志愿列表,可以较好地满足广大考生志愿填报的需求。
参考文献(References):
[1] 杨博凯,李晓瑜,黄一鸣,雷航.基于遗传算法的高考志愿填报
排序问题的研究[J].计算机科学,2016.43(6A):390-294
[2] 徐刚强,林燕.基于数据挖掘的招考志愿填报辅助决策支持
系统[J].计算机技术与自动化,2014.33(4):106-109
[3] 肖灿,张自力,何小明,夏大飞.基于商务智能的高考志愿填报
指导系统设计与实现[J].西南师范大学学报(自然科学版),2012.37(5):89-97
[4] 贾海生,杨小宁.基于SSH2框架的高校招生考生志愿填报系
统的设计[J].宁夏大学学报(人文社会科学版),2016.38(6):189-194
[5] 曾铮,张自力,殷员分,蔡海敏.OLAP技术在高考志愿填报方
式分析评估中的应用[J].西南师范大学学报(自然科学版),2010.35(3):239-242endprint