戴付晗 朴雪
摘要:随着智能算法的发展,高考志愿的填报逐渐成为热点话题,而智能算法在高考志愿平台的应用相关研究文献缺少系统性整理。该研究以中国知网期刊数据平台和 Web of science为数据来源,采用文献计量学方法检索2011~2021年该领域相关文献,通过对比分析与数据可视化,了解国内外研究现状、研究趋势以及发展差距,从而为国内研究者提供参考和借鉴。
关键词:高考志愿;智能算法;推荐算法;推荐平台
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2022)06-0049-03
开放科学(资源服务)标识码(OSID):
1 概述
近些年,各省高考政策、考试内容、考核方式、录取制度等都在不断调整,高校招生也在变革之中。与此同时,市面上的高考志愿推荐平台层出不穷,更多是通过对往年高考录取分数和排名分析来推荐高校,没有考虑到考生需求、学科偏好等,很难切实进行个性化“因材推荐”。智能算法近年来发展迅速,并已在众多领域推广应用,而智能算法在高考志愿推荐平台中的应用研究又缺少系统性整理。故本文以中国知网期刊数据库为数据来源[1],借助文献计量方法,检索2011 -2021年间该领域相关文献[2],通过数据分析和数据可视化,为高考志愿填报服务平台的开发者以及智能算法研究者们提供理论参考和借鉴。
2 对高考志愿的文献研究与分析
2.1 对高考志愿的文献研究与分析
笔者在中国知网期刊数据库中对高考志愿相关研究论文进行高级检索,时间跨度设置为 2011-2021 年,选取关键词“高考志愿”进行精确检索,返回结果664条,其中主要来自教育和计算机科学领域。
从图1分析得出:2011-2021年国内高考志愿相关文献总体上数量呈上升趋势,2011~2017年文献数量增长比较平缓,总体趋势上升;2017年至2019年,相关文献数量出现较大增长,其中2019年数量达到十年内峰值86篇;2020~2021年有一定程度的下降。这说明在高考志愿领域,国内研究逐渐深入,2019年后高考改革,之前高考相关研究的文献参考价值变弱,导致此后论文发表量下降,但随着各地区新高考模式的逐渐成熟,2021年相对2019年将会有所上升,加之人工智能和大数据技术在各领域的应用,未来高考志愿推荐的研究将会更加深入。
在高考志愿主题下,在检索结果提炼关键词,通过分析可以发现,占比较高的是新高考改革,占比高达81%,详见图2。由此说明新高考政策出台后,多个期刊都进行了新高考改革后高考志愿的研究。综合来说,国内研究者主要是通过分析当下的高考改革、高考志愿填报、高考志愿录取形式、影响高考填报的因素等几个方面展开论述。值得注意的是,高考志愿填报和志愿服务相关文献较少,且不够深入。而在为数不多的高考志愿填报相关文献中几乎都涉及智能算法,包括推荐算法、聚类模糊算法、协同过滤算法等。
2.2 推荐算法在高考志愿填报中应用的文献分析
因此,高考志愿填报,可以通过计算机领域中的算法进行优化和改进。数据挖掘、大数据、志愿填报等关键词与推荐算法都有一定的联系。那么推荐算法应用于高考志愿服务平台是可行的,于是在中国知网期刊数据库中采用高级检索推荐算法并且模糊匹配高考志愿相关研究文献进行检索,检索时间跨度为 2011~2021年,返回检索结果8条。
通过表1可以看出,国内对于推荐算法和高考志愿的研究还是有很大的研究空间,近些年来研究相对较多,大多数还是基于协同过滤算法、遗传算法、模糊聚类算法的研究。文献中有6篇来源于计算机专项的期刊。与此同时,可以发现推荐算法在高考志愿服务平台的使用有着很大的前景。
3 对推荐算法相关文献分析
由于推荐算法可以在高考志愿服务平台的使用,在一定程度上可以加强志愿服务平台的个性化和增强适配性,于是通过检索中国知网期刊数据库与Web of Science 数据库相关文献,进行国内外推荐算法的对比研究与分析。通过分析国内推荐算法相关文献的出处,更清晰地体现其发展过程和今后的研究目标,为相关科研人员今后发表文献给予了更加明确的指导。
3.1 国内推荐算法相关文献
在中国知网期刊数据库中采用高级检索对推荐算法相关研究论文进行检索,检索时间跨度为 2011-2021 年,选取检索关键词“推荐算法”进行精确查找,返回检索结果6059条。其中涉及学科最多的是信息科技、计算机科学,电子信息、软件工程也有涉及。
国内研究者主要是通过个性化推荐、协同过滤推荐算法、模糊聚类算法的研究[3],并且进行了协同过滤算法等的介绍、发展、基于各类应用场景等方面的系列综述,从而对研究和应用前景进行了展望。
从2011年至2021年国内与推荐算法相关的文献总数为上升趋势,2011年至2012年相关文献数量平稳发展(根据图3)。2019年达到近十年最高,达到738篇,2020年有小幅度下降,2021年预计发表量达到771篇。体现在推荐算法领域,国内的相关研究走向成熟,与此同时推荐算法已经被应用到了很多方面,如图书、音乐、视频、电子商务等[4],增强了用户满意度和用户黏性,而在用户满意度方面目前高考志愿填报平台较为薄弱,所以高考志愿填报在推荐算法方面的研究前景巨大。
通过分类和人工筛选,得出各“关键词”的详细占比统计,详见图 4 。使用高级检索以推荐算法为主题,推荐算法占据统计量的20%。协同过滤、推薦系统、协同过滤算法、协同过滤推荐算法占据48%,可以看出关于推荐算法的研究,大多数研究协同过滤算法较多、在研究推荐算法时,可以重点关注协同过滤算法。除此以外,个性化推荐、数据库、矩阵分解、基于用户也占据不小的比例。
论文引用率是衡量一个国家科研文献被其他国家或机构的认可度的标志,有较大的研究价值,于是本文对文献引用量前两百进行相关分析。从图5可以看出对于推荐算法的研究计算机科学、计算机学报、计算机应用研究、计算机研究与发展的期刊研究较多,占比总文献的32%,综合类期刊文献引用量较少。由此可以发现,推荐算法主要出现在计算机领域,因此推荐算法的研究建议相关理论和实践研究者首先查阅计算机相关的期刊文献。
1) 国内推荐算法引用量前十文献的研究
在中国知网期刊数据库平台上以“推荐算法”为关键词,选取 2011~2021年引用量前10的文献(检索结果见表2)[5]。其中被引次数排名第一的是个性化推荐系统综述,其次是推荐系统评价指标综述,都有较高的引用量。从表2可以得出,引用量相对较高的大多数是综述,10篇中有6篇是综述类文献。期刊大多数是计算机工程、电子信息、软件工程的专项期刊,綜合类期刊占比不高。
3.2 国外推荐算法的文献的分析与研究
为了解国外对于推荐算法的当下研究情况,在Web of Science 数据库中对推荐算法相关论文进行检索,检索年限为 2011年至2021年,主题设置为Recommendation algorithm,Mesh为Algorithms返回检索结果3319条。
1) 国外推荐算法的数量分析与研究
从图6可以看出,2011-2019国外研究发表论文数量整体呈现波动式上升趋势,发表量基本在300篇上下浮动。2019~2021年出现较大的下滑,2019年达到发表量最高,超过400篇。由此可以发现,国外推荐算法的研究较为平稳,近三年波动较大,有下降的趋势。
对近10年来推荐算法不同研究方向进行统计(详见图7),发现数学占比最大,其次为医疗保健科学服务,另外药理学药学、数学计算生物学、放射学核医学医学成像、计算机科学等,在大类学科上基本可以分为医学、数学、计算机科学。由此得出,国外推荐算法的研究有较大部分是在医学上的应用和研究,推荐算法在医学领域的应用上有着较大的前景。
2) 国外推荐算法文献来源与研究
以Web of Science 为数据来源[5],对 2011~2021年推荐算法相关文献按出版物来源进行分类。其中,PLOS ONE发表的关于推荐算法的文献最多,其次是MEDICAL PHYSICS、SENSORS、SENSORS BASEL SWITZERLAND。其中PLOS ONE相对其他期刊发表量较多(图 8)。
国外引用量前10名的文献分析在 Web of science 数据库中,以策略(主题)设置为Recommendation algorithm,Mesh为Algorithms为检索条件,检索 2011年至2021年引用量前10的相关文献(检索结果见表3)。被引次数较多的仍是医学领域的相关文献,可见国外在计算机领域的推荐算法研究较少,而医学领域的推荐算法研究较为深入。
3.3 国内外推荐算法研究情况对比分析
对以推荐算法并且高考志愿为主题检索,可以发现国内相关论文数量为个位数,说明在国内对于推荐算法高考志愿服务平台的研究较少。而国外由于升学机制与国内存在差异,当检索高考、志愿等关键词和主题时,检索结果为0,于是检索内容更改为推荐算法,探索国内外对于推荐算法的研究差异。
我国对于推荐算法的研究的学科和期刊大多数还是计算机、软件工程、电子信息,而国外推荐算法的研究的学科和期刊,种类相对丰富。值得注意的是,国外文献对于推荐算法研究更倾向于医学领域。推荐算法出现和研究的时间较短,国内在各种领域的研究相对较窄,主要集中于研究模糊聚类算法、协同过滤算法的研究,对于算法实际应用研究不够深入。未来推荐算法的研究应当继续深入,在多个领域进行研究,将医学、数学、物理、计算机科学等学科进行交叉研究,提升研究的实用性和适用性。
综合国内外文献,推荐算法的研究发展时间不长,但是发展日益迅速,文献发表量、应用量总体逐年上升。与此同时,国外研究开始时间早,发表相关文献的总量多,并且研究方向更多的是与医药卫生相关,而国内研究更偏重计算机科学、电子信息、软件工程。从长远来看,国内对于推荐算法各种领域的研究有待发掘。
4 结束语
对推荐算法在高考志愿服务平台的研究,国内国外文献总体呈现数量少、相关度低的态势。目前市面上的相关志愿填报平台,一定程度上存在政策更新慢、院校介绍缺失、交互性差、缺少人工智能支持等弊端,在推荐院校上较为狭隘,无法体现出平台志愿填报的优势,缺失真正合适的推荐算法的体现和探究。近年来,人工智能算法不断创新和进步,从简单的数理统计算法(如Logistic回归算法和线性回归算法)到复杂的智能算法(如CNN)。随着算法复杂度的不断提高,其应用前景也越来越广阔。许多算法已经应用于语音识别、金融、医疗等领域[6]。与此同时,国内研究者也尝试、研究推荐算法在高考志愿填报上的应用。随着国内的推荐算法在高考志愿推荐平台的研究,相信在不久的将来将会有一个更加智能、详细的平台,切实地帮助到使用者。
参考文献:
[1] 胡嘉豪,孙焱,程景民.基于CiteSpace的互联网医疗研究文献可视化分析[J].中国数字医学,2020,15(10):59-61.
[2] 李颖,石磊,张宁,等.针刺双向调节效应研究的文献计量分析[J].辽宁中医杂志,2017,44(11):2394-2397,2464.
[3] 李华,张宇,孙俊华.基于用户模糊聚类的协同过滤推荐研究[J].计算机科学,2012,39(12):83-86.
[4] 向邦盛,刘涤.试谈推荐算法及应用[J].电脑编程技巧与维护,2020(7):43-45,54.
[5] 刘久煜,张月琴,朴雪.脑机接口技术发展状况分析——基于文献调研[J].卫生职业教育,2019,37(19):133-135.
[6] 刘理,吴官权,漆世锴,等.同时测量曲率和温度的高灵敏度光纤传感器[J].传感器与微系统,2019,38(10):64-66,69.
【通联编辑:谢媛媛】