我国教育统计数据研究的发展现状及演进趋势
——基于2000—2022年CNKI期刊数据的可视化分析

2023-08-11 07:06丛红艳董士梅
黑龙江科学 2023年11期
关键词:统计数据发文聚类

丛红艳,董士梅

(西安工程大学,西安 710048)

教育统计是对各级各类教育事业的发展情况进行调查统计、整理、筛选、分析的重要基础性工作,从我国教育统计数据研究中可了解学者在教育领域的研究侧重点及其变化情况。以中国知网(CNKI)为数据来源,选取其“中文核心”及“CSSCI”数据库中教育统计领域相关论文为研究样本,以“学术期刊”为文献类型,以“教育统计数据”为主题词进行高级检索,时间设置为2000—2022年,共检索到315篇文献。借助CiteSpace 6.1 R6软件进行数据格式转化,对我国教育统计数据的相关文献进行可视化分析,绘制关键词共现图谱,探索不同阶段的研究主题,分析该领域研究的发展现状及演进趋势,以期为我国教育统计领域的研究与发展提供参考。

1 教育统计数据研究的时空特征

1.1 时间分布特征

从某一研究领域的文献发表时间分布情况中可了解该研究领域的发展进程及变化情况。分析文献的研究背景及同期的政策变化、学术热点,研究其规律,可对未来该领域的发展情况进行合理预测。

由图1可知,2000—2005年相关发文量较少,均为个位数。2006年后发文量突破个位数,在2010年达到第一次峰值20篇,形成第一波研究浪潮。随后发文量呈将近半数的下降趋势,至2014年达到第二次峰值19篇。随后发文量在急剧下降后呈上升趋势,在2019年达到第三个峰值34篇。虽在后续几年仍有所下降,但幅度较小,年均发文量基本持平。

图1 2000—2022年教育统计数据研究领域发文量变化趋势Fig.1 Trends in the number of published papers in the field of education statistics research from 2000 to 2022

1)发文量的第一个峰值出现在2010年。这一时期国家不断加大农村教育投入,教育事业发展迈入新阶段。梁娉婷从统计工作的角度出发,认为在统计数据质量上,抓好专职统计员队伍建设是前提,抓好数据出口是基础,填报时做好细节工作是关键[1]。也有学者分析教育学文献数据,加强对教育学相关领域的研究。

2)发文量的第二个峰值出现在2014年。十八大以来,各地积极推动教育改革发展,把教育放在优先发展的战略地位,故学者们关于教育统计数据的研究视角转向高等教育、数据质量、教育信息化管理等方向。宋硕深入探讨我国高等农业院校留学生教育在规模、类别、层次、分布等方面的总体发展情况,阐述制约农业院校留学生教育发展的因素,提出应建立以市场需求为导向的多元化人才培养目标[2]。

3)发文量的第三个峰值出现在2019年。十九大报告指出,必须把教育事业放在优先位置,深化教育改革,加快教育现代化,办好人民满意的教育,《国家教育事业发展“十三五”规划》也提出要确保包容、公平和有质量的教育,推进教育改革发展,故这一时期教育事业发展成为研究热点。刘博文、吴永和指出,在大数据时代,建设统一的国家教育数据机构,确保数据安全,构建教育数据新生态已成为迫切需求[3]。根据发文量的波动上升情况及国家对教育事业的重视来看,未来有关教育统计数据方面的研究将持续增加。

1.2 空间分布特征

采用CiteSpace软件对315篇文献以作者为节点类型进行可视化图谱分析,得到节点343个,连线160条,网络密度为0.0027。图中作者姓名的字号越大,说明其在315篇文献中出现的频次越高,节点之间的连线越粗,说明几位作者在同一篇文章中出现的频率越高,由此可观察作者间的合作关系。由图2可知,作者间的联系呈分散状态,联系较强的作者合作较少,有三个主要研究群体,分别是翟振武-杨凡-陈卫、方宝-武毅英、张建化-吕维伦-园田昌史-李灵-陈彦-山田建男-张国荣,但总体出现的频次较低,作者间的合作与互动交流较少。

图2 教育统计数据研究领域作者合作情况共现图谱Fig.2 Co-occurrence map of author cooperation in the field of educational statistical data research

2 教育统计数据研究的关键词特征

2.1 热点关键词

利用CiteSpace软件分析教育统计数据研究的热点关键词被引频次与中心性,如表1所示,该领域的主要关键词为“统计数据”及“教育统计”,被引频次分别为83和26,中心性分别为 0.79 和 0.29。与其他关键词相比,“高等教育”“大数据”“数据质量”“教育数据”等关键词的被引频次与中心性也较为明显,可以看出高等教育研究在统计数据及教育统计基础上的发展与延伸。“统计教育”一词的中心性也比较高,随着统计数据的出现,有关统计方面的规范与教育逐渐得到重视。

2.2 关键词聚类

利用CiteSpace 软件对选中的关键词进行聚类分析,将关键词选择为Node Types,利用Pruning sliced networks绘制关键词聚类知识图谱,得到节点553个,连线1214条,详见图3。CiteSpace依据网络结构及聚类的清晰度提供模块值Q与平均轮廓值S两个指标,当Q>0.3时,聚类结构是显著的[4],当S>0.7时,可达到令人信服的聚类效果。本研究中,Q=0.8132>0.3,S=0.9743>0.7,表明图谱有效,聚类效果合理。

图3 教育统计数据研究领域关键词聚类知识图谱Fig.3 Cluster knowledge graph of the key words in the field of educational statistical data research

2.3 关键词突现

在CiteSpace软件中将Burstness(突发性)中的γ设为0.1,关键词突变个数设为25,检测出现频次在短期内高速率变化的突变词,详见图4。

其中,“教育统计”“大数据”“高等教育”突现强度最大,分别为4.97、4.55和4.15。25个关键词突现强度的平均值为1.87,整体突现强度不高,平均起止间隔时间为2.08年,总体上说明学者的教育统计数据领域研究趋热性较强。基于关键词突现图谱,综合教育统计实践情况,关于教育统计数据的研究可分为三个阶段。

1)第一阶段(2000—2005年):萌芽阶段,文献数量29篇。此时已经出现“教育统计数据”一词,但未提出明确的概念,主要从统计数据层面观测高等教育发展。王留栓将视角转向国外,介绍、分析并研究拉美国家1995—2003年的高等教育发展情况[5]。丁毅强指出了强化学科建设、建立高层次人才培养基地、实施国家西部开发战略及分层次办学的正确性和必要性[6]。

2)第二阶段(2006—2014年):初步发展阶段,文献数量130篇。这一阶段该领域研究的关键词逐渐增多,聚类关键词的连续性及时间跨度达到平衡,研究视角转向农村居民受教育情况及统计数据质量。张东辉提出为进一步提高农民收入、缩小收入差距,应加大农民教育培训与农业技术教学力度[7]。也有学者通过一系列分析指出影响教育发展的难题,应为教育统计提供真实客观的数据。

3)第三阶段(2015—2022年):快速发展阶段,文献数量156篇。这一阶段,为加强教育统计工作,保障统计资料的真实性、准确性、完整性、及时性,发挥统计在教育管理、科学决策及服务社会发展中的重要作用,我国制定了一系列相关法律法规。政策的出台引发研究热潮,教育数据挖掘成为分析教育数据背后蕴藏的教育规律的新途径[8],研究范围逐步扩展到民族教育、区域经济发展、高等教育资源分配等方向。王学男指出,民族教育事业的发展面临规模问题与质量的双重挑战,是政策多重交叉作用的领域[9]。杨振芳从区域经济发展及高等教育资源分配的角度出发,提出要持续对高等教育发展落后地区进行政策倾斜、创新“双一流”高校认证标准、建设区域高等教育发展联盟、适当扩大研究生规模实现高等教育区域布局结构的进一步优化[10]。

3 结论与展望

从时空特征与关键词分析两方面对2000—2022年我国教育统计数据研究情况进行计量与可视化分析,发现在时间分布上,教育统计数据研究呈波动上升并趋于稳定的态势,发文量与社会政策热点呈正相关,阶段性较明显。在空间分布上,作者间的学术交流较少,少有学者对该领域的研究持有深入探讨与研究,以至文献的深度与广度都有所欠缺。在关键词分析上,教育统计数据的研究重点集中在统计教育、教育统计及高等教育方面,这一系列主题间联系紧密,研究也相对集中。未来教育统计数据的研究仍存在很大的发展空间,可从以下几个方向进一步补充研究:

1)从研究合作方面看,可根据官方公布的规范化教育统计数据研究我国教育事业的发展情况,增加这方面的发文量以提升其影响力。应加大对该领域的项目资金投入,鼓励更多学者与机构进行跨学科及跨机构的合作研究,融合多地教育事业发展经验,为教育事业的发展提供可研究的范式与思考方向。

2)从研究内容方面看,教育统计在教学管理中占有重要地位,但教育统计作为关键词的突现时长较短,研究广度与深度有所欠缺。应扩大其研究范围,转向对不同学龄段及师资队伍的统计规范上来,用翔实、客观的统计数据理性分析教育规划,制定正确的教育事业发展方向。随着社会对教育事业重视程度的不断提升,教育统计数据的规范化及标准化也应有更严格的要求,相关专业人才的培养也需不断加大力度。

猜你喜欢
统计数据发文聚类
创新视角下统计数据的提取与使用
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
国际统计数据
2017年居民消费统计数据资料
校园拾趣
爷孙趣事
以牙还牙
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
一种层次初始的聚类个数自适应的聚类方法研究