大数据时代高等教育统计数据质量保障研究

2019-05-24 14:12杨道平简岩陈佳
电脑知识与技术 2019年9期
关键词:数据质量保障体系高等教育

杨道平 简岩 陈佳

摘要:高等教育统计数据是国家了解、分析高等教育状况的基础数据,是国家进行高等教育管理的重要依据,统计数据质量是实现科学决策和管理的关键所在。本文从大数据时代出发,结合大数据的特征,从五个维度描述了教育统计数据质量的内涵,分析了大数据时代高等教育统计数据质量面临的挑战,从组织机构建设改革、优化统计指标体系、建立数据质量标准、拓宽数据采集手段、统计信息化建设、信息反馈机制、责任追究制7个方面,提出了高等教育统计数据质量保障体系建设的建议,希望对提升高等教育统计数据质量有一定的参考作用。

关键词:高等教育;数据质量;大数据;保障体系

中图分类号:TP393 文献标识码:A

文章编号:1009-3044(2019)09-0011-02

1 教育统计基础数据质量的内涵

教育统计基础数据作为国家掌握教育基本状况、管理教育活动、制定教育政策及引导教育发展方向的重要依据,基础数据质量是关键。关于教育统计基础数据质量的内涵,各国研究人员有多种观点,没有统一、完整、全面的定义,本文主要从以下五个方面考虑[1]:

数据一致性:数据集中,不存在相互矛盾的数据以及数据本身不出现语义错误。比如数据(姓名=“张三”、区号=“0851”、城市=“遵义”)含有一致性错误,因为0851是贵阳区号而不是遵义区号。

数据完整性:数据集包含完整的数据对象且每个数据对象的属性值不存在缺失的问题。例如要统计某学校学生获得国家级奖项的情况,如果漏掉幾个,将对这所学校的评价产生较大影响。

数据精确性:数据集中每个数据都能准确表达现实中的实体。比如在校学生数,一定要准确到个位数。

数据时效性:数据信息能表达现实实体的实时状态,数据不过失。

实体同一性:同一个实体在不同数据库中的标识及数据保持一致。例如某学生在教务系统与学生管理系统中没有相同的标识或数据不一致,将导致该学生的数据信息表达混乱。

2 大数据时代高等教育统计数据质量面临的挑战

自2001年我国实施教育统计工作以来,教育统计工作取得了长足发展,教育部对教育统计数据质量高度重视,多次发出通知要求各地教育主管部门及学校加强统计数据质量把关,并通过修订数据报表内容及指标解释、建立数据质量核查机制、每年开展统计人员培训等手段,确保教育统计数据质量。

我国高校在实施教育数据统计工作方面,相对于其他教育组织在统计人员知识背景、利用信息手段等方面占有一定的优势。但由于我国现行教育统计组织机构不完善、教育统计数据标准不健全、采集基础数据的手段相对单一、教育信息化发展不均衡、不充分等因素的影响,导致教育统计数据质量仍有待进一步提高。随着大数据时代的来临,庞大的数据量进一步增加了高等教育数据统计工作复杂性;基于大数据应用的统计数据需求,倒逼着高等教育统计数据质量向更高层次发展,大数据时代高等教育统计数据质量面临新的巨大的挑战。

2.1 大数据时代要求高等教育统计数据具有更好的包容性

大数据具有“量大”“多样”的特点。高校师生在日常生活、学习及工作中,通过各种及时通讯工具、学习平台、应用系统等产生了大量的数据,这些数据及其形式远远超出了传统高等教育统计数据的范畴,但这些数据却能从更加广阔的角度反映各高校建设发展及教育教学活动的真实情况。高等教育统计若不能包容这些数据,那么统计数据的有效性、精确性、完整性就无法有效保证。

2.2 大数据时代要求高等教育统计数据具有更高的时效性

大数据的另一个特点是“快”。随着互联网及网络、通讯技术的迅猛发展,信息数据几乎每秒都在产生,并通过网络迅速积聚,教育统计部门不再是海量数据的唯一拥有者。通过网络迅速聚集的数据能够产生强大的聚合效应,谁先抢占了这种聚合资源,谁就能“挟数据以令诸侯”,这对高等教育统计数据的时效性提出了极高的要求。

2.3 大数据时代要求高等教育统计数据具有更高的价值效率

大数据的另一个特点是“价值密度低”。目前,我国教育事业统计工作覆盖全国50 余万各级各类学校或机构、涉及2.6 亿学生和1900 多万教职工,每年调查指标1.6 万项,数据量达55亿条 [2] 。随着时间的进程,数据集将更庞大,在这浩瀚的数据海洋中,常常是有价值的数据混杂着冗余数据,甚至错误数据,导致数据一致性、实体同一性较差。如何提升高等教育统计数据的价值效率是一个具有挑战性的问题。

3 大数据时代高等教育统计数据质量保障体系建设

新时代新统计,随着大数据时代的来临,视频、图像及网页等非结构化数据的产生,一方面拓展了数据的来源及渠道,丰富了统计数据的来源,有利于更加全面、准确地实现统计目的;另一方面对传统的统计数据质量保障体系也提出了新的要求。如何进一步完善和加强高等教育统计数据质量保障体系建设,使得高等教育统计数据能更加充分反映高等教育的实际发展状况,为教育决策提供更加可靠的数据基础,本文提出如下建议:

3.1 进一步推进高等教育统计组织机构建设改革

大数据时代,数据量的急剧增加、数据来源渠道增多以及数据形式的多样化对数据采集提出了更高的要求。一方面,不管是各高校还是各地教育主管部门,如果没有专门的组织机构,很难有效完成数据统计工作;另一方面,目前我国教育系统虽然建立了数据统计人员培训的长效机制,但实际进行数据收集填报的人员素质参差不齐,大多数不具备统计专业知识,仅仅通过简单的填报操作培训,不能从根本上解决数据填报质量的问题,因此,建立一支具有学术背景的专业人员队伍很有必要。

3.2 进一步优化统计指标体系

大数据蕴含的价值信息与传统统计数据集相比,具有更加的广泛性、全面性,对当前高等教育统计数据指标体系建设提出了更高的要求。进一步优化高等教育统计数据指标体系、修改不适用的统计指标、建立分类统计数据库模式等是大数据时代提升高等教育统计数据质量的前提条件之一。

3.3 进一步加强统计数据质量标准建设

数据质量标准是获得科学、可靠数据的基础,大数据的“多样性”特点对高等教育统计数据质量标准建设提出了更高的要求。结合大数据时代高等教育发展的特点,进一步建立和完善全国高校统计数据质量标准体系及数据采集工作规范,是新时代高等教育数据统计工作的必然要求。

3.4 进一步拓宽数据采集方式

目前,我国高校主要通过“高基报表”、基本状态数据填报方式上报数据,为国家监测高等教育质量提供参考。大数据时代,多源多渠道的数据从更加广泛的角度反映了高等教育发展的基本状况,现行相对单一的数据采集方式已经无法适应高等教育大数据的发展需要,构建多元化的高等教育统计数据采集方式,积极推进第三方组织参与数据采集、建立及时数据采集模式、开展定期调查方式等,是新时代高等教育数据统计工作的重要手段。

3.5 大力推进教育统计信息化建设

大数据的特点是“大、多、快、散”,大力推进高校信息化建设和教育主管部门统计信息化平台建设,一方面可以减轻统计人员工作负担,避免重复劳动,提高统计数据质量;另一方面,数据采集平台能够更好地确保数据实效性,提高数据真实性;更加有利于统计数据分析,促进数据共享和开放。

3.6 建立高校统计信息分析结果反馈机制

當前,我国高等教育统计数据分析主要在国家层面呈现,以“中国教育统计年鉴”方式向社会发布,主要呈现内容为各高校办学基本条件、师生规模等基础信息,仅为数据的统计,基本不涉及分析,统计数据的价值未能充分展现。充分利用大数据处理技术和手段,对高等教育统计数据进行评估分析,并将分析结果及时反馈给相关高校,必将有利于促进高校自身反省、加快发展改革、提高办学质量,推动我国高校在内涵建设和外延发展上取得更好的实效。

3.7 强化责任追究制度

为了确保高等教育统计数据的真实性和权威性,结合高校教育教学工作实际,按照《统计法》有关规定制定教育统计数据责任追究制度,从法律层面保证统计人员提供数据的真实性等,是实现高质量统计数据的重要保障。

4 结束语

大数据时代的到来,其数据特征的变化对高等教育统计工作产生了前所未有的影响,如何抓住时代机遇,提高统计数据质量,使得高等教育统计数据能够更好地发挥决策参考作用,是当前高等教育统计工作的重要任务。

参考文献:

[1] 李建中,王宏志,高宏.大数据可用性的研究进展[J].软件学报,2016,7(27):1605-1616.

[2] 程晶.大数据背景下教育统计数据有效利用的问题与对策[J].价值工程,2017(36):182-183.

[3] 吴旻瑜,郭海骏,卢蓓蓉,等.美国国家教育统计中心对我国教育管理信息化建设的启示[J].世界教育信息,2014(03):13-19.

【通联编辑:光文玲】

猜你喜欢
数据质量保障体系高等教育
ETC关键设备准入标准及运行保障体系构建
关于构建战区联合作战后勤聚合保障体系的思考
浅谈统计数据质量控制
基于Flash+XML技术的护理技能虚拟教学平台设计与实现
中国高等教育供给侧改革研究:起源、核心、内涵、路径
高等教育教学中的重与轻分析
构建更安全可靠的机房电源保障体系
健全大数据安全保障体系研究