教育数据开放研究与实践现状述评

2019-09-10 07:22李青王海兰
中国远程教育 2019年11期
关键词:教育

李青 王海兰

【摘 要】

互联网的蓬勃发展极大地推动了教育数据开放。在政府大力支持下,各国教育部门开展了开放数据体系的建设和应用。教育数据开放为学生学习、教师教学、学校管理、全民参与带来了巨大的帮助。为全面了解国外教育数据开放的研究和实践现状,基于文献研究法和案例研究法,从研究现状、开放数据和教育数据开放的概念、全球教育数据开放概况三个方面论述了国外教育数据开放的情况,并结合美国、英国和印度尼西亚三个具体案例加以印证和讨论。总结了开放数据不够具体和详细,开放数据的完整性、真实性和准确性有待提高,教育数据开放程度不够,教育数据开放的公正性不足,政策和法律的阻碍等一系列现存问题。针对我国实际情况提出了一些参考建议,包括设定教育数据开放时间表,确立教育数据开放组织机制和配套政策,建立教育数据开放业务平台和开放标准,以及加强宣传引导等具体措施。

【关键词】  教育数据;开放数据;教育政策;数据开放运动;数据管理;数据分析;开放平台;案例研究

【中图分类号】  G642.0       【文献标识码】  A       【文章编号】  1009-458x(2019)11-0048-10

一、问题的提出

随着互联网和云计算等新兴技术的不断发展,以及大数据时代的到来,全球政治、经济、文化领域正在发生着潜移默化的变革,数据成为推动社会发展的新动力。为了促进数据共享、实现数据的价值,开放数据(Open Data)运动逐渐兴起。各国政府将开放数据列入大数据实施战略,这一行动在教育界也得到了积极响应。“开放数据”是一种新的数据发布形式,是由公共实体发布的可获取和再利用的数据(Ayre & Craner, 2017)。教育领域内的开放数据即为“教育开放数据”(Open Data in Education或Open Education Data)。“数据开放”是开放和共享数据的活动,通过数据接口、公开网站等形式向全社会合理合法地公开特定数据的获取与使用权限,“教育数据开放”是数据开放的一个子集(杨现民, 等, 2018)。

早在2010年,美国教育部(U. S. Department of Education, 2010)就发布了《开放数据行动计划》,向公众公布了美国教育数据的开放计划和实施情况。同时,美国政府还通过Data.gov、国家教育统计中心(National Center for Education Statistics, NCES)等多个网站发布教育数据,并提供数据发布和共享技术。英国教育部(U. K. Department for Education, 2012)在其发布的《教育部开放数据战略》中阐述了教育数据开放的目标、价值、所取得的成绩以及未来的教育数据开放计划。从2014年起,联合国发布的《电子政务调查报告》开始将教育数据开放作为政府开放数据的考量指标之一(经济和社会事务部, 2014)。各个地区的非官方机构也开始致力于教育数据开放工作,像英国开放大学、摩尔多瓦的学校门户网站、墨西哥在线等都提供了大量的在线教育数据。

和发达国家的丰富实践相比,我国的教育数据开放还处于初级阶段,尚未形成一定的规模,缺乏完整的开放体系。但是,数据开放不仅是教育发展的趋势,也是教育公平和教育创新的基础条件,有着广泛的政治和经济意义。本研究将系统地整理和评述国外教育数据开放的研究和实践现状,为推动我国相关实践提供可参考的经验。具体研究问题如下:(1)国外教育数据开放的现状如何;(2)国外在教育数据开放方面都有哪些实践经验;(3)教育数据开放会面临何种问题与挑战。

本研究从ERIC、Web of Science、Wiley、ScienceDirect以及谷歌学术中,以“open data”“open education data”“open data in education”等关键词进行检索,剔除相关程度不高的文献,共获得外文文献30篇,以此为基础分析和总结国外教育数据开放的研究现状。在案例研究中选取了美国的教育数据开放体系、英国的高等教育统计社和印度尼西亚的统计局三个代表性案例,从不同水平和角度归纳国外的教育数据开放经验。

二、研究现状

2009年,以美国开放政府门户网站正式上线为开端,各国政府和地方机构纷纷加入到开放数据的浪潮中。越来越多的研究者和实践者开始关注数据开放,学界对于数据开放的研究也比较成熟。数据开放在一定程度上增加了政府行政的透明度和决策的科学性,也增加了数据再利用的价值,得到了社会的积极响应。为了保证数据开放工作顺利开展,需要指派专门人员或转变在职人员的角色,提供数据开放的公共支撑服务,如强化图书館员在数据活动中的管理角色(MacDonald & Martinez-Uribe, 2008)。同时,数据开放的普遍实践又带来了一些新问题,如机构设置、数据处理的复杂性、公众对开放数据的使用和参与、立法、数据质量和技术水平等(Janssen, Charalabidis, & Zuiderwijk, 2012)。

目前,国外对教育数据开放的研究主要集中在关键技术和应用实践两个方向。前者聚焦教育数据开放过程中涉及的数据技术和隐私保护技术。康斯坦丁诺等(Konstantinou, Spanos, Houssos, & Mitrou, 2014)尝试利用资源描述框架(RDF)和语义网技术,将学术信息以关联数据的形式开放。塔罗斯·罗宾等(Traverso-Ribón, et al., 2016)根据开放数据的教育应用情境,创建了不同的模型框架,以解决大量项目数据的可持续评估问题。英国学者面对在集成和共享过程中出现的数据泄露问题研发了隐私保护技术,确保第三方只能访问经过明确授权的数据(Nicholson & Tasker, 2017)。在教育数据开放应用方面,研究者利用开放数据诊断教育中存在的教学问题和预测教育的发展方向。科沃卓等(Chowdry, Crawford, Dearden, Goodman, & Vignoles, 2013)通过开放数据集获得了高等教育学生的人口学信息,探究了贫困人群参与高等教育的决定因素。伊万赛维和卢卡威(Ivan evi & Lukovi , 2018)基于塞尔维亚政府的教育数据集确定了高等院校的评价指标,优化了大学排名的算法,探究该国7所大学的综合排名情况。

国内对教育数据开放的研究起步较晚,仅有杨现民等(2018)从观念、层次、特征等角度分析了教育数据开放的本质内涵,阐述了教育数据开放的战略价值,探讨了我国教育数据开放的实施路径。从更宽泛的开放数据领域来看,濮静蓉等(2017)从开放数据相关理论、许可协议的制定、开放内容、开放途径以及实践案例方面对国内外开放数据的研究进展进行梳理和分析。马海群等(2016)辨析了开放数据的定义、类型,讨论了开放数据的内涵,并对数据的知情权等问题进行探究。在政府数据开放方面,蒲攀等(2017)参考国际上对开放政府数据的研究成果,构建了大数据环境下我国开放数据政策的“系统—制度—过程”(S-R-P)模型。李晓彤等(2018)以北京、广州和哈尔滨为例,对我国政府开放数据的质量评价进行了研究。张晓娟等(2016)梳理了中美在政府数据开放和个人隐私保护方面的各项政策和法律法规,提出了国内个人隐私保护方面存在的问题与挑战。还有一些研究属于图书情报领域,如徐峰等(2018)总结了大数据背景下公共图书馆开放数据服务工作现状及存在的问题。综上所述,国内学界对于教育数据开放的理论研究尚不充分,应用研究更是严重缺乏,可参考和借鉴的研究成果几乎没有,有进一步研究的必要。

三、开放数据和教育数据开放

(一)开放数据的主要特征

“开放数据”既涉及“数据”的定义,又需要界定清楚“开放”的界限。维基百科(2018)将数据定义为“未经过处理的原始记录”。虽然数据可以是非电子化的,但是在互联网时代我们能获取和处理的主要是电子数据。美国纽约州政府的《开放数据手册》对“数据”的解释为:数据是统计或事实性信息的最终版本,它以字母、数字形式反映在列表、表格、图形、图表或其他非叙事形式的文件中,可以进行数字化传输或处理(OPEN-NY, 2013)。“开放”是对数据表现形式的一种规范。开放数据必须具备完整性、原始性、及时性、可获取性、机器可读性、非歧视性(任何人均可获取与访问)、非专有性(格式是通用的)以及免许可性等特性(Open Government Working Group, 2007)。

不同人群和领域对“开放数据”的概念有不同的理解。开放知识基金会提出:开放数据是一类可以被任何人免费使用、再利用、再分发的数据,对其的限制至多是署名或使用同样的许可协议再分发(Open Knowledge Foundation, 2012)。乔尔·古林(Joel Gurin, 2015)认为开放数据是由被政府或者其他组织发布、任何人都能获得并用于任何商业或者个人目的的数据。从不同定义可以看出,它的核心是“任何人可以不受限制地获取和使用数据”。开放数据还强调数据的再利用、再分发,这是一个任何人都可以参与、操作的过程。利益相关方可以单方面获取开放数据,还可以生成和共享开放数据,甚至对开放数据进行检查和纠正,打破传统的数据壁垒,实现数据增值。值得注意的是,在数据开放运动中利益相关者的地位和作用发生了明显变化,从被服务转变为参与服务,从数据的消费者变成了生产者。这种角色的转换有利于促进社会的创新和发展。

(二)教育领域的数据来源及分类

麦肯锡全球研究所(MGI)在研究报告《开放数据:流动性信息开启创新、提高效率》中指出,开放数据可以来源于政府或其他机构、企业以及个人(Manyika, et el., 2013)。由此,教育数据也可以按照发布主體分为机构数据、企业数据以及个人数据三大类。政府机构发布的数据更具合法性和权威性。其他机构主要是各级学校和校外教育培训机构等,它们是教育活动的直接实施者,会产生大量的教学数据。参与教育活动的信息技术企业,也可以产生教育数据,如在线学习工具和平台上的数据。作为参与教育活动的个体产生个人数据。虽然个人数据的所有权归公民自己,但大部分并非自身持有,而是被第三方收集和使用。教育机构和企业等收集的个人基本数据及行为数据,经过授权允许也可能转变成机构数据或企业数据,成为数据资产的一部分。

从教学要素的角度分类,教育数据还可以分为学生数据、教师数据、教学资源数据以及教学媒体数据。学生数据包含学校、姓名、班级、年龄等个人基本信息,以及课堂出勤率、课程测试成绩、学习技能等过程行为数据;教师数据包含教师个人信息、科研成果、教学成果和教学行为等数据;教学资源数据包含教学材料、教学大纲、教学设计、教科书以及教学过程中师生互动生成的资源等数据;教学媒体数据包含基础设施建设、多媒体教学工具的使用情况、学习平台使用情况等数据。除此之外,还有一些基于以上数据再加工得到的数据,如政府对教育机构的预算和支出、根据教学质量评价指标得出的学校排名等。

(三)教育数据开放的环节

教育数据开放是教育领域内数据开放和共享的活动,是指来自于教育机构或应用于教育活动中的教育数据的开放(Open Education Handbook, 2014)。教育数据开放的主体是教育数据,除此之外,还包含数据处理流程、原则、技术、服务的开放。传统上,教育机构产生的数据大部分都是公开的,以促进内部人员有效沟通(如课程目录),或者是应外部政策的要求公开(如向资助机构报告)(dAquin, 2016)。但是,“公开”不等同于“开放”,实现教育数据开放,数据对象必须满足可获取性、可访问性等要求,允许任何人收集和使用数据。数据涵盖的范围大到国际、国家和地区,小到机构、班级、个体甚至单个教学活动,涉及的角色包括学生、家长、教师、管理者、研究人员等所有的利益相关者。

教育数据开放主要涉及以下四个环节:谁来发布数据,从何处获得数据,如何加工处理数据,如何用数据解决问题。首先是提供教育数据开放的公共服务,由政府或有公信力的社会机构建立开放数据网站以及后端的云服务。一般情况下,政府向公众发布的教育数据会集中在政府的开放数据门户中,如美国联邦政府的Data.gov。网站的运营者和数据的发布者可以不一致,网站仅负责提供数据发布服务,对数据的真实性不作检查。

其次是创建教育数据集并发布。开放数据形式多样,既有结构化的数据,也有非结构化的数据。结构化数据常以excel文件或XML等数据交换文件的格式发布,以供数据处理软件读取和导入。对于后者,网站会把文档、表格、图片、视频等多种文件中包含的元数据添加到Web内容中,以便于访问、管理、发现、集成和重用(Piedra, Chicaiza, Lpez, & Tovar, 2014)。例如在DavaReal.org项目将视频文件与相关元数据嵌入到页面中,同时提供版权许可信息,实现教育数据开放(Gilmore, Adolph, Millman, & Gordon, 2016)。随着技术的发展,数据的发布工作正在由手工发布向自动发布转变。

再次是分析和理解教育数据。教育数据中关于学生和学校的数据最常见。利用教育数据,可以了解学习者行为的一般特征,以便理解和优化学习及其发生的环境;可以设立学生常模,确定学习者的学习和智力平均水平;监控学校招生数据,了解区域教育资源的分配情况。借助电子媒介和数据分析工具,以表格、图表或其他可视化形式呈现开放数据,可以帮助使用者全面、立体地观察和理解。

最后是用教育数据指导行动。教育活动产生了教育数据,教育数据最终要服务于教育教学活动。学生可以探索各个领域内的数据资源,将数据作为科学知识的来源以及调整学习策略的依据;教师可以利用数据了解学科教学的基准水平,将自己学生的评估和基准水平对比,以调整和改善教学;学校可以利用数据降低学生的辍学率,通过学习分析和预测系统提高教学质量,还可以提高业务运行的效率;政府通过数据提高决策的科学性以及资源配置的合理性,促进教育公平,提高教育发展水平。

四、全球教育数据开放概况

目前,美、英、法等发达国家相继推出了国家级开放数据平台,其中包含了对教育数据的开放。2016年联合国《电子政务调查报告》(E-Government Survey)显示,在193个成员国中以计算机可读格式发布教育数据集的有127个,其中达到开放数据标准的有92个。欧洲国家数据开放水平最高(84.09%),其次是亚洲(43.75%)和大洋洲(42.86%)。

万维网基金会(W3C, 2015)编制的《开放数据全球报告》(Open Data Barometer Global Report)基于各国公开的基础教育和中等教育数据评估了各国的教育数据开放水平。2015—2017年的教育数据开放情况如表1所示(W3C, 2016; 2017; 2018)。该系列年度报告显示:2015年87%的国家在线提供了数据,数据呈现形式以文本为主,开放数据占比为11%;2016年开放数据占比下降至8%,仅英、美、法、巴西等9国将这些数据集发布为开放数据。大多数国家的教育数据开放是偶发的,再加上在线提供数据的国家数量增加了,数据开放的比例反而下降了。2018年的报告只调查了采用《开放数据宪章》(Open Data Charter)或者签署《20国集团反腐败开放数据原则》(G20 Anti-Corruption Open Data Principles)的30个国家,这些国家数据开放的比例达到13%。数据开放的总趋势是上升的,但进展缓慢,说明在具体实施过程中仍旧存在很多阻力。

(一)美国全面立体的教育数据开放体系

2009年,美国率先建立了政府开放数据平台Data.gov,并提出了“开放政府倡议”(Open Government Initiative),要求各部门以机器可读的形式发布政府数据。美国教育部积极响应,于2010年启动了一系列开放数据计划,涉及从学前教育到高等教育、职业教育以及成人教育等多个教育阶段,提高了教育数据的透明度、参与度和协作性,推动了教育数据开放。美国的教育数据开放体系呈现出以下特征:

1. 法律和制度较为健全

2012年1月,美国教育部(U.S. Department of Education, 2016)发起了“教育数据倡议”(Education Data Initiative),在保护学习者隐私的前提下,让更多来自私营机构、非营利和学术领域的创新者免费获取数据,以构建产品、服务和应用,推进教育改革和创新。2013 年,美国政府发布了《开放数据政策》(Open Data Policy)行政令,要求实现包括教育在内的七大领域的数据开放,并明确了开放时间表(OMB Memorandum, 2013)。2015年12月,奥巴马总统签署了《每个学生成功法案》(Every Student Succeeds Act),要求各州建立大学和职前标准,对中小学生进行评估,并公开发布评估结果中的重要数据(U.S. Department of Education, 2019)。奧巴马总统还提出了“教育互联互通倡议”(Connect ED initiative),以此更好地支持国家教育技术计划(NETP),大规模实现数字化教学,利用数据做出教育决策。地方政府也积极参与到数据开放中。2014年,康涅狄格州(Connecticut, 2014)发布了《开放数据行政令》,将教育数据、图书馆数据等州政府数据向公众开放。

针对教育数据开放过程中出现的隐私泄露问题,立法机构先后制定了《家庭教育权利和隐私法》(Family Educational Rights and Privacy Act)和《学生数字隐私和家长权利法》(Student Digital Privacy and Parent Rights Act)等法律,规定教育机构以及第三方供应商要遵守数据保护标准,在收集和使用学生数据之前必须获得家长(学生)同意,家长(学生)有权审查和更正学生数据,并禁止他们利用学生数据从事商业活动(李青, 李莹莹, 2019)。

2. 构建了立体、完整的数据开放体系

在教育数据开放过程中,联邦政府和各州的分工各有侧重。在联邦层面,推进教育数据开放的主体是教育部。教育部所属的多个机构参与了这项工作,其中既有负责整体战略规划、监督、协调工作的联合小组,也有具体使用和发布数据的业务部门(见表3)。除了联邦政府以外,密西西比、明尼苏达等州还建立了本州的跨机构数据治理委员会,将教育数据开放的计划、原则等相关规定编入法典或编制成数据标准,指导州政府和地区/学区的教育数据开放。一些民间机构也积极参与教育数据开放活动,最有代表性的是“数据质量运动”(Data Quality Campaign, DQC)。这是一个致力于推进教育数据政策制定和数据使用的民间组织,在明确数据开放流程、保障数据质量和安全方面做出了很大贡献(李青, 韩俊红, 2018)。DQC汇集了学前教育、基础教育、高等教育和人力资源等各领域的专家,为美国联邦政府和地方政府建设跨机构数据治理委员会提供咨询服务。

3. 多方参与,分工合作

教育数据开放中,除了完成联邦层面的教育数据开放工作,美国教育部还起了引导、监督的作用,通过EdFacts、NCES、隐私技术援助中心(PTAC)等政府平臺以及Twitter、Facebook、YouTube等在线社交媒体,宣传教育数据使用和数据开放的常识,开展隐私保护教育,还制定了数据收集的标准和指南,促进各州及多源数据的收集和使用。

美国的地方政府完善各自的教育数据开放体系。①制定法律和政策。各州、县、市政府根据联邦的法定要求,结合自身的发展状况制定地方的教育数据开放章程,推动数据开放工作。例如,库克县(Cook County Board of Commissioners, 2011)发布了《开放政府计划》,规定数据开放需要遵循《信息自由法》或者其他适用的联邦、本州法律。②建立教育数据中心,收集学生、教师、班级、学校、地区以及全州等多层面数据。开放跨越多个教育阶段的数据,并将原始数据和分析报告公布于众,改善教育实践。代表性的机构有南卡罗来纳州纵向教育信息中心(SLICE)、肯塔基州教育和劳动力统计中心(KCEWS)等。③与其他社会组织合作。地方政府的数据治理委员会由州政府、教育机构、私营部门等多个组织的代表组成,代表各方利益,共同促进教育数据开放。

4. 开放的数据源丰富多样

美国教育部开放的教育数据包含学前教育、基础教育、高等教育、成人教育以及特殊教育等多个学段,针对学生、教师、学校、课程等多个对象,聚焦大学学费、高等院校、学生人口统计、学前儿童数据、毕业率、教师/管理人员、K-12学生/学校、技术/成人教育、安全/欺凌以及特殊教育等13个主题。地方政府的教育数据主要通过州级纵向数据系统开放,数据收集和开放的范围覆盖从学前到就业后(P-20W)的个人发展数据(阮士桂, 2019)。

(二)英国高等教育统计社的高质量服务

英国政府发布了一系列有关数据开放的法律和政策,并要求每个部门制定相应的战略,推进政府和地方的数据开放。在教育数据开放活动中,英国高等教育统计社(Higher Education Statistics Agency, HESA)起到了非常重要的作用。该社成立于1993年,拥有140多名员工,属于非营利组织。HESA的目标是成为英国高等教育统计和公共信息的可信来源,提供高质量的数据服务,支持教育决策工作,推动英国高等教育的发展(HESA, 2017)。HESA提供的教育数据开放服务主要有以下特色:

1. 多方合作,提供多元的开放数据

HESA与英国国内多个合作方共同推进教育数据开放工作,其中既有公立大学和其他高等教育机构,也有与HESA签署合作协议的政府部门,还有高等教育策略规划协会(HESPA)、英国大学联合会(UUK)等行业组织。HESA为其合作伙伴提供数据、资讯和分析服务,协助他们完成业务报告。近年来,越来越多的英国高等教育机构加入到共享和使用教育数据的行列中。到2018年,HESA的数据源覆盖了英国264个高等教育机构(HESA, 2019),涵盖在校生、毕业生、学术和非学术人员以及高等教育机构等对象。除了发布英国高等教育数据外,HESA还为用户量身定制数据和分析报告,提供收集、发布、分析数据的相关培训。

2. 以信息化手段推进数据开放

2018年,HESA推出了学生数据门户,以交互式表格的形式公开发布高等教育数据,逐步实现开放数据战略。HESA还与英国联合信息系统委员会(Jisc)合作开发了智能数据分析工具——Heidi Plus。该工具通过数据仪表盘实现了数据可视化,并可生成定制化的分析报告。Heidi Plus已经在多个研究项目中应用,取得了较好的效果。比如,高等教育访问跟踪(HEAT)项目使用该工具分析高校学生的活动参与情况、知识与技能掌握情况等指标,并呈现较为直观的结果,进一步指导教学过程。用户也可以从HESA的数据门户下载原始数据,使用其他工具进一步加工处理。

3. 数据质量好,可信度高

虽然HESA是一个非官方机构,但其提供的统计数据具有很高的质量,被政府采纳为官方统计数据。根据《高等教育和研究法案》(Higher Education & Research Act),HESA为英国议会提供与高等教育相关问题的权威答案(HESA, 2017),成为决策依据。在过去的十年中,HESA的数据为议会解决了65个问题,在5场议会辩论中被引用(HESA, 2019)。HESA的数据还经常被媒体引用,用于评论高等教育和社会文化问题,包括高等教育分数膨胀、性别收入差距、国际学生、学术界的多样性等话题。

为了推进和保障教育数据开放,HESA专门组建了高等教育数据指导小组(Higher Education Data Landscape Steering Group)、数据策略和治理团队(Data Policy & Governance Team)等团队,监督数据处理的情况,并提供及时的反馈。针对缺少数据应用经验的人群,HESA还经常组织各种收集、分析数据的培训和咨询活动,帮助公众学会使用和分析数据,体现了教育数据开放过程中的公众参与性。

(三)印尼以教育数据开放增加行政透明度

印度尼西亚统计局(Badan Pusat Statistik, BPS)是负责印尼国民经济数据统计工作的政府部门,统计数据涵盖经济、人口、劳动力、教育等领域。BPS的数据向政府和公众开放,以满足各级政府和社会各界对统计数据的需求。教育数据属于BPS提供的社会与人口数据范畴。

1. 教育数据开放概况

目前,BPS公布的教育数据有52个基本统计数据集和15个部门数据记录集,具体包括识字率、儿童早期教育参与率和平均年龄、学校的级别和排名、教师和学生数量等基础数据,不过大多数是2017年前的数据。该网站还链接了印尼财政部国家收支预算(APBN)数据门户、教育和文化部等网站的教育数据,提供教育预算数据、国家考试诚信指数和初高中/职业学校全国考试数据。

BPS对教育数据集的统计和分析有专门的方法。对教育教学活动的毛参与率、纯参与率等数据的统计口径和采集方法以书面形式公开,增加了数据的透明度,保证了统计结果的有效性。公众可以从已发布的数据集中选择一个或多个数据项,通过定制表格功能实现可视化操作。不过,仅以表格形式呈现数据还不足以清楚地看出数据变化趋势。

2. 产生的影响和存在的問题

BPS提供的基本服务和基础数据,能够让公众了解到各年龄段、各地区、不同性别人群的受教育水平和在校人数等基本情况,为学生和家长提供更多入学信息和选择机会。政府部门也能够比较不同收入群体、地区、性别的文盲情况,加大对文盲率较高省份的教育投资,以促进教育公平。

目前,和发达国家相比,印尼的教育数据开放存在以下问题:①数据开放程度差,覆盖范围小,服务单一,且不能及时更新;②与发达国家强调利用数据作为决策依据相比,印尼尚处于数据有无阶段,以开放政府部门持有的数据为目标,更加着眼于教育数据开放带来的行政透明;③由于数字鸿沟和公众信息素养的差异,其开放数据运动的内生需求(如技术基础、网络普及率、法律体系、公民参与度等)薄弱且不均匀(Gigler, Custer, & Rahemtulla, 2011),机构与公众之间缺乏交流,公众参与教育数据开放的水平也不高。

六、问题和启示

(一)教育数据开放过程中存在的问题和对策

已有的实践显示,在教育数据开放过程中大部分数据提供方还未达到《开放数据宪章》规定的准则,数据质量欠佳,无法有效地使用数据支持教育和教学决策。主要存在以下几个问题。

1. 开放数据以统计数据为主,不够具体和多样,难以用于解决实际问题

各国发布的教育数据主要集中在教育对象和教学结果的统计分析上,师资力量、教学设备和环境、教学投资和产出比、科研成果等更能详细反映教学情况的教育数据较少,且不够具体,难以直接用于解决某个教学机构的具体问题。印尼这类教育数据开放程度较低的发展中国家,数据实用程度更低。英国的HESA已经意识到开放数据与公众需求不一致的问题,通过定制数据服务满足客户需要。所以,应由政府与其他机构(如学校、研究机构等)共同合作,针对解决实际问题的需要,收集较为详细、实用的数据集,并建立起基准数据。

2. 开放数据的完整性、真实性和准确性有待提高

政府在发布数据时缺乏有效的质量控制,部分开放数据并不可靠(贾一苇, 等, 2015)。HESA在收集各高等教育机构数据时也发现存在数据内容不完整、格式不统一、数据真实性差等问题。为此,美国NCES还专门研发了联邦教育项目绩效和标准整合系统(IPBS)以及相应的统计标准,以确保各州数据的统一性和完整性。由于数据发布机构在收集和发布数据时一般不作严格审核,教育数据提供方应建立质量保障机制,采用一致的录入标准,确保教育数据的完整性、真实性和准确性。

3. 教育数据的开放程度不够,不足以达到开放数据的要求

随着信息技术的发展,计算机可以自动化地对数据进行挖掘与处理,能否被机器读取直接影响数据的可用性。《电子政务调查报告》和《开放数据全球报告》显示,以机器可读格式发布的教育数据逐渐增多,最近两年尤为明显。然而,对照开放数据评价指标,仍然有很多的教育数据不具有可批量获取、可发现和开放许可的特性,大大降低了数据的使用价值。为推进教育数据的真正开放,政府应遵循《开放数据宪章》中规定的原则,即默认开放(除涉及安全及隐私外)、确保数据质量、以开放的格式发布数据、提升政府管理水平、激励数据开放创新,以做好数据开放工作。

4. 公众缺乏参与能力,教育数据开放的公正性不足

受网络条件、政策、文化等因素影响,低收入阶层或受歧视群体往往被排除在教育数据开放的决策过程之外。由于宣传和培训不足,公众缺乏使用和参与数据开放的能力。W3C(2017)的调查报告显示,在教育领域在线可用数据占比为88%,其中按性别分类提供数据为69%,仍有19%的数据忽略了弱势性别。教育数据提供者需要考虑不同阶层之间的差异性,避免忽视弱势群体。同时,也要通过各种方法,普及数据意识,提升公众的参与能力,使得教育数据能够为更多公众服务。

5. 政策和法律问题阻碍了教育数据开放和共享

目前,部分国家就教育数据开放的目标、计划、实施情况归纳总结,如美国教育部的《开放数据行动计划》。但从全球范围来看,大部分国家对教育数据开放缺少专门规划,政策不明,法律存在空白。若针对教育数据采取《通用数据保护条例》(GDPR)等一般性法规,在一定程度上会过度约束数据的开放和共享。如何在符合法律要求的前提下实现教育数据最大程度的开放,主要依赖于具有强制性和约束性的法律和政策。国家及管理部门应予以重视,完善法律法规和政策,明晰教育数据开放的过程、角色和责任。

(二)对我国教育数据开放工作的启示

我国的开放数据综合排名为71/115,政府对开放数据的准备程度为46分,实施过程为10分,影响力为11分(W3C, 2017)。和发达国家相比,我国的数据开放水平较低。近几年,各级政府开始关注这一问题,并逐渐得到改善。教育部门及相关机构每年定期发布教育数据,包括《教育事业统计公报》《中国教育年鉴》《教育事业统计公报》等数据和报告。《教育信息化2.0行动计划》也提出要构建一体化的“互联网+教育”大平台,促进教育数据开放。2017年1月召开的全国教育实证研究联席会议也提到了目前“政府和教育行政部门教育数据统计和公布不足”(佚名, 2017),呼吁教育数据开放是加强实证研究的必要前提。但是,在教育數据开放过程中仍然存在很多问题,如国家和地方教育数据开放不平衡,新门类数据、专项数据开放严重不足等。借鉴先进国家的教育数据开放经验,结合我国国情,可从以下几个方面推进工作:

1. 设定教育数据开放的时间表

我国教育数据开放进程尚处于起步阶段,应做好教育数据开放的顶层设计,确定好时间和进度安排,实现整体布局,并以此作为政府机构的行动指南,明确教育数据开放的重要性,以及如何达到教育数据开放目标的方法。可以参照美国的《开放数据行动计划》、英国的《开放数据路线图2015》等,定义好教育数据开放的时间节点、进程以及规则,对教育数据开放的范围、路径以及组织形式充分布局。

2. 确立教育数据开放的组织机制,制定配套政策

从国家、地区、机构到个人形成自上而下的组织机制,更加全面、细致地指导教育数据开放工作,引导各利益方共同参与。教育主管部门应建立健全教育数据开放的法律法规,从宏观层面明确教育数据开放的必要性,进一步推动区域和地方的开放进程。在教育数据开放的同时,还应关注相关群体的隐私和权利,鼓励大众参与。对于政府掌握的教育数据,可设立数据治理委员会,成员包括政府部门、数据提供方、数据使用方以及公民权益团体的代表,负责制定教育数据开放的政策,指导和监督地方政府的教育数据开放,加强社会群体和政府部门之间的协同与交流。

3. 建立教育数据开放的业务平台和开放标准

目前,我国政府尚未设置教育数据开放的专门部门,相关政策法律也处于空白。政府数据开放平台建设从地方(省、市、县)开始,尚未形成统一的开放平台(陈美, 2018)。因此,需要在国家层面加强对政府数据开放平台的建设,进一步确定数据来源、数据质量、数据格式等开放数据标准,收集、整理、分析和发布满足开放数据特性的高价值教育数据集。基于“试点先行,以点带面,逐步推广”的原则,建立数据开放示范点,探索教育数据开放的新模式。

4. 加强宣传和引导,推动教育数据的利用

教育数据开放的目的是应用。提升公民数据素养,使其具备数据应用能力是推动教育数据开放的长远目标。同时,也应加强宣传和引导,让公众了解如何获取教育数据以及如何利用这些数据,帮助他们理解教育现状和决策。此外,还应强化开放数据门户网站的互动功能,通过讨论区和微信群等方式及时获取社会群体的意见,在发布相关数据时兼顾社会的需求,解决教育数据的实用性问题,提高数据的应用价值。

[参考文献]

[美]乔尔·古林(Joel Gurin). 2015. 开放数据[M]. 张尚轩,译. 北京:中信出版社.

陈美. 2018. 日本开放政府数据分析及对我国的启示[J]. 图书馆(06):8-14.

贾一苇,刘鹭鸶. 2015. 英国完善数据开放提升政府服务质量经验借鉴[J]. 电子政务(12):105-116.

李青,韩俊红. 2018. 数据治理:提升教育数据质量的方法和途径[J]. 中国远程教育(08):45-53,80.

李青,李莹莹. 2018. 大数据时代学习者隐私保护问题及策略[J]. 中国远程教育(01):29-36.

李晓彤,翟军,郑贵福. 2018. 我国地方政府开放数据的数据质量评价研究——以北京、广州和哈尔滨为例[J]. 情报杂志,37(06):141-145.

联合国经济和社会事务部. 2014. 联合国2014年电子政务调查报告[EB/OL]. [2018-07-31]. https://publicadministration.un.org/egovkb/

Portals/egovkb/Documents/un/2014-Survey/Complete-Survey-Chinese-2014.pdf

马海群,蒲攀. 2016. 开放数据的内涵认知及其理论基础探析[J]. 图书馆理论与实践(11):48-54.

濮静蓉,刘桂锋,钱锦琳. 2017. 国内外开放数据的研究进展与述评[J]. 图书与情报(06):124-132.

蒲攀,马海群. 2017. 大数据时代我国开放数据政策模型构建[J]. 情报科学,35(02):3-9.

阮士桂. 2019. 美国州级纵向教育数据系统(SLDS)发展特征及启示[J/OL]. 中国远程教育:1-8. [2019-06-10]. https://doi.org/10.13541/j.cnki.chinade.20190226.004

佚名. 2017. 华东师范大学行动宣言:加强教育实证研究 促进研究范式转型[J]. 中国远程教育(03):75-76.

维基百科. 2008. “数据”词条[EB/OL]. [2018-08-03]. https://zh.wikipedia.org/wiki/数据

徐峰,吴旻瑜,徐萱,等. 2018. 教育数据治理:问题、思考与对策[J]. 开放教育研究,24(02):107-112.

楊现民,周宝,郭利明,等. 2018. 教育信息化2.0时代教育数据开放的战略价值与实施路径[J]. 现代远程教育研究(05):10-21.

张晓娟,王文强,唐长乐. 2016. 中美政府数据开放和个人隐私保护的政策法规研究[J]. 情报理论与实践,39(01):38-43.

Ayre, L. B., & Craner, J. (2017). Open Data: What It Is and Why You Should Care. Public Library Quarterly, 36(2), 173-184.

Cook County Board of Commissioners. (2011). Establishment of the Cook County Open Government Plan. Retrieved April 6, 2019, from http://genius.com/Cook-county-cook-county-open-government-ordinance-annotated

Chowdry, H., Crawford, C., Dearden, L., Goodman, A., & Vignoles, A. (2013). Widening participation in higher education: analysis using linked administrative data. Journal of the Royal Statistical Society: Series A (Statistics in Society), 176(2), 431-457.

Connecticut. (2014). EO_39_Open_Data. Retrieved April 6, 2019, from http://portal.ct.gov/governor/

dAquin, M. (2016). On the use of Linked Open Data in education: Current and future practices. Open data for education, 3-15.

Gigler, B. S., Custer, S., & Rahemtulla, H. (2011). Realizing the vision of open government data-opportunities, challenges and pitfalls. Retrieved April 2, 2019, from http://www. scribd. com/doc/75642397/Realizing-the-Vision-of-Open-Government-Data-Long-Version-Opportunities-Challenges-and-Pitfalls

Gilmore, R. O., Adolph, K. E., Millman, D. S., & Gordon, A. (2016). Transforming education research through open video data sharing. Advances in engineering education, 5(2).

HESA. (2017, September). IMPACT REPORT SEPTEMBER 2017.Retrieved September 12, 2018, from https://www.hesa.ac.uk/files/Impact-Report_2017.pdf

HESA. (2019, March). IMPACT REPORT ACADEMIC YEAR 2017/18.

Retrieved  April 1, 2019, from https://www.hesa.ac.uk/files/Impact_Report_2018.pdf

Ivan evi , V., & Lukovi , I. (2018). National university rankings based on open data: A case study from Serbia. Procedia Computer Science, 126, 1516-1525.

Janssen, M., Charalabidis, Y., & Zuiderwijk, A. (2012). Benefits, adoption barriers and myths of open data and open government. Information systems management, 29(4), 258-268.

Konstantinou, N., Spanos, D. E., Houssos, N., & Mitrou, N. (2014). Exposing scholarly information as linked open data: RDFizing DSpace contents. The Electronic Library, 32(6), 834-851.

MacDonald, S., & Martinez -Uribe, L. (2008). Libraries in the conv erging worlds of open data, e -research, and Web 2.0. Online, 32(2): 36-40.

Manyika, J., Chui, M., Groves, P., Farrell, D., Van Kuiken, S., & Doshi, E. A. (2013). Open data: Unlocking innovation and performance with liquid information. McKinsey Global Institute, 21.

Nicholson, J., & Tasker, I. (2017, October). DataExchange: Privacy by design for data sharing in education. the Frontiers and Advances in Data Science (FADS), 2017 International Conference on, 92-97.

Open Government Working Group. (2007, December). The 8 Principles of Open Government Data. Retrieved April 1, 2019, from https://opengovdata.org/

Open Knowledge Foundation. (2012). The Open Data Handbook. Retrieved August 12, 2018, from http://opendatahandbook.org/guide/en/

OMB Memorandum M-13-13. (2013). Open Data Policy. Retrieved April 8, 2019, from https://www.whitehouse.gov/sites/default/files/omb/

memoranda/2013/m-13-13.pdf

OPEN-NY. (2013, November 6). New York State Open Data Handbook. Retrieved August 12, 2018, from https://ny.github.io/open-data-han- dbook/OpenDataHandbook.pdf

Open Education Handbook. (2014, December 13). “Open Education Data”词条. Retrieved August 14, 2018, from https://en.wikibooks.org/wiki/Open_Education_Handbook/Open_Education_Data

Piedra, N., Chicaiza, J., Lpez, J., & Tovar, E. (2014). An Architecture based on Linked Data technologies for the Integration and reuse of OER in MOOCs Context. Open praxis, 6(2), 171-187.

Traverso-Ribón I, Balderas-Alberico A, et al. (2016). Open data framework for sustainable assessment of project -based learningexperiences. Program, 50(4), 380-398.

U. K. Department for Education. (2012, June). Open data Strategy. Retrieved July 30, 2018, from https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/320216/DfE_Open_Data_Strategy_0_10.pdf

U. S. Department of Education. (2010, April 7). Open Government Plan. Retrieved July 30, 2018, from https://www2.ed.gov/about/plan.pdf

U. S. Department of Education. (2016, September). Open Government Plan September 2016 Update. Retrieved April 5, 2019, from https://www2.ed.gov/about/Open_Gov_Plan_2016.pdf

U. S. Department of Education. (2019). Every Student Succeeds Act. Retrieved April 3, 2019 , from https://www.ed.gov/essa?src=rn

W3C. (2015, September 24). Research Handbook. Retrieved August 15, 2018, from http://opendatabarometer.org/doc/3rdEdition/ODB-3rdEdition-ResearchHandbook.pdf

W3C. (2016, April). Open Data Barometer Global Report Third Edition. Retrieved August 18, 2018, from https://opendatabarometer.org/doc/3rdEdition/ODB-3rdEdition-GlobalReport.pdf

W3C. (2017, May). Open Data Barometer Global Report Fourth Edition. Retrieved August 18, 2018, from https://opendatabarometer.org/doc/4thEdition/ODB-4thEdition-GlobalReport.pdf

W3C. (2018, September). Open Data Barometer Leaders Edition. Retrieved August 18, 2018, from https://opendatabarometer.org/doc/leadersEdition/ODB-leadersEdition-Report.pdf

收稿日期:2019-01-23

定稿日期:2019-06-06

作者簡介:李青,博士,教授,硕士生导师;王海兰,在读硕士。北京邮电大学网络教育学院(100088)。

责任编辑 韩世梅

猜你喜欢
教育
国外教育奇趣
车内教育
题解教育『三问』
软件工程教育与教学改革
努力办好人民满意的教育
什么是“好的教育”?
教育有道——关于闽派教育的一点思考
让教育成为终身之择
办好人民满意的首都教育