王维 靳瑞霞 朱云峰
摘 要: 大数据时代背景下,数据开放与共享的思想深入人心,教育界应用大数据使教育事业拥有了新的活力,各地出台了政策或行动计划来推动教育大数据的发展。大数据在开发与共享的同时也给行业带来了安全隐患,面对冲击与挑战,不同地区纷纷采取有效的应对措施,通过技术监管、运营监管等方式维护数据安全。
关键词: 教育大数据;开发和共享;安全战略;数据安全
中图分类号: TP3 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.01.026
本文著录格式:王维,靳瑞霞,朱云峰. 教育大数据开放和共享安全战略研究[J]. 软件,2020,41(01):121124
【Abstract】: Under backgroud of big data era, data opening and sharing idea has been rooted in hearts of people deeply. Application of big data in education has brought new vitality to education. Policies or action plans have been issued to promote development of big data in education. During developing and sharing, big data also brings security risks to industries. Faced with impact and challenges, different regions have taken effective measures to maintain data security through technical supervision and operation supervision and other methods.
【Key words】: Education big data; Development and sharing; Security strategy; Data security
0 引言
大數据对教育领域产生了深远的影响,各国开启了大数据开放与共享战略,通过制定详细的战略规划,各高校对教育大数据展开了理论与策略研究。网络教育平台在各地区普及,使课堂教学拥有足够的空间,无论是自主选课还是课程内容共享,这都让学生拥有了自主学习的权利,有利于提高学习效率,学习环境更加优越。
1 教育大数据的特点分析
教育大数据的特点主要体现在以下几方面:(1)实时性。以往的数据采集都是人工采集,群体数据存在阶段性特点,无法达到实时性目标,比如学生整体学习情况与社会适应性发展等数据。而大数据更关注学生的个性化特征,对学生微观表现进行观察,探究学生学习轨迹和情绪表现,这种个性化数据会随时产生,在传感设备的应用下完成数据的实时性采集[1]。(2)数据的颗粒度更细。以往数据采样时会使用调查问卷,数据颗粒度较粗,但大数据的来源属于过程性行为记录,学生在某道题上停留多少时间,大数据技术都会详细观察。通过对这种数据的分析,教师会思考如何变革课堂来满足学生心理需求。(3)数据真实性较强。以往数据采集时,学生与教师作为评测者是知情的,获取的数据难免过于刻意。比如考试试卷与调查问卷,学生在填写时带有压力,数据真实性无法保证。而教育大数据技术应用下,利用观测技术进行数据采集,学生无法察觉,这样的数据也会更加自然[2]。
2 教育大数据开放和共享的内涵
大数据时代下,教育领域与业务开始结合,推动了教育行业的发展,人们也必须以全新的目光看待教育大数据技术。现如今,教育开放程度不断加深,数据资产规模日益壮大,非结构化数据日渐增加,数据的分类更加细致化,越来越多的数据创新应用涌现。2014年,欧盟在ePSI平台中创建了开放数据与教育主题小组,将公共开放数据在教育领域的人员汇集,以此推动公共部门信息与开放数据的动态化应用[3]。随后,人们开始对开放教育战略进行研究,美国教育部与财政部联合,通过公布一系列政策,不断开放资源,以此帮助技术开发者和教育者合理应用这些资源,推动教育领域的进步[4]。
从教育大数据目前发展情况来看,能够开放的教育大数据主要包含以下几种:(1)基本人口数据,比如招生人数、学生性别与年级。对这些数据展开分析,能够了解在校学生与学生家长的信息,分析学生行为模式和社交情况。(2)社会调查数据,比如学校校风和教学态度的社会调查。分析这些数据能够了解学生与家长对学校教学计划的满意度、学生对学校的需求、学校能够培养学生期望得到的能力等。(3)教学安排数据。人们从这些数据中能够了解教师课堂设计与执行能力、学校行政管理能力等。(4)学生学习情况数据,其中包含学生学习评价、教师评价以及考试评价等。结合以上数据能够了解学生当前学习态度和对课程设置的满意度[5]。
3 我国教育大数据开放与共享面临的安全挑战
目前我国教育部针对教育大数据制定了《国家教育管理信息系统建设总体方案》,通过建立国家教育数据库来支持教育事业的发展,这说明我国教育大数据管理与应用正式步入发展阶段。但大数据技术在教育行业内依然面对着各种挑战,比如教育开放环境被限制,学生线下数据无法获取,教育数据缺乏动态采集机制,无法实时更新。不仅如此,隐私数据也面临着泄漏的风险,数据开放与共享不得不面对着诸多安全挑战,具体体现如下。
3.1 网络社会使大数据容易被攻击
网络平台为大数据提供了资源共享与数据交换的介质,为数据打造了共享渠道,使各地区的数据资源能够快速整合,实现资源的优化配置。网络访问有着便捷化特点,能够为学习者提供个性化服务,但由于网络平台是暴露的,黑客会攻击有价值的数据。近年来网络上时常发生用户账号信息泄露的问题,可见大数据容易受到攻击[6-7]。
3.2 非结构化大数据存储
大数据时代下,人们将数据存储划分为关系型数据库与文件服务器两种方式。随着数据类型的拓展,非结构化数据越来越多,以往的数据存储技术虽然带有拓展性,但仍然存在着访问控制与隐私管理不成熟的问题。NoSQL软件使用的新代码存在漏洞,内置服务器软件缺乏安全性,人们需要额外安装客户端安全程序,这一过程中又存在身份验证与授权等安全风险[8]。
3.3 技术发展带来了安全风险
现如今网络技术与人工智能被应用于教育大数据中,服务器、防火墙等应用系统为教育大数据的采集和分析带来便利。但技术的革新也为教育大数据增加了安全风险,数据自身存在安全防护漏洞,API访问权限控制时数据被泄漏。不仅如此,有潜在价值的数据容易被黑客攻击,隐藏在其中的恶意软件与病毒难以被察觉。随着数据攻击技术的提升,攻击者会利用教育大数据技术实施攻击行为。
3.4 数据采集与监管较困难
数据采集困难,数据未得到高效整合,部分数据的可用性较低,教育大数据治理需要得到各级部门与社会的协同,从而实现数据的细致化与分层管理。云服务商应用数据建立了数据库,如何保护数据库安全,确保隐私数据不泄露,这对服务商提出了技术性要求。此外,数据监管存在安全隐患,人们对数据的使用权限不够了解,甚至用户并不知道自己隐私数据的用途。监管部门重视事后审查,缺乏事前预测监管[9]。
4 教育大数据开放和共享安全战略研究
4.1 搭建互联网安全体系
以往的网络安全防护就是将内外和外网、业务网和公众网隔离开,使用终端设备将风险隔离。在边界处安装网关设备与流量设备保护边界,但随着云服务的出现,网络边界逐渐消亡。360针对教育大数据开发与共享安全战略发布了大数据安全产品,从网站安全、无线安全与云安全入手,为教育大数据提供安全方案。以数据驱动安全思想为基础,构建互联网安全体系,将网络攻击技术、漏洞挖掘技术和软件分析技术集为一体,整合网络地址解析库、访问日志数据库和文件黑白名单数据库,使传统网络安全防护技术与互联网技术、大数据技术融合应用。随后,360凭借着大数据技术的强大用户覆盖能力,为广大用户推出了天眼、天机、天擎等一系列产品,这些产品能够第一时间感知网络威胁,并对威胁展开回溯。
为实现对教育大数据的系统化、规范化管理,确保数据在不同系统中可以安全共享,建立教育大数据安全体系,凭借着技术支持保护数据传输的全过程,为教育事业奠定基础。因此,教育大数据应建设统一化数据技术保障。该安全体系中应包含针对核心数据访问接口的防护、预防网络攻击、保护数据安全操作,应对海量数据的动态变化、多元化數据融合隐私保护技术、对站点予以保护的分布式系统。为大数据安全防护体系建立数据采集、存储管理、分析使用全过程的安全保护模式,这将成为未来教育大数据发展的必然趋势,保护数据隐私和应用安全。整合体系架构中主要包含四层平台:(1)教育大数据采集平台;(2)教育大数据处理平台;(3)教育大数据分析平台;(4)教育大数据应用服务平台。基于以上四层平台可以实现教育大数据的可视化分析与操作,通过数据接口为产品提供莹莹服务。这一过程中,数据管理和数据监控时刻发挥作用[10]。
4.2 强化数据采集技术
从源头入手,把握教育大数据的质量,使原始数据过渡到高质量数据,实现数据的预处理。教育大数据的数据来源渠道呈现出复合化特点,数据内容多元化,教育行业、互联网数据库呈现出庞大的规模,但数据库质量不够均衡。要求从数据采集环节入手,规范数据采集模式,以精准的数据预处理技术和采集技术为数据的存储管理奠定基础。数据采集技术包含以下几种:(1)数据源筛选与高质量数据采集。(2)多源数据的有效识别和数据的详细解析。(3)数据自动清洗与修复。(4)数据演化和对数据的溯源管理。(5)数据加载技术、数据传输技术。
按照提前预制的策略完成教育大数据的采集工作,对数据信息展开有目的的收集,整合与教育相关的数据,为数据分析和应用打下基础。应用数据采集技术得到感知数据和教育业务数据,对数据源进行采集,将数据复制到数据库中,实现各类数据的合并和转换。2016年我国共有51.2万所学校,各类学校超过3.2亿人,专任教师有1578万人,高等教育人数达到3699万人,占全世界高等教育总规模的20%。庞大的教育基数产生了大量教育大数据,这是国家的核心数据,应充分得到采集与应用。十八大以来,国家发布了《“互联网+”行动计划》、《促进大数据发展行动纲要》等政策,提出了教育大数据作为国家战略,积极推动信息技术与教育融合创新发展,是应用信息技术推动教育现代化变革的需要。随着物联网的发展,2018年每天有550万台互联设备上线,预计到2020年互联设备的上线总数将超过三倍。IBM表示,伴随式数据采集方式将会实现,这种数据采集技术带有动态性与及时性特点,能够有效保证教育大数据的真实性。
4.3 应用数据存储技术
教育大数据的存储技术是指融合数据备份与恢复的技术手段,以此保证数据安全,通过建立文件管理日志实现对数据的监督与管理。应用虚拟化数据存储技术时会遇到数据隔离与恢复的问题,为了强化对教育大数据的安全存储,建议应用以下数据存储技术:(1)数据加密技术。遵循数据存储的安全性需求,将存储在数据库内的数据设立特定存储空间,通过安全套接层协议层将数据加密处理,保护数据库与其中的应用程序,实现数据的高效流通和移动。这种数据加密技术能够保护所有隐私数据与外包数据,为数据下载和上传带来防护功能,避免数据受到网络攻击。(2)分离密钥与加密数据技术。将数据存储与使用功能隔离,密钥与需要被保护的数据处于不同层。(3)应用过滤器进行数据监控。当发现数据离开规定平台,边界自动设置屏障使数据无法传递出去。通过数据备份技术实现系统的灾难恢复,确保教育大数据在受到网络攻击时得到集中保护。
4.4 强化运营监管
教育大数据作为一种公共数据,自身有着公益性特点。这种数据影响社会提供一定程度的开放与共享服务,实现数据资源的价值提升。但面临着数据隐私保护问题,应建立数据保护机制来激发数据活力,维护数据安全。分析教育大数据的运营监管,建议如下:(1)身份认证。该行为可以验证使用者身份,明确用户的合法性,确保教育大数据不被非法利用。同时,应加强对使用者的访问控制,建立单点登录入口与身份认证系统,认证之后,用户能够在权限范围内使用教育大数据资源。(2)文件管理日志。这对教育大数据运营商起到了监督与管理的作用,技术管理人员拥有不同的权限,文件管理日志定期操作数据,实现对平台内资源的检查与维护。(3)权限划分。针对教育大数据的权限主要分为最大权限、使用权限以及管理权限。其中最大权限属于学校方;使用权限属于用户,即教师、学生等;管理权限属于云平台管理房,即第三方评估机构,这其中包含了监督权限。
目前我国有部分高校发布了基于信息技术成果导向的教育管理平台,整合学生与教师等管理数据,建立360度画像,平台设计包含数据云中心、教学与学生管理系统、学生测评系统等,从社会需求入手对教育大数据展开可视化运营监管。该平台整合了教师网络直播讲座资源、精品课程资源与课程点播系统资源,学生能够在平台中选修学习,教师可以利用网络课程平台等课程资源,积极探索利用信息技术手段和MOOC、微课等课程资源,开展网络教学和混合式教学改革。
5 结论
总而言之,随着数据发掘的深入与教育领域的拓展,教育大数据的安全漏洞日渐凸显,用户隐私受到威胁。本文针对数据驱动模式,建立了教育大数据安全防护体系,强化了数据采集技术与数据存储技术,通过对教育大数据的运营监管,实现对数据的权限划分。教育大數据开发与共享安全战略应是一项系统化、动态化工程,为了实现工程的可持续发展,各地区应创建统一的数据中心与教育数据共享平台,加强对平台的系统管理,维护数据安全。
参考文献
[1] 叶曼灵, 张岳, 陆世德. 基于云教育与大数据的高校设计类课程管理系统[J]. 智库时代, 2019(39): 48-49.
[2] 王斌. 大数据对教育管理决策的影响分析[J]. 信息与电脑(理论版), 2019(16): 237-238.
[3] 王忠洋. 教育大数据的应用与挑战分析[J]. 无线互联科技, 2019, 16(13): 95-96.
[4] 戚万学, 谢娟. 教育大数据的伦理诉求及其实现[J]. 教育研究, 2019, 40(7): 26-35.
[5] 闫实 ,付佳, 石莉. 大数据环境下基于智慧校园的教学改革[J]. 软件, 2018, 39(2): 208-211.
[6] 胡揆. 教育大数据开放和共享的安全战略研究[D]. 天津大学, 2017.
[7] 许小媛. 基于大数据技术的个性化在线教育互动式教学路径探究[J]. 电脑与信息技术, 2019, 27(4): 83-85+91.
[8] 蒲骁旻. 大数据背景下高职院校教育管理发展路径探索[J]. 电脑知识与技术, 2019(23): 121-122.
[9] 曾昭江. 面向教育大数据的大学校园信息服务平台建设研究[J]. 电脑知识与技术, 2019, 15(21): 66-69.
[10] 海静, 高洁, 马一丹, 等. 试卷分析模型构建——基于教育大数据的实证分析[J]. 电脑知识与技术, 2019, 15(20): 121-122.