2022年6月27日,联合国教科文组织发布了《谨防数据泄露:保护学习者隐私与安全》报告(以下简称《报告》),这是在新冠肺炎疫情全球大流行背景下,针对教育系统不断加速开展数字学习和在线教育可能导致数据泄露等不安全问题而发布的一份重要预警性报告。
《报告》认为,在教育领域大规模、高频次开展在线教育和教育数字化其实是一把双刃剑,在为教育系统透明化治理和科学管理、教师赋权、个性化学习体验、教学评估与认证等提供巨大价值潜力的同时,也增加了因数据被滥用而伤害学习者的可能性。新冠肺炎疫情期间,为了确保学生能够在长时间停课期间继续开展学习和交流活动,一些国家的教育系统在很大程度上依赖私人供应商和私营组织提供的在线教育支持服务体系维持学校教学,这就为相关私营组织和数字技术供应商捕获、存储、处理和监控学习者的学习数据和个人隐私提供了可能。因此,必须在使用技术推动教育转型与保护隐私和个人权利之间取得平衡,避免学习者受到数据泄露的影响。
学习者有哪些信息被“数据化”
教育数据化包括所有教育系统(个人、教室、学校、地区、国家、国际)的数据收集,涉及教学、学习和学校管理的整个过程。当前,由于信息技术日新月异,加上强大算法能力的辅助,教育领域开展的信息化教学在捕获和存储信息方面的方法也更加详细和全面。经济合作与发展组织提供了一种学习者在线共享数据的三种类型,这种在线活动所产生的数据也可以扩展到所有在线学习者及其开展的学习活动。一是提供的数据:学习者提供关于自己的数据,比如姓名、出生日期、住址等;二是数据痕迹:学习者留在网上的数据,比如储存在用户本地终端上的数据、网络信标或设备、浏览器指纹、位置数据和其他元数据等;三是推断数据:计算机分析给出的数据和根据数据痕迹得出的数据。以上这些数据可以用于提升学习者学习和追踪学习效果,也为教育决策开辟了新视野。而随着强大的教育数据挖掘能力和学习分析的出现,技术可以聚合和整合数据,可以对学习者的能力以及教师表现进行深远推断。具体包括以下几个方面。
在教育的知情治理和管理方面,教育数据的激增和人工智能技术在教育中的应用对教育部门的决策产生了深远影响。学校、政府部门、政策制定者等教育利益相关者开始越来越多依赖于“证据基础”提供的假定“客观”投入,以进行教育治理和管理。应用范围从教育资源与人员分配、教学评估、学校检查与问责反馈,到国际、国家和地方各级各类学生成绩的比较评估等。《报告》指出,一些国家已经建立了各级各类综合数据系统,将学习者的教育记录与其他政府部门的数据连接起来。这种整合产生了关于教育的新见解,例如“对特定学习者经历的整体理解”或“教育与其他发展优先事项之间的相关性和因果关系”。
联合国教科文组织记录了美国匹兹堡一个公立学区的案例,该学区开始与市公共服务部门的数据中心共享其管理信息系统中关于个别学生的信息。例如,在“离婚或家庭纠纷等家庭破裂”与“学校出勤率和成绩”之间建立联系,有助于学校工作人员在发现学生缺勤率上升或考试成绩突然下降时寻找潜在原因。阿拉伯联合酋长国教育部推出了“高级数据分析平台”,有1 200多所学校和70多所高等院校参与,覆盖了超过120万名学生的数据,包括课程数据、教师专业发展、学习资源、资金、运营、绩效报告、教师、学生和家长反馈,以及PISA等国际学生评估项目的分数。此外,阿拉伯联合酋长国教育部的专门数据分析部门还通过开发“机器学习算法”支持本国教育系统的战略研究。
在利用人工智能开展个性化学习以获得更好成绩方面,人工智能技术以多种不同方式被使用,包括为学生制订个性化学习计划和学习发展轨迹、向教师发出学生在特定活动或课程中需要具体支持的信号、自动开展评分和评估活动、检测学生最终成绩和在线行为之间的异常相关性、增强课程学习材料、监测协作学习环境和社会互动、推荐合适的学习伙伴等。
在接受联合国教科文组织、联合国儿童基金会和世界银行联合调查的135个国家中,90%的国家正在使用在线平台进行远程教育,这表明在短时间内这些平台收集到了大量的学习者数据。此外,迅速变化的局势需要更及时的细粒度数据进行决策。为了填补数据空白,一些国家加强了管理信息系统建设,扩大了在线学习平台,并允许通过平台对学生的出勤率、学习效果和课程完成情况进行数据搜集和报告分析。
学习者的隐私与安全面临哪些风险
《报告》指出,由于学习者在处理数据隐私方面过度依赖系统通知和同意制度,这可能是学习者在当前数字化背景下保护隐私面临的最大挑战之一。与此同时,由于大量在线软件和应用程序隐私政策的复杂性,也是对学习者知情同意的一个重要挑战。在现实场景中,隐私政策往往读起来很长,很难找到,也很难理解。它们通常包含宽泛的语言或大量复杂而详细的信息和专业术语。这些隐私政策很少被阅读,即使被阅读了,也很少被理解,这就可能导致学习者在未对隐私政策进行详细了解的前提下点击了“同意”选项,最终可能造成学习者的数据被搜集和共享,甚至存在被披露和出售的风险。
学习者的数据隐私和安全面临风险的第二个原因在于因学习者数据推动和形成的商業生态系统。学习者的数据对各种实体都很有价值,无论学习者自己和学校,还是政策制定者、广告主、数据经纪人、社会科学家、公司、政府。该数据生态系统中的其他“技术”参与者包括数据分析供应商、硬件供应商、教育软件供应商、IT基础设施供应商和互联网服务供应商。在利益相关者的复杂环境中,谁拥有数字学习数据,谁就拥有了话语权和商业利益交换权。
因此,学习者经常受到市场力量的影响,例如定向广告与定向营销。教育部门面临的一个核心问题是:是否应出于商业目的收集、使用、共享、出售、购买或处理学习者的数据。可以说,学习者有一个合理期望,那就是他们信任教育行为者与他们的数据,认为自己的数据不会被用于与学习无关的商业目的。如果他们的数据被用于商业目的,他们也应该知道是谁、在什么条件下使用的。例如,一些教育技术机构提供“免费”服务,但用户需要同意成为“会员”后才可以获得免费访问权。以一个拥有8 500万会员并被教师、学生和家长广泛使用的教育平台为例,该平台成立以来一直向会员提供免费服务,但近期发布公告称会在平台上显示“赞助”或“推广内容”(广告),以支持平台的运营费用,同时继续保持向用户提供免费使用服务。然而,此后不久教育隐私研究人员发现该平台有跟踪用户并推送相关广告业务的行为,这说明该平台将用户信息分享给了广告经纪人,平台与广告商之间实现了数据分享和利益共享。
此外,学习者的数据隐私被披露后存在的风险也是无法预估的。《报告》指出,当前教育领域的一些教学功能、教育决策、教育评估与课程认证等活动越来越多地外包给教育科技公司和数据公司,借助于他们强大的数据分析和算法实现数据统计的中立性和客观性。然而,这看似平常的统计过程,实则是教育科技公司面向教育基本对象方面行使了巨大权力,而这以前都是由教师、学校管理人员和政策制定者逐一完成的。《报告》认为,这种盲目相信算法中所谓的“中立性”原则,实则更容易将价值观和个人观点嵌入算法中,因此“计算机作出的决定从根本上来说并不比人作出的决定更具逻辑性和公正性”。
《报告》进一步指出,由于学习者所产生的数据具有无形性,很难确定数据保护主体责任。首先,数据位置(也称为数据驻留)概念是不稳定的,因为数据可以同时存储在多个地方。另一个挑战是数据的无形性,尤其是存储在云盘上时。个人数据可以位于任何地方,并可能同时位于多个司法管辖区,不需要在物理实体上接近数据主体。因此,对学习者数据处理的责任就更难确定了。即使可以跟踪数据的位置和移动,各国对数据隐私、安全和跨境流动的处理方法也大相径庭,而且在缺乏强制性国际标准的情况下,确定管辖权和适用法律存在挑战,导致对跨境网络犯罪的起诉水平就非常低。
《报告》还认为,学习者的数据隐私、安全和完整性方面存在着漏洞。这使学习者面临各种风险,表现形式从身份盗窃到欺凌和勒索等。同时,学习者的教育数据记录非常敏感,可以包括学习者的成绩,也可以包括他们的医疗状况、家庭状况、违纪情况甚至移民身份等信息。当这些数据被存储在网上时,就可能被人通过技术手段获取。这些风险涉及公共和私人教育记录,一个安全漏洞就能暴露数百万人的数据。2016年,加拿大不列颠哥伦比亚省教育部就发生了一起严重的隐私泄露事件,导致该省和加拿大育空地区340万师生的个人信息被暴露,起因就是包含这些信息的一个非加密移动硬盘的丢失。2020年2月,加拿大魁北克高等教育部网站也发生了大规模安全漏洞,超过5万名教师的个人信息被盗。美国印第安纳大学也曾被迫关闭了一个在线工具,该工具曝光了超过10万名学生的成绩。该工具原本是供教职工使用的,但不知何故,学生登录学生系统后也可以使用该工具,这样任何学生都可以在未经他人同意的情况下查看其他人成绩,引起了学生的心理恐慌。此外,视频会议平台也可能会在讲座期间发生黑客事件,这一现象在新冠肺炎疫情发生的早期尤为突出。比如,某知名视频会议平台上举行的课程教学和会议曾多次被黑客打断,他们经常展示淫秽内容或威胁学生和教师。
如何保护学习者数据隐私和信息安全
“隐私”的概念带有强烈的文化成分,因国别而异。隐私权作为一项人权,得到了一系列国际法律文本的承认和保护。目前,许多国际和区域组织都制定了关于隐私和数据保护的规范性框架。与此同时,相关国际组织还通过出版技术指南和服务手册,为保护学习者数据隐私和信息安全作出了努力。然而,为保护隐私而制定的许多立法和监管框架并非特定于教育领域,而是普遍适用的,很少有专门针对在线学习的法律和规定。为此,人们普遍认为学习者尤其是儿童在隐私和个人数据方面应得到特殊保护。
《报告》认为,鉴于教育领域学习者的特殊性,需要将数据隐私的关键作用与学习者在终身学习话语中的中心地位并列。据此,迫切需要制定和实施保护性框架,通过“设计隐私”方法和制定国际参与规则加强对学习者数据的保护,联合国教科文组织将在推动建立教育数据隐私生态系统上发挥引领作用,而所搭建的教育数据隐私生态系统包括五个方面的国际思维。
其一,数据保护是一项基本人权。目前,联合国框架不承认个人数据保护是一项基本权利。相比之下,隐私权是一项由来已久的权利。联合国教科文组织计划与公共和私营机构的主要合作伙伴一起制定国际商定的规范性文书,承认个人数据保护是一项人权。
其二,重视个性化学习体验和身份数据。数据能够捕捉个人完整学习经历,并将其与人类活动的其他领域联系起来,包括工作、健康和休闲。数据分析可以为学习者提供个性化、适应性和灵活的学习过程与方式,更有效地评估学习者的多方面能力,帮助学习者作出更明智的教育决策。联合国教科文组织的目标是提供管理数字身份和个人学习数据的方法与道德原则,推动成员国共享学习记录,进而在保护隐私与安全的基础上促进全球交流。
其三,开展隐私设计。教育部门历来关注年轻学习者的权利,但很少关注终身学习者与个人数据直接相关的脆弱性。联合国教科文组织强调“通过设计保护隐私”发展教育系统学习平台与资源。
其四,强调隐私即信任。学生在教育环境中的行为方式和分享个人信息的一个显著前提是他们信任教育提供者,教育环境是一个安全环境。联合国教科文组织认为,教育提供者和数据处理者应被视为个人信息受托人,鼓励其在国家法律制度中得到有效认可。
其五,将数据作为教育与培训政策的驱动力。利用数据分析和人工智能制定教育政策目前还处于起步阶段,因此联合国教科文组织将向成员国提供政策咨询和技术援助,履行其作为可靠的中间人以及教育数据与证据主要来源的职责。
《报告》最后指出,虽然数字技术可以为教育带来重要益處,但技术本身并不能解决教育系统面临的诸多问题。在引入数字技术前,我们应先进行伦理和教学方面的思考,这有助于从人的全面发展的角度理解并适当确定数字技术对教育的影响。
(来源:《中国教师报》 杜光强/文)