赵磊磊 张黎 王靖
【摘 要】
在以人工智能、5G、云计算等技术为支撑的智能时代背景下,教育数据伦理风险及其治理问题备受社会关注。智能时代教育数据伦理风险主要表现为教育数据隐私侵害风险、教育数据利益失衡风险、教育数据责任失守风险、教育数据服务偏见风险。智能时代教育数据伦理风险的治理困境主要涉及师生教育数据隐私权与开放共享存在冲突、教育数据利益博弈失范制约教育数据价值的充分释放、治理主体数据素养不足制约教育数据责任落实、师生教育需求的片面捕捉催生教育数据服务偏见。基于此,提出智能时代教育数据伦理风险的治理路径:尊重教育用户数据隐私控制权,优化数据隐私泄露风险防范体系;注重利益博弈规约,搭建教育数据权益监管体系;立足数据素养培育,培育专业化教育数据伦理风险治理组织;根植动态需求监测,构建“去偏见化”教育数据服务机制。
【关键词】 人工智能;教育数据;伦理风险;数据治理;数据隐私;数据利益;数据责任;数据偏见
【中图分类号】 G434 【文献标识码】 A 【文章编号】 1009-458x(2022)3-0017-09
引言
2015年9月国务院印发《促进大数据发展行动纲要》,正式确立了数据继物质、能源之后第三大战略资源的地位。“数据已成为国家基础性战略资产”“大数据促进经济发展转型”等观念已成为社会与学界共识,可用于挖掘新知识、发现新规律、创造新价值的海量数据——“大数据”已成为当今时代信息技术发展的代名词(庞茗月, 等, 2019)。2021年3月,教育部发布《关于加强新时代教育管理信息化工作的通知》,强调应深化教育领域“放管服”改革,以数据为驱动力,利用新一代信息技术提升教育管理数字化、网络化、智能化水平,推动教育决策由经验驱动向数据驱动转变。随着以5G、人工智能等新技术为支撑的智能时代到来,教育数据的存储、运算、共享等众多方面也将进入新的历史发展时期,信息技术与数据的逻辑关系成为当前教育数据服务的关键抓手(梁迎丽, 等, 2018)。值得注意的是,自然语言处理、机器学习等新技术的教育应用虽推动了教育数据采集、登记、分析等过程的智能升级,为教育教学发展带来诸多便利,但也孕育着我们无法预知的风险,由此可能引发一系列因数据误用、数据标准欠缺、数据过度依赖、数据监管不严、数据应用失范以及数据隐私泄露而引发的数据伦理风险(刘三女牙, 等, 2017)。因此,本研究尝试解析教育数据伦理风险的内涵,厘清当前教育数据伦理风险的表征形式、现状与问题,以期为探寻智能时代教育数据风险治理路径提供参照。
一、教育数据伦理风险的概念诠释
(一)数据伦理
“伦理”一词源于古希腊词“ēthikós”,意思是“与人的性格有关”,与“风俗”“品质”“品格”“德性”等含义相近(West & Prior, 1994)。这个词被作为“伦理学”转入拉丁语,然后被转到法语(作为“thique”),后来转移到英语中(作为“ethic”)。《剑桥哲学词典》指出,“伦理”一词常与“道德”互换使用,它更狭隘地用于指特定传统、群体或个人的道德原则。Massimo(2003)指出:“伦理的标准定义通常涉及‘理想人品科学’或‘道德责任科学’等概念,其试图通过定义善与恶、对与错、美德与恶、正义与犯罪等概念来解决人类道德问题。”理查德·威廉·保罗和琳达·埃尔德将伦理定义为“指导我们确定哪些行为有助于或伤害有知觉生物的一组概念和原则”(Ambrose & Cross, 2009, pp.117-131)。归纳来看,伦理一词主要涉及有关事物关系的道理与准则,一般具体体现于真、善、美、正义、责任等词之中。基于此,本研究认为伦理可被视为人类社会中人与人、人与自然、人与社会等方面关系和行为的道理与准则。
自互联网出现以来,数据的数量急剧增加,并且继续呈指数级增长,以至于传統的数据处理应用程序软件不足以处理如此庞大且复杂的数据。随着5G、人工智能、大数据等新技术的快速发展,数据采集、共享等方面的功能逐渐实现智慧升级,但也面临数据隐私泄露、数据非法售卖、数据产权归属不清晰等诸多数据伦理问题。目前学界对于“数据伦理”的定义存在一定差异。例如,Floridi与Taddeo(2016)认为,数据伦理属于伦理学的一个新分支,数据伦理是指研究和评估与数据(包括生成、记录、策展、处理、传播、共享和使用)、算法相关的道德问题。蒋洁(2016)认为,数据伦理是关于数据价值判断的应用和对数据使用方式的道德棱镜,涉及数据服务、数据决策、数据权益等多个具体领域。概括来看,数据伦理可被视为衡量数据与他者(包括人、社会等)之间关系的道理与准则,主要涉及数据采集、数据分析、数据处理、数据应用等方面所产生的道德问题。
(二)教育数据伦理风险
随着科技的快速发展,网络、电脑、数据感应仪、记录设备的大量应用使得数据的数量与复杂性呈几何级快速增长(舒晓灵, 等, 2016),公共数据、个体数据、研究数据、跨界数据等多种类型的教育数据迅猛增长,使得在有限时间内记录、管理与处理数据更加困难。教育数据的存在对于未来教育创新发展价值和意义非凡,“合规化”采集、共享与使用数据将是促进信息技术与教育教学深度融合的关键之举。教育数据伦理是数据伦理在教育领域的具体体现。教育数据伦理与师生发展、教育与社会的关系等密不可分,教育数据伦理可被视为教育领域的数据伦理,是对教育数据产生、采集、存储和分析利用过程中所应秉持的道理与准则的理性审视,是教育场域中有关数据伦理建构的哲学研究。目前,在技术赋能场域,数据对教育技术功能的发挥与拓展影响较大,教育数据伦理议题也是对如何规约教育数据与他者(包括人、技术、社会等)之间关系的回应。
技术的存在与变革具有不确定性与风险性,与其相伴的教育数据采集、共享与使用也时常面临数据伦理风险的侵蚀。如Rubel和Jones(2016)所述,当前人工智能、大数据、物联网等技术在重塑教育生态并为教育教学带来诸多便利的同时,也带来了潜在的数据伦理风险。教育领域的信息收集、信息访问、信息共享、数据利益分配等方面存在关系与行为的伦理失范现象,引发了隐私侵害、压制教育的正向价值等问题。教育数据的收集、分析和使用并不是中立的行为,相关行为具有一定程度的价值取向,在价值冲突情形下会产生加大教育不平等、削弱教师地位、侵犯学生自由等一系列伦理风险。基于以上分析,本研究认为,教育数据伦理风险可被视为教育领域数据采集、存储、流动、分析等过程中因关系违背约定的道理与准则所形成的伦理风险,具体涉及数据隐私侵犯、数据利益分配失衡等伦理问题。
二、智能时代教育数据伦理风险的典型表征
教育数据一般涉及教育中的人或者通过数据而生成的与人有关的信息要素(如身份信息、思维习惯、行为偏好、学习表现等)。智能技术与教育的融合创新全面提速,一系列专有智能工具、资源和系统不断形成,基于大数据的精确诊断和智能推送全面普及(杨宗凯, 2018)。通常理解,智能时代是第四次工业革命的标志(劳凯声, 2019),其以人工智能、5G、云计算等技术为依托,可提供智能分析、智能预测等功能。在智能时代,教育数据逐渐由附属于特定教育信息系统的客体,转变成为被期待能驱动创新应用的主体,凸显了数据智能驱动教育发展的转型需求。同时,智能时代的到来加速了信息空间的深度融合,信息资源能够自动识别不同的智能终端,进而实现数据的同步更新、异步更新与交换共享(杨现民, 等, 2020)。在智能专家系统、智能教学监测系统等产品运转过程中,来自于多个端口与平台的教育数据极速生成与汇聚,如何规范教育数据的流动与使用面临诸多风险挑战。教育数据伦理风险属于数据伦理失范而形成的伦理风险,本质上是一种伦理风险,本研究拟从伦理学视角探究智能时代教育数据伦理风险的存在形态。
一般而言,“正当”与“善”是伦理学研究的两大议题(黄正华, 2012)。“正当”意为“符合公平正义”,强调应正确运用原则(规范、前提、规则、标准或法律),涉及公众应尽的责任或采取行动保护个人的权利。“善”是一种价值判断,是对结果的评价。“善”寓意为“具有道德价值的性格和个人品质”,这种性格与个人品质的特征通常指向“美德”一词。文献梳理发现,学界目前对教育数据伦理的探讨及省思主要集中在教育数据权益层面及教育数据行为层面。一方面,隐私泄露侵害尊严、数据依赖束缚个体发展、数据主导决策禁锢学业进步等成为影响教育数据权益“正当”化保障的常见问题(张燕南, 等, 2016; 李建伟, 等, 2018)。另一方面,数据决策偏差与歧视、数据存储相对割裂、数据传输安全性较差等成为制约教育数据行为“向善”的关键问题(戚万学, 等, 2019; 刘金松, 2017)。归纳来看,数据隐私、数据利益属于数据权益层面,而且数据权益直接关系数据之“正当”能否达成,这在一定程度上涉及公众对于数据行为是否符合公平正义的评判;数据责任、数据服务属于数据行为层面,其是否“向善”取决于社会公众对相关责任行为与服务行为的价值评判。由此,可将智能时代教育数据伦理风险划分为教育数据隐私侵害风险、教育数据利益失衡风险、教育数据责任失守风险和教育数据服务偏见风险(见图1)。
一是教育数据隐私侵害风险。若盲目跨越教育数据采集与流转的限度与边界,则会造成教育数据泄露损害人格尊严与意志表达、用户数据隐私权利遭受不法侵害等一系列教育数据伦理问题。二是教育数据利益失衡风险。在师生教育数据通过群集共享逐渐演变为“教育数据资产”的过程中,由此牵引出的相关利益分配矛盾催生诸多教育数据伦理风险。数据割裂、数据垄断等教育数据利益关系失范现象阻碍了教育数据的开放共享与合理流转,使得学生、教师等教育用户在教育大数据运行过程中获得的数据利益远远不足,掌握大量教育数据的机构与组织正在借此产生越来越多的机构意识和权力(Nersessian, 2018),个体数据利益让位于机构数据利益,严重打破了教育数据利益分配的应然平衡。三是教育數据责任失守风险。教育数据采集、存储、分类、整合与共享等方面均应体现相应的责任意识,如果没有进行适当的数据责任划分并忽视专业数据管理责任队伍建设,则容易导致数据责任意识低下、行动责任失当、责任归属不清等教育数据责任失守现象,从责任伦理学视角而言,这是教育数据责任失守所造成的伦理风险。四是教育数据服务偏见风险。例如,未获得及时更新的教育数据束缚了学生的长远发展,可追溯的过往数据记忆成为个体入学或求职时的评估依据,并为当事人贴上具有某种暗示意味的“电子标签”(邹太龙, 等, 2020)。
三、智能时代教育数据伦理风险
治理的现状与问题
治理一词由来已久,其寓意“依理而治”,其中“理”有“情理”“道理”“法理”等义。数据治理是依据一定的道理、情理、法理等对数据相关事项的决策与组织。从数据治理到教育数据伦理风险治理,治理的范畴更为具体化,更为关注教育领域数据伦理风险的有效化解。教育数据伦理风险治理可被视为政府、学校、社会教育机构、社会组织等治理主体依据一定的规则,对教育数据相关事项的决策与组织。随着人工智能等新兴信息技术便利教育教学发展,数据治理的伦理原则失位、数据隐私侵犯导致人格尊严侵害、教育数据责任失当、数据质量低下、数据安全和隐私监管不完善等现实问题成为制约智能教育发展的关键要素,面向智能教育的数据伦理风险治理显得日益迫切。当前,学界对教育数据伦理风险治理的认识仍停留在传统技术手段层面,且对其概念内涵的剖析诠释仍需深入,研究视角上也缺少伦理学等哲学观照。智能时代的到来助推了教育数据伦理风险治理的战略转型。战略转型不仅意味着机遇,也在一定程度上呼唤对于教育数据伦理风险治理困境的合理应对。本研究面向学校管理者,就“教育数据伦理风险”这一主题展开大规模实证调研,旨在深度挖掘当前教育数据伦理风险治理所面临的主要困境。
基于前文所述,本研究拟基于教育数据隐私、教育数据利益、教育数据责任、教育数据服务四个维度,参照Yanosky等人(2015, pp.1-34)围绕教育数据分析与应用现状所开展的教育调查内容,并结合对H大学5位教育人工智能、技术伦理学领域学者的访谈结果,設计了智能时代教育数据伦理风险治理现状调查问卷。除基本信息题项外,问卷中各题项均采用李克特五点量表形式(从非常不符合到非常符合)予以呈现。相对于高校学生,中小学生心智发展尚未完全成熟,数据风险防范意识与能力可能较为薄弱,基础教育领域易受多类数据伦理风险的冲击,且从现有研究与实践来看,基础教育领域数据伦理风险治理的相关研究较为缺乏,因此本研究选择面向中小学开展调查,分析教育数据伦理风险治理的现状与问题。
首先,选择江苏W市60位中小学管理者进行预调研施测,基于预调研样本数据对问卷进行信效度检验。数据分析结果显示,整体量表的KMO统计值为0.876,Bartlett球形检验结果的P值<0.001,表明问卷适合进行因子分析。对整体问卷进行探索性因子分析,抽取出4个公因子,累计方差解释率达到78.961%,表明因子结构较为可靠。如表1所示,依据因子载荷图可知,题项A1到A4构成教育数据隐私维度,题项B1到B3构成教育数据利益维度,题项C1到C5构成教育数据责任维度,题项D1到D3构成教育数据服务维度,与本研究基于教育数据隐私、教育数据利益、教育数据管理、教育数据服务对教育数据伦理风险进行分析的框架结构相一致,表明问卷具有较好的结构效度,可作为正式调研问卷。
之后,基于正式调查问卷,本研究选取浙江、江苏、上海等经济发达地区的教育人工智能示范学校作为调研学校,利用问卷星平台面向中小学管理者投递电子问卷,于2021年5月启动调研工作,并于2021年8月上旬完成数据收集工作。调研结束后,回收有效问卷1,731份。利用Cronbach’s α、CR、AVE值检验问卷信效度。如表2所示,整体量表的Cronbach’s α值为0.979,各分量表的Cronbach’s α值在0.885与0.964之间,证明问卷具有较好的内部一致性信度;验证性因子分析结果显示,各分量表的CR(组合信度)值均在0.8以上,表明量表的组合信度较好。各分量表的AVE值均大于0.5,表明量表的收敛效度较好。此外,验证性因子分析结果显示,模型拟合较好,RMSEA、CFI、SRMR指标均达到测量学标准(RMSEA<0.08;CFI≥0.90;SRMR<0.06)。综合上述分析结果,可知问卷通过了信效度检验。
智能时代教育数据伦理风险治理现状的描述性分析结果如表3所示。总体而言,智能时代教育数据伦理风险治理现状的均值水平为3.615,其中,不同方面的教育数据伦理风险治理现状的均值范围在3.546与3.668之间。由此可见,在智能时代背景下与智能教育场域之中,对教育数据伦理风险的治理尚存较大改进空间。同时,根据不同学校教育数据伦理风险治理现状的对比分析结果(如表4所示)可知,公立学校在教育数据伦理风险的治理上显著优于私立学校,而城区学校与非城区学校在教育数据伦理风险的治理上不存在显著差异。其原因可能在于,有效保护师生教育数据隐私与利益、践行教育数据管理责任、提供符合“公正”“有益”等伦理标准的智能化教育数据服务,均需依赖于学校领导、区域教育行政部门予以战略重视、技术支持与资源投入,而这也往往与学校和学区之间的行动一致性、经费投入水平、高质量人才资源的建设等密切相关,故公立学校在教育数据伦理风险的治理上具有更好的成效。具体而言,本研究进一步将智能时代教育数据伦理风险治理所面临的主要问题与困境归纳为以下四个方面。
(一)师生教育数据隐私权与开放共享存在冲突
智能时代教育数据隐私安全问题的滋生与教育数据采集与流动规范的缺失存在较大关联,但目前指向良性数据采集与流转的数据规范政策规章设计以及数据隐私安全防护机制构建往往被忽视,多种教育数据采集实体的师生数据采集行为往往缺乏明确的监管与规约,是否会出现利用采集所得的师生数据过度牟取商业利益等现象值得予以关注。本研究发现,68.92%的学校管理者担忧教育数据将被用于不正当用途或非法用途。由于部分技术开发商过度挖掘并利用师生隐私数据,严重损害了师生的教育数据隐私权利,师生教育数据隐私权与开放共享之间的冲突成为教育利益相关者的“数据隐忧”。在智能时代教育数据开放共享的同时,大规模且无序的教育数据信息流向何处、如何流动尚未可知。
首先,我们着实面临一个典型矛盾:如果拒绝数据开放共享,我们便无法使用智能技术带来的各种便利;如果允许数据开放共享,由于数据收集与传输过程的不确定性等问题,师生的隐私便很可能受到侵犯(Saugmann, Mller, & Bellmer, 2020)。其次,数据价值的实现以数据流动为载体,由于智能时代数据流动具有高速、联通等多重属性,这些属性也意味着数据“难以控制”,易被各大商业平台与校外机构用于商业用途,造成师生教育隐私权与数据开放共享利益的二元对立。最后,数据开放共享失范制约数据价值释放。数据是意义与符号的综合体,若数据开放共享过程合法且得当,则有利于更好地发挥数据价值,否则,则会导致别有用心者可以从一大堆杂乱的数据信息中精准捕获个人的隐私信息、预测人们的隐私行为(董军, 等, 2017)。
(二)教育数据利益博弈失范制约教育数据价值的充分释放
数据价值的释放在很大程度上依赖于数据的采集与共享,对于数据采集与共享而言,一般处于一定的利益博弈关系之中。尽管依托智能感知、人脸识别、机器学习等智能技术可较为便利地从教育领域采集“音容笑貌”“衣食住行”等方面的多维数据,然而本研究发现,题项“您清楚地了解教育数据在产生后被谁收集并利用”得分均值仅为3.48,数据采集后交由谁来分配、共享给谁、如何共享等尚存较大的改进空间,许多师生数据集(如访问记录、位置记录、社交网络连接、搜索历史、教育服务产品购买历史和面部识别等多种信息)极易被教育机构或管理者收纳为私有资产。由此可见,教育数据利益博弈失范成为制约教育数据价值的关键所在。
一方面,智能技术开发商与师生等人的利益诉求存在偏差,而且不少智能教育软件系统采用独立开发的系统架构,不同软件服务的数据对接端口并不一定自由匹配,不同软件服务所产生的数据一般暂时封存在各自的数据平台(Von, Wernick, & Olk, 2019),如何实现跨部门或跨领域的数据交换尚缺乏统一的标准与规范,教育数据存储与共享存在局部隔离性,限制了教育数据的价值传递。另一方面,本研究发现,题项“您能够较为方便地通过数据平台获取您所需要的教育数据”得分均值仅为3.67,尚有较大提升空间。究其原因,智能服务所蕴藏的精准识别、个性化服务等众多特性的发挥需要基于尽可能开放的数据共享,但目前技术开发商或机构出于商业利益或其他非正当诉求,侵害师生等人的数据用途知情权。不少学校、机构或部门将教育数据视为重要战略资产,严格限制数据的开放流动,这在避免数据泄露的同时也造成了数据垄断。
(三)治理主体数据素养不足制约教育数据责任落实
随着数据智能成为当前教育人工智能发展的关键特性,如何在教育数据治理过程中有效担负数据责任成为达成智能时代教育数据伦理目标的关键所在。教育数据风险治理需依赖于学校管理者、教师、政府等共同参与,也需在治理主体间构建具有约束力的责任规则(赵磊磊, 等, 2021)。对于教育数据责任体系构建而言,不仅应着力建立规范的教育数据采集标准、存储原则、开放制度与责任规则,也应注重教育数据管理组织的专业能力提升,仅仅关注学校管理者、信息化工作人员的教育数据责任厘定可能会导致教育数据风险治理产生“局限性”,进而使得教育数据质量与安全性受到极大削减。而且,各方治理主体开展数据治理的能力基础——数据素养也是影响教育数据责任落实情况的关键所在。
首先,本研究发现,58.06%的学校管理者认为学校在收集与使用师生教育数据时并不会产生伦理风险。学校管理者往往较少关注数据隐私安全、数据归属与产权等教育数据伦理议题,而且题项“您所在的学校制定了完善的教育数据责任规则”得分均值仅为3.66,这表明当前教育数据责任规则的制定尚存明显不足,如何根据伦理标准对教育数据责任进行合理界定尚待进一步探索。其次,本研究发现,题项“您对教育数据管理责任与数据技术使用方式的关注度高于技术本身”得分均值仅为3.61,这表明不少学校管理者侧重于对外宣传“眼花缭乱”的数据技术与智能技术,对于数据责任的履行缺乏关注。最后,本研究发现,有38.36%的学校从未举办过教师数据素养或信息素养培训,这表明当前学校在一定程度上忽视了如何建设具有较高数据治理素养的专业数据治理队伍,治理主体的数据素养不足进一步制约了教育数据责任的有效落实。
(四)对师生教育需求的片面捕捉催生教育数据服务偏见
人工智能作为非结构化数据处理的关键支撑技术,能够有效处理网络学习(学习性阅读、在线教育)数据(罗俊, 2016),由此生成的智能化教育数据服务是助推智能时代教育数据的巨大使用价值得以释放的关键因素。智能教育服务质量与对师生教育需求的精准捕捉有关,人工智能算法的实现在很大程度上依赖于教育数据挖掘与预测(袁利平, 等, 2018)。然而,本研究发现,题项“教师和学生的数据能够被全面地采集”得分均值仅为3.63,教育数据采集与挖掘的全面性尚待提升。教育数据挖掘与预测受制于数据规模及质量,教育数据采集的规模较小、不全面、不系统、更新缓慢、质量低下等问题严重影响师生教育需求信息的有效反馈,大量零散、冗杂、无用、过期的教育数据以及由此形成的低质量数据训练集也将影响教育数据服务算法模型的精确构建,并进一步催生教育数据服务偏见,这也是影响人工智能赋能个性化教育发展的关键制约因素。
受制于“算法黑箱”,教育服务生成机理的“不透明”特性同样引发了诸多教育数据伦理问题。例如,未公开的规则算法基于特定数据指标将教育用户自动归类,使得基于智能算法推荐的教育数据服务产生了“不公正”的伦理意蕴。具体来看,一方面,尽管依托大数据技术实现的数字记录可基于数据的相似度实现对个体未来行为的预测,但是,个体的生理、情感、心理在与环境的交互作用中不断演进与变化,使得难以精准捕捉不断变化的师生利益需求并提供个性化的教育数据服务。另一方面,跨领域、跨机构、跨部门的数据流通与共享机制尚待建立健全,“数据屏障”阻碍了规模化教育数据的形成,且由于当前师生的利益需求具有多阶段性、变化性和多面性特征,其在使用不同软件服务时所生成的动态数据倘若未得以及时整合,很可能面临与个性化需求相对应的多维数据流失,基于个性化需求分析的智能教育服务有可能沦为空话。
四、智能时代教育数据伦理风险的治理路径
面对上述现实困境,智能时代教育数据伦理风险治理依然任重道远。具体而言,教育数据伦理风险治理涉及主体(教育数据的伦理风险由谁来治理)、客体(教育数据伦理风险治理的对象是什么)、路径(主体与客体间的作用关系)三个方面。对于教育数据伦理风险治理而言,治理主体主要包括政府教育行政部门、学校、社会组织等群体;治理客体是被治理主体所作用的目标事务,是数据治理活动展开的依据和中心;治理路径是连接治理主体与客体的关键工具。在智能时代,有效推进教育数据伦理风险治理,将呆板的算法和冰冷的数据资源变为实现科学决策、有效治理的“利器”,或许是未来实现教育数据治理体系和治理能力现代化的一条可行之路。基于前文所述,围绕数据隐私泄露风险防范体系、教育数据权益监管体系、教育数据伦理风险治理组织和“去偏见化”教育数据服务机制,提出智能时代教育数据伦理风险的治理路径(见图2)。
(一)尊重教育用户数据隐私控制权,优化数据隐私泄露风险的防范体系
人工智能、5G等新技术的发展实现了教育数据的高速流动与共享,也引发了公众对于隐私保护、隐私权益等问题的关注与讨论。如何针对不同类型教育数据隐私安全问题设置风险级别与治理要求缺乏体系保障,且学校层面对教育数据隐私风险的识别与判断力还很薄弱,因此应尊重教育用户数据隐私控制权,优化数据隐私泄露风险防范体系。首先,应充分尊重教育用户的数据隐私控制权,可通过加密、脱敏、日志跟踪、数据審计等技术手段以及一系列合法数据安全规范的支持,实现师生等人教育数据隐私权的合理保护(董晓辉, 等, 2019)。其次,建立具有强约束力的数据安全协议。学校可与教育技术服务实体签订学生和其他教育数据服务协议,对以下版块进行规约:“将收集哪些数据”“为什么要收集数据以及如何使用数据(披露目的)”“如何保护数据(机密性、使用限制)”“将如何进行数据安全审计”“如何解决安全漏洞”,等等。最后,构建敏感数据安全存储与传输机制。对于敏感数据的安全传输,应通过强密码和多级用户认证或加密电子邮件来完成,也应确保所有网站都用数字证书保护。在机密报告或包含机密信息的媒体发布之前,对其进行标记或盖章,且应防止未经授权的人员访问学校数据库,应在不使用数据库时将其锁定或关闭。
(二)注重利益博弈规约,搭建教育数据权益监管体系
教育数据的采集、共享与流转等过程涉及较多要素,不同要素间的逻辑串联需基于一定秩序的结构框架,不同群体间教育数据利益的有效协调也需要一定的监管体系作为基础保障。因此,有必要注重利益博弈规约,搭建教育数据权益监管体系。一方面,可采取政策规约的手段,对教育数据采集、共享与流通等方面的权责边界进行合理厘定,规范组织、个人等利益相关者的数据权利与数据责任,避免因教育数据权责划分不清晰而导致的教育数据利益失衡现象,致力于破除机构或组织垄断大量教育数据的现象,最终实现教育数据利益相关者的“共赢”局面。另一方面,应依托人工智能、5G、云计算等技术,构建跨主体、跨部门、跨领域的教育数据利益诉求实时共享与流转渠道,充分尊重师生等人对于教育数据流动与使用的知情权与监督权,为教育用户获取与监管教育数据提供开放平台,健全教育用户数据利益诉求反馈机制,建立教育数据利益关系风险预警与化解机制(谭九生, 等, 2019),应注重挖掘师生等人的教育数据利益诉求,通过掌握教师教学效果、学生学习状态与轨迹等数据分析结果,为优化教学提供证据支撑。
(三)立足数据素养培育,培育专业化教育数据伦理风险治理组织
治理主体的数据素养是决定数据伦理风险治理成效的能力基础,治理主体数据素养不足将制约教育数据责任落实,因此极有必要立足数据素养培育,培育专业化教育數据伦理风险治理组织,这也是教育数据伦理风险识别与化解的迫切需求。首先,教育数据伦理风险治理主体应涉及数据人员、信息技术人员、学校管理人员等众多利益相关者,不同治理主体在观念、素养、价值观等多方面存在巨大差异,应基于治理主体的个体间差异与实际需要,开展数据素养系统化培育工作,培育专业化教育数据伦理风险治理组织。其次,区域教育行政部门可针对区域教育发展需求,制定数据伦理风险治理人才的数据素养标准,开展教师数据技能培训。再次,学校可适当开设数据素养培训课程,基于数据伦理风险治理队伍建设的实际情况,根据数据治理渐进性的特点,分阶段持续性投入资金,加强技术队伍建设(董晓辉, 2021),完善在线服务审查委员会、隐私政策制定和数据泄露响应团队等众多治理组织。此外,治理主体应主动提升自身的数据伦理风险识别能力与责任意识,深度挖掘教育数据采集、分析和使用过程中已出现的和潜在的伦理风险,基于数据伦理风险的实际特征进行积极反馈与决策调整。
(四)根植动态需求监测,构建“去偏见化”教育数据服务机制
精准把握教育用户的动态需求是提升智能教育服务质量的关键。为避免教育数据服务的供给过程产生决策偏见,需打造一体化的教育数据采集、存储、分析、决策体系,根植用户动态需求监测,构建“去偏见化”教育数据服务机制。一方面,应建立教育用户动态需求监测机制。尽管教育大数据、人工智能、5G等技术在很大程度上便利了教师教学、学生学习与学校管理,但鉴于师生所处情境脉络的复杂性及其认知与思维的发展性、多变性,应根据师生不断发展变化的身心特点与阶段发展规律,合理规定数据的存储与使用期限,定期实时更新教育数据监测系统数据,有效整合多维度、多来源、多类型的教育数据,为智能算法模型的运行提供高质量的数据支持。另一方面,建立基于证据的“去偏见化”教育数据服务机制。在以教育用户动态需求为决策证据的基础上,应构建教育数据“采集—登记—存储—分析—服务”一体化决策机制,在处理数据、智能技术与人的相互关系时遵循“有用”“无害”的伦理原则(刘三女牙, 等, 2021),生成“非偏见”的教育数据服务方案,从而实现对教育用户的公正对待。
五、结语与展望
教育数据治理对优化数据服务、赋能科学决策、推进教育信息化建设具有重要意义。与此同时,在以人工智能、5G、云计算等技术为核心支撑的智能时代,教育数据的“爆炸式”采集、分析与应用也催生了诸多教育数据伦理问题,若治理不当,则会阻碍“教育数据资产”价值的进一步挖掘。由此来看,明晰教育数据伦理风险的实然表征,厘定教育数据伦理风险治理的现实困境,最终凝练形成预警与消解教育数据伦理问题的有效路径,已成为智能时代推进教育数据治理的迫切诉求。
在智能时代,教育数据伦理风险治理实践如何跳脱唯技术视角,利用数据资源与资产更好地为教育教学服务理应成为教育信息化变革的重要趋势。面对当前师生教育数据隐私权与开放共享存在冲突、教育数据利益博弈失范制约教育数据价值的充分释放、治理主体数据素养不足制约教育数据责任落实、对师生教育需求的片面捕捉催生教育数据服务偏见等治理困境,未来教育领域数据伦理风险治理除了要培育专业化教育数据伦理风险治理组织,优化教育数据伦理风险预警与防范体系,也需思考未来教育形态下如何激发数据智能与捕捉师生利益需求,提供个性化、智能化的教育服务,并通过法律约束与政策规约的手段,将数据伦理准则内嵌于教育数据治理当中,最终实现智能时代教育数据伦理风险的有效防范与化解。
[参考文献]
董军,程昊. 2017. 大数据技术的伦理风险及其控制:基于国内大数据伦理问题研究的分析[J]. 自然辩证法研究(11):80-85.
董晓辉,郑小斌,彭义平. 2019. 高校教育大数据治理的框架设计与实施[J]. 中国电化教育(8):63-71.
董晓辉. 2021. 活动理论视角下高校教育数据治理体系构成要素研究[J]. 中国电化教育(3):79-87.
国务院. 2015-08-31. 国务院关于印发促进大数据发展行动纲要的通知[EB/OL]. [2020-11-20]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm
黄正华. 2012. 正当与善:优先性问题的问题[J]. 伦理学研究(4):11-15.
蒋洁. 2016. 复杂数据探勘的道德风险与规训机制[J]. 图书与情报(6):77-82.
教育部机关服务中心. 2020-11-21. 习近平出席二十国集团领导人第十五次峰会第一阶段会议并发表重要讲话[EB/OL]. [2021-01-12]. http://www.moe.gov.cn/s78/A01/s4561/jgfwzx_x-xtd/202011/t20201 124_501475.html
教育部. 2021-03-25. 教育部关于加强新时代教育管理信息化工作的通知[EB/OL]. [2021-06-12]. http://www.moe.gov.cn/srcsite/A16/s3342/202103/t20210322_521669.html
罗俊. 2016. 计算社会科学与人工智能[J]. 贵州师范大学学报(社会科学版)(6):40-42.
刘金松. 2018. 数据治理:高等教育治理工具转型研究[J]. 中国电化教育(12):39-45.
李建伟,苏占玖,黄赟茹. 2018. 基于大数据学习分析的在线学习风险预测研究[J]. 现代教育技术(8):78-84.
劳凯声. 2019. 智能时代的大学知识生产[J]. 首都师范大学学报(社会科学版)(2):1-6.
刘三女牙,杨宗凯,李卿. 2017. 教育数据伦理:大数据时代教育的新挑战[J]. 教育研究(4):15-20.
刘三女牙,刘盛英杰,孙建文,沈筱譞,刘智. 2021. 智能教育发展中的若干关键问题[J]. 中国远程教育(4):1-7,76.
梁迎丽,刘陈. 2018. 人工智能教育应用的現状分析、典型特征与发展趋势[J]. 中国电化教育(3):24-30.
梁芷铭. 2015. 大数据治理:国家治理能力现代化的应有之义[J]. 吉首大学学报(社会科学版)(2):34-41.
庞茗月,胡凡刚. 2019. 从赋能教育向尊崇成长转变:教育大数据的伦理省思[J]. 电化教育研究(7):30-36,45.
戚万学,谢娟. 2019. 教育大数据的伦理诉求及其实现[J]. 教育研究(7):26-35.
舒晓灵,朱博文. 2016. 知识发现与数据挖掘在计算社会科学中的应用[J]. 贵州师范大学学报(社会科学版)(6):49-53.
谭九生,杨建武. 2019. 人工智能技术的伦理风险及其协同治理[J]. 中国行政管理(10):44-50.
袁利平,陈川南. 2018. 人工智能视域下的宽度学习及在教育中的应用[J]. 远程教育杂志(4):49-56.
杨现民,李怡斐,王东丽,邢蓓蓓. 2020. 智能时代学习空间的融合样态与融合路径[J]. 中国远程教育(1):46-53,72.
杨宗凯. 2018. 基础教育信息化2.0:科技促进教育创新发展的中国路径[J]. 中小学数字化教学(4):23-25.
赵磊磊,张黎,代蕊华. 2021. 智能时代教育数据风险治理:实然困境与实践路径[J]. 湖南师范大学教育科学学报(6):94-102.
邹太龙,易连云. 2020. 舍恩伯格大数据教育应用思想的伦理关怀[J]. 中国电化教育(12):55-62.
张燕南,赵中建. 2016. 大数据教育应用的伦理思考[J]. 全球教育展望(1):48-55,104.
Floridi, L., & Taddeo, M. (2016). What is data ethics? Philosophical transactions. Series A, Mathematical, Physical, and Engineering Sciences, 374(2083), 1-13.
Massimo, P. (2003). On the Relationship between Science and Ethics. Zygon, 38(4), 871-894.
Nersessian, D. (2018). The law and ethics of big data analytics: A new role for international human rights in the search for global standards. Business Horizons, 61(6), 845-854.
Ambrose, D., & Cross, T. (2009). Morality, Ethics, and Gifted Minds. New york, NY: Springer US.
Rubel, A., & Jones, K. M. L. (2016). Student privacy in learning analytics: An information ethics perspective. The Information Society, 32(2), 143-159.
Saugmann, R., Möller, F., & Bellmer, R. (2020). Seeing like a surveillance agency? Sensor realism as aesthetic critique of visual data governance. Information, Communication & Society, 23(14), 1996-2013.
Von, G. M., Wernick, A., & Olk, C. (2019). Data governance: Enhancing innovation and protecting against its risks. Intereconomics, 54(4), 228-232.
West, E., & Prior, W. J. (1994). Virtue and knowledge: An introduction to ancient Greek ethics. Classical world, 87(3), 239.
Yanosky, R., & Pam, A. (2015). The analytics landscape in higher education: Report of EDUCAUSE. Louisville, CO: Educause Center for Analysis and Research.
收稿日期:2021-02-18
定稿日期:2021-10-05
作者简介:赵磊磊,博士,江南大学教育学院副教授,硕士生导师,贵州师范学院兼职教授(214122)。
张黎,硕士研究生,本文通讯作者;王靖,博士,副教授,硕士生导师。江南大学教育学院(214122)。
责任编辑 单 玲