“智能+教育”场域下数据治理的挑战与应然取向

2022-02-16 05:36赵磊磊吴小凡
关键词:场域师生人工智能

赵磊磊,吴小凡

(江南大学 教育学院,江苏 无锡 214122)

随着信息技术的不断发展,智能技术与教育教学的深度融合已成为教育创新发展的必然趋势。纵观教育领域中人工智能的应用发展历程,从初期基于规则的知识表征与推理,发展至当前基于深度学习的自然语言处理、关系挖掘与自适应算法,人工智能与数据的逻辑关系成为“人工智能+教育”相关产品与服务不容忽视的抓手[1]。无论是算法模型的改进还是模型预测分析,数据已成为人工智能赋能教育教学的信息媒介。数据智能成为人工智能融入教育发展新时期的关注焦点,在一定程度上驱动教育教学迈向智能化阶段。但数据智能并非完美之物,其服务也未绝对成熟,仍然处于不断改进与修正阶段。将此类处于进阶阶段的技术产物置于教育场域,有可能引发与数据所有权、隐私、安全和使用伦理相关的伦理问题[2]。“人工智能+教育”的实践过程中出现一些诸如数据监管不严、数据应用失范、数据隐私泄露等问题正是具体体现。由此引发一个极为关键的现实议题:“智能+教育”场域下数据应如何治理?智能时代的到来,尽管为教育数据的采集与处理提供了新的技术支撑与平台辅助,但“智能+教育”场域下数据治理也面临众多问题。因此,理清“智能+教育”场域下数据治理面临的实然困境与应然取向,对于促进教育教学智能化转型而言极具现实意义。

一、“智能+教育”场域下数据治理的内涵诠释

(一)“智能+教育”

以人工智能、大数据、云计算、物联网为代表的新科技正对人类生活进行全方位改造,中国已置身于全球“第四次工业革命”[3]。人工智能是计算机科学的前沿领域之一,是基于数据结构模仿、延伸人的智能的机器或应用系统,其具备超强的计算思维与数据分析能力。“智能+教育”与人工智能教育有所不同,它将人工智能应用于教育教学的全新领域,教学模型、学习者模型和领域知识模型是其核心[4]。作为“智能+教育”的重要实现形式,机器学习、自适应学习、智能教学系统(ITS)、智能计算机辅助学习系统(CAL)拓展了学习科学的外延。这表明,人类的科学演变已从单一的“数值计算”发展到系统的“逻辑计算”,计算机系统正逐步纳入基于人工智能的信息工程学内容,应对当前出现的“信息管理”和“信息交换”的智能时代难题。“智能+教育”场域下的数据使用与监管也在一定程度上呼唤公众审慎思考教育教学及其治理议题。

(二)数据治理

近年来,治理一词已成为学术界的流行用语。对公共行政而言,面对时代的变迁,针对许多新发展的公共议题,运用契约外包、公共课责、协力关系等非传统的公共行政知识难以得到妥善处理,需要新的理论概念来分析和解决问题,治理正好符合此新趋势的需求。治理意味着一种改变,其基本定义是“领航”或“掌舵”,但会因其使用者的需要,借用不同的理论进行研究,也因而有不同的涵义。这使得治理难以使用通用的定义和理论,各种新名词随之提出,如企业治理、网络治理、全球治理、良善治理。它们以治理为名,但实质为不同的概念,极易造成观念的混淆。因此,有关治理的研究尚未成熟,还有可供深入探讨的空间。正如麦克·查普(Mike Chapple)所述,政府巨量数据不断增加,但其现有数据政策与架构却无法处理巨量数据的挑战,需要系统性的方法技术与制度文化作为支撑[5]。数据逐渐由附属于特定业务信息系统功能的客体,转而成为被期待能驱动创新应用的主体,进而凸显了数据治理的迫切需求。基于美国大数据研究方面的权威机构“数据治理研究所”(The Data Governance Institute,DGI)的定义,数据治理是指针对系统数据相关事务的决策制定和权责明晰,说明谁(who)在什么样的情况(what),可使用什么方法与采取什么行动(how)[6],本研究将以此界定作为数据治理的基本解释。

(三)“智能+教育”场域下的数据治理

目前,学界对于“智能+教育”场域下的数据治理并未进行明确界定。但从词源学角度而言,这一概念可被视为“智能+教育”治理与数据治理两个领域的交叉产物。“智能+教育”场域下的数据治理必然需要以“数据善治”(Data Good Governance)作为起点或原则,通过收集、组织、分析及呈现数据,最大化释放教育数据的实际价值。在“智能+”时代,人工智能、大数据等科技飞速发展,且在多个领域产生了颠覆性的变革,但对于教育领域的渗透尚存在较多困境,其中便有智能技术与教育数据联动受阻等方面的原因[7]。此外,智能终端的数量剧增、智能设备高速运转的背后伴随着教育大数据的极速增长,并且在众多终端层面数据的流动速度也愈发加快。与各类教育数据相对应的数据资产、数据产权、数据价值等议题成为“智能+教育”可持续发展的关键影响因素。如何在教育领域充分开发大数据与人工智能所蕴含的无限潜能,成为数据治理过程中无可回避的重大挑战。

无论各种主体以何种方式开展数据治理,其核心都是要推动数据自由安全地流动,以便最大程度地挖掘和释放数据价值。“智能+教育”为“机器”的“类人化”发展提供了新的契机,其所承载的数据服务也极具“个性化”色彩,数据获取及流动渐趋定制化与智慧化已成为“智能+教育”场域下数据治理不可忽视的目标取向。

二、“智能+教育”场域下数据治理的现实挑战

当前人工智能进入校园仍处于初步发展阶段,学校治理人员对数据的关注度一般低于技术本身,不少学校管理者侧重于对外宣传“眼花缭乱”的人工智能应用,对于数据中心、数据治理机构、师生数据素养等方面建设的专业认知与能力存在严重滞后的问题,这也影响了学校数据服务的专业化供给效率与质量。人工智能、大数据等技术的发展为信息输送与交换提供了更多便利,也带来诸多隐忧。例如,校园内部的数据应用领域与渠道极速扩增,学生的相关数据通过各种途径扩散到多个平台与行业,甚至落入不法之人手中,这些数据是否能得到有效保护、是否被滥用则难以预测,而且教育数据产权的归属问题尚缺乏明确的限定,等等。综合来看,可将“智能+教育”场域下数据治理的现实挑战概括如下:

(一)治理主体的数据治理能力较低

国内数据治理智慧化的建设尚处于初步发展阶段,较为强调以技术管理为中心,易忽略数据治理主体专业素质不过关、用户个性化需求未凸显、人工智能与决策管理应用耦合不紧密等问题[8]。从“智能+教育”场域来看,治理主体的数据治理能力较低已成为制约数据治理成效的关键要素,这也在一定程度上呼唤治理主体数据治理能力的有效提升。首先,当前教育数据治理主体缺乏对数据特征、数据逻辑与信息转化的精准分析和把握,在知识学习、知识图谱与自然语言处理等人工智能技术掌握方面有所欠缺,并未形成面向大数据智能化时代的信息分析范式。其次,治理主体的数据治理能力培养尚未被纳入当前教育数据治理框架的核心层,数据治理主体缺乏基于大量实践的教育证据而形成科学的数据决策意识,具有智适应特征的数据服务体系尚未建立,相应的教育数据安全保障机制与政策法规尚未有效制定与落实。再次,“智能+教育”场域下的数据治理情境多变且复杂,教育数据治理主体数据素养欠缺。治理主体在教育关键数据提取、深度分析、科学应用及实现关键信息到科学数据归纳的能力与专业素质方面存在严重不足,缺乏数据安全防范与化解意识,很难及时且有效地应对学校教育中的数据风险与技术风险。

(二)数据采集及共享商业化现象严重

人工智能赋能教育教学的同时,促使用户数据共享程度越来越高,随之也带来了用户隐私信息安全问题,影响着移动互联网中教育数据的规范化运作[9]。教育教学与社会层面的商业往来也日益增多,部分技术开发商与供应商价值取向偏离教育本质,遏制了教育信息化发展。“智能+教育”场域下数据高速流转,一经产生,就脱离了自己的母体,易被各大商业平台与校外机构用于商业用途,造成师生教育隐私泄露。为谋求商业利益,数据的过度采集与违规使用可能导致个人隐私信息泄露或被窃取,此外,非法交易数据等问题层出不穷,数据采集及共享商业化现象严重成为数据治理的一大困境[10]。首先,教育数据来源多样化导致的隐患。“智能+教育”场域下数据来源多样、要素分散、结构开放且无整体性,使得管理员很难对其进行逐一筛查跟踪。极易因监管不力导致信息泄露。其次,教育数据传输安全方面的隐患。网络传输协议安全性的升级有可能滞后于智能技术本身,“智能+教育”场域下的数据传输可能依然使用传统的传输协议,网络数据传输可能遭到窃听、拦截、假冒等第三方的攻击。再次,教育数据存储和应用方面的隐患。数据存储受专业设备管理、规章制度制定等众多因素影响,其流程对人力、物力与财力消耗巨大。然而,学校在人、财、物等方面的投入可能具有局限性。若缺乏对数据隐私的有力保护,则会导致师生校园活动、课堂教学、饮食习惯等方面的私人数据流向非正当渠道[11]。此外,教育相关部门数据保护意识、内部管理、技防能力薄弱,数据泄露事件时有发生,电信欺诈、骚扰电话等现象屡禁不止,严重侵害师生权益。

(三)数据资产建设及产权意识薄弱

数据资产的价值发挥是推进“智能+教育”发展的重要助力[12]。然而,“智能+教育”场域下数据资产建设存在产权意识薄弱的问题。例如,教育数据知识产权行政管理机构建设滞后、教育资产建设理念落后、教育数据产权归属不清晰、教育数据专利审批制度不健全等[13]。尽管多年的教育信息化建设已为中小学数据存储及管理设备的更新奠定了基础,但由于“智能+教育”场域下的数据生成速度极快,教育数据资产化集聚的实现,仍需依赖于学校管理者、师生数据观念及其产权意识的转变。首先,数据资产实质上是一种软资产,其来源广泛且标准不一,暂时难以被划定归属范围。其次,当前学校教育数据产权制度尚未健全,教育数据的使用主体对教育数据的使用权、下载权、共享权的认识仅停留在初步感知阶段。不少管理者、师生未能有效关注有意义数据的采集与存储,也未将教育数据资产所隐藏的教育特征与规律予以精准挖掘,难以基于证据挖掘进行精准分析与预测,使数据具有“智能”且能“说话”的能力严重欠缺。

(四)数据应用及监管标准缺乏一致性

当前“智能+教育”服务在数据应用及监管方面依旧存在不少技术局限性[14],不同机构间的教育数据标准存在较大差异,不同智能系统间的数据接口存在对接障碍,教育数据的定向流动与全局共享受到重大影响。在此背景下,数据应用及监管标准缺乏一致性成为“人工智能+教育”场域下数据治理的一大困境。首先,由于业务条线繁杂、业务种类多样,多个教育部门往往数据采集标准不一,统计口径各异,同一数据源在不同部门的表述可能完全不同,看似相同的数据实际含义也可能大相径庭,数据一致性难以保障。其次,不同教育部门基于维护各方利益造成信息封锁,导致信息资源使用效率不高,不同教育主体间数据共享与开放程度较低,数据资源浪费现象多有发生。同时,基于信息资源开发的市场机制还未健全,统一的信息资源管理协调机构尚未建立,维护教育信息资源共享的法律法规相对滞后。再次,如何实现不同智能教育应用系统之间的跨领域整合与无缝流转,仍然是教育数据治理的一大难点。由此导致教育数据采集与共享存在信息遗失与失真,造成基于教育数据的个性化决策难以精准捕捉师生利益需求的问题。无论是智能教学、智能管理,还是智能校园生活,大批量的数据来源于为完成特定任务而开发的各式软件服务,相应的软件服务所生成的数据在内容、维度、性质、用途等多个方面存在交叉与区别[15],而且不同软件服务的数据格式缺乏统一的要求与规范,不同软件服务所产生的数据一般暂时封存在各自的数据平台。

三、“智能+教育”场域下数据治理的应然取向

基于“智能+教育”场域下数据治理的困境分析,当前数据治理应从以下四个方面建构未来教育数据治理的实践取向。

(一)立足人才培育,加强师生智慧化数据治理能力培养

教育数据治理专业人才的培育对于数据驱动下的“智能+教育”发展具有基础导向价值。师生作为教育数据治理体系中的核心群体,加强其智慧化数据治理能力培养,对于夯实教育数据人才储备,实现教育数据增值,提升教育数据加工成效等具有重要的现实意义。首先,注重师生专业化数据加工能力的培育。“智能+教育”场域下数据治理的关键不在于搜集庞大的数据资料,而是将教育数据有效化、意义化与价值化,要求师生具有专业化的数据加工能力。其次,促进师生计算思维能力的发展。师生计算思维能力的培养是影响其数据统计与分析效果的关键因素,应引导师生学习计算机科学(如数据挖掘、机器学习等人工智能技术)、数学等专业基础知识,并在数据获取、存储和检索等方面进行深入了解和投入到教育数据治理实践,学会在实践中总结智能教育服务进程中的数据处理特征与规律,积极感知当前人工智能进校园所面临的数据困境或难题,从知识学习与数据感知的角度,有效提升师生的计算思维能力。

(二)基于区块链应用,构建教育数据安全防范与化解机制

以点对点传输、公式算法等技术为核心的区块链,可为“智能+教育”场域下数据流动提供新的便捷途径。目前,数据采集及共享商业化现象严重,数据安全隐患突出。基于区块链应用,构建教育数据安全防范与化解机制,有利于将“智能+教育”场域的数据传输及共享纳入较为规范且安全的跨域数据治理结构体系。首先,应建立基于区块链的教育数据跨区域多主体协同共享机制。加强跨界合作可以有效提高数据质量[16],政府应牵头组织建立基于区块链的教育数据跨区域共享机制与治理标准,在政府、企业、学校不同主体间组建教育数据采集与整合专门监测机构,明确教育部门、学校及师生的数据访问权责,智能监测及抓取数据调用行为记录,实现数据安全问题的精准问责。其次,应利用区块链技术,打造智能数据治理合约,力求尽快实现不同种类数据的采集、聚类与分离,利用深度学习进行智能认知,有针对性地解决“重复性数据、交叉性数据、缺失性数据、单一性数据”等方面的数据难题,并实现智能数据风险预警与自动执法。再次,应充分利用区块链的分布式存储及加密技术,结合图像分析、语音识别等智能感知技术,加强教育大数据挖掘与分析平台的建设,完善教育数据的结构化存储与安全过滤方案,实现“伦理—灵活—精准—高效”的一体化集成的大数据信息交换中心,保障数据在教育主体、教育场景、技术平台间流转的真实性,形成符合教育伦理与数据伦理的防范机制,化解数据伦理失范风险。

(三)指向数据价值激发,注重培育数据产权意识与专业数据管理机构

数据治理不仅涉及短期层面数据质量的提升,更是一个长期持续完善和优化的过程[17],这在一定程度上要求数据治理者具备不断发现与挖掘数据价值的意识与能力。数据资产建设及产权意识薄弱属于当前我国教育数据治理的一大困境。因此,应指向数据价值激发,注重培育数据产权意识与专业管理机构,这对于数据治理的可持续发展尤为关键。首先,应明确教育数据产权归属问题,建立安全长效的数据产权及隐私保障机制。引导数据治理参与者在关注新技术及其效能的同时,关注技术应用背后所隐含的数据价值及其主体归属,培育不同治理主体的数据产权意识,进而降低教育数据接触者窃取数据动机的可能性。其次,应注重培育专业的教育数据管理机构。教育数据价值的实现关键在于教育决策者以客观数据为基础,以智能分析为指导,作出符合教育发展规律的决策或提供较为精准的个性化教育服务。然而,“智能+教育”场域下数据的生成、采集与共享往往具有随机性,且教育数据的类型与质量可能存在较大差异,这在一定程度会影响到教育决策与服务的质量。为此,建立专业的教育数据管理机构,注重教育数据的过滤、存储与定制化使用,有利于最大限度激发教育数据价值。

(四)落位信息偏差控制,架构系统化的教育数据应用与监管体系

当前,数据应用及监管标准缺乏一致性成为“智能+教育”场域下数据治理的一大难题。为此,落位信息偏差控制,架构系统化的教育数据应用与监管体系,极具实践价值。首先,深入挖掘信息处理规律,尝试构建校级数据运行与处理审查机制。应深度剖析人工智能进校园背后的数据处理规律与特征,抛开智能技术的表层光环,由校级教育数据治理委员会或小组思考教育数据生成、交换、分析、应用等方面的实际问题,消除恶意数据传输、数据伦理失范等基础性信息漏洞。其次,落位信息服务分级,构建校本化的人工智能校级数据需求评估机构。基于机器学习、自然语言处理等智能技术,审视教育人员信息需求的动态变化趋势,分析不同数据服务间的逻辑关系与结构模型,根据数据服务优先级与数据治理管理标准,对数据需求的满足进行动态调节,尽可能满足教育公共利益基础上的数据需求。再次,关注信息处理协同,注重构建系统化的数据风险预警与防范机制。以预警与防范为起点,实现数据治理主体的多领域信息处理协同,提升数据治理对于教育大数据风险的识别与判断能力。基于人工智能的识别与预测技术,及时预警重大数据应用风险的发生范围与可能后果,保障师生的数据资产与权益。

以情感计算、机器学习、自然语言处理等为代表的人工智能技术的运用,及时地实现了教育资讯与信息的获取,对于教育数据采集与流动等众多方面的变革提供了新的时代机遇。教育大数据决策服务平台、课堂教学行为监测系统、学情追踪与分析系统、机器学习等众多应用场景所产生的教育数据并非仅仅停留于校园内部,而是有可能被输送到不同的大数据平台或计算机云端。如何保障教育数据精准输送到定点接收方的同时而不被窃取?如何保障教育数据在流动与共享方面畅通无阻?相关问题的解决将在很大程度上影响“智能+教育”场域下数据治理的持续推进。在未来智能教育发展过程中,如何保障师生数据利益及产权不受非法侵犯,仍是任重道远的现实议题。

猜你喜欢
场域师生人工智能
民主论辩场域中的法律修辞应用与反思
百年党史场域下山东统战工作的“齐鲁特色”
初中历史教学中师生的有效互动
激活场域 新旧共生——改造更新项目专辑
中国武术发展需要多维舆论场域
2019:人工智能
人工智能与就业
数读人工智能
下一幕,人工智能!
麻辣师生