人工智能赋能高校数据治理:逻辑、挑战与实践

2022-01-25 01:36赵磊磊
重庆高教研究 2022年1期
关键词:数据服务数据管理决策

赵磊磊

(江南大学 教育学院, 无锡 214122)

一、问题提出

随着人工智能技术的不断发展,人工智能从概念层面逐渐落地形成众多“类人化”的产品与服务,实现了对传统信息技术的实质性突破[1]。信息技术变革具有阶段性,从传统信息技术到人工智能、5G等新技术,不同阶段的信息技术催生了具有不同特征类型的社会时代。治理一词寓意“依理而治”,不仅强调多元参与和民主管理,也有凸显治理主体依据情理、法理与伦理规约治理客体之意[2]。对于数据治理而言,其与信息技术的应用过程紧密相关,从技术时代更迭的角度审视高校数据治理的历史变革具有一定的合理性。纵观已有研究,较多学者将社会变革分为农业社会、工业社会、信息社会等。从以个人计算机、早期移动通信技术等为支撑的信息时代[3],到以大数据挖掘与分析等核心技术为支撑的数字时代[4],再到以人工智能、5G等新技术为支撑的人工智能时代[5],高校数据治理的基本形态也存在诸多差异。

在信息时代(高校数据治理的初始探索阶段),多场教育信息化知名会议(如2009教育信息存储大会暨数据管理与虚拟化应用研讨会)均以“教育数据挖掘”等为主题开展研讨,这表明教育数据挖掘、教育数据分析等技术方法受到各界人士的共同关注[6]。随着教育信息化进程的深入推进,各种独立的教学管理信息系统、线上教育服务平台不断涌现,这些数字化平台虽然收集和存储了大量教师教育行为数据信息、学生基本数据信息、学习轨迹数据信息等,但由于信息时代教育数据分析、挖掘等技术发展的相对滞后,此类教育数据并未得到规范而全面的挖掘,高校数据治理处于效率不高的起步阶段。

在数字时代(高校数据治理的快速发展阶段),自2011年麦肯锡公司(Mckinsey Company)提出大数据概念后,美国等教育发达国家尝试建立大规模的教育数据治理体系,并逐渐发展成为常态化的教育数据集成中心[7]。我国也意识到数据的重要价值,基于数据的新型应用服务逐步成为国内高校信息化建设的重点关注领域,教育大数据、“互联网+”等诸多技术及理念为高校教育数据治理的推进提供了新的思路与路径。但是,这一时期大多数高校尚未真正构建起规模化、系统化的数据治理模式,高校对于“技术”的关注凌驾于“数据”之上,不少高校没有在学校实践层面将数据治理单独作为核心议题,并未形成系统的实施模式。

在人工智能时代(高校数据治理面临战略转型阶段),“2017年成为人工智能的‘应用元年’”[8]。随着5G、人工智能等技术与教育教学深度融合的持续推进,高校数据治理进入了智能时代的“战略转型期”,部分高校在教育数据治理的技术设施与人才储备等方面较为匮乏,智能技术的应用也带来众多数据安全隐忧与伦理风险,例如隐私数据泄露、数据茧房、算法歧视等。《教育部机关及直属事业单位教育数据管理办法》等规范文件和标准相继颁布,以期能够规避相应的数据风险。仅有少数学者针对如何推进智能时代教育数据治理展开了讨论,如宋苏轩等人尝试从物理层、控制层、业务层等方面设计智能时代高校数据中心体系架构[9]。然而,人工智能如何赋能高校数据治理这一议题亟待进一步挖掘。

综上,5G、人工智能等技术的高速发展与应用为社会形态与结构带来了重大变革,智能时代随之而来。《新一代人工智能发展规划的通知》《中国教育现代化2035》等政策文件的颁布均将“人工智能与教育深度融合”视为国家重要发展战略。在人工智能时代,教育数据高速产生与流动,技术“类人”特性的发挥与“数据智能”激发紧密相关[10]。如何治理日益庞大的数据集,消解数据使用风险,释放数据价值,成为人工智能时代高校数据治理领域亟待解决的重大议题。在高等教育领域,智能感知、自然语言处理、机器学习等智能技术与大数据的融合,促使“音容笑貌”等多维数据的全面捕捉成为现实,但在高等教育领域,人工智能如何赋能高校数据治理尚未明晰。本研究尝试聚焦人工智能赋能高校数据治理的基本逻辑与现实挑战,找寻人工智能赋能高校数据治理的实践路向,以期为人工智能时代高校数据治理工作的有效推进提供参照。

二、人工智能赋能高校数据治理的基本逻辑

人工智能也称为机器智能,其概念最初是在20世纪50年代中期Dartmouth学会上提出的。简言之,人工智能是计算机科学的一个分支,它创造出“智能”机器来工作和做出类似人脑的反应,可基于知识工程和机器学习处理数据,以便感知、推理、计划、解决问题、做出预测和操纵对象[11]。从广义上讲,人工智能可以描述为“数字计算机或计算机控制的机器人执行通常与智能生物相关的任务的能力”;从狭义上看,人工智能是“计算机从数据中学习的能力,且具有类人素质(包括推理、意义形成、概括和从过去经验中学习等心理过程)”。从定义看出,人工智能赋能数据的基本关注点可概括为收集数据、根据数据推出结论、基于海量数据的预测等方面。就高等教育领域而言,若想剖析人工智能赋能高校数据治理的基本逻辑,可尝试分析高校数据治理的逻辑维度。部分学者从数据服务、数据管理角度出发阐明数据治理的价值逻辑,如董晓辉认为,数据治理规定了必须开展的数据服务活动,定义了谁在数据管理中做什么,并将数据作为实际资产进行管理[12]。也有学者尝试从数据质量角度阐述数据治理的功能逻辑,如王正青等提出,数据治理活动包括业务活动(如维护数据质量)、战术活动(如建立和运行数据质量管理)和战略活动(如制定数据质量管理战略)[7]。还有学者从数据决策责权角度对数据治理的规则逻辑予以分析,如刘金松指出,高等教育数据治理决定了处理数据的人的责任和决策权[13]。

综上,有关数据治理价值逻辑、功能逻辑、规则逻辑的阐述较多,本研究尝试综合有关数据治理逻辑的观点,尝试从治理要素分解的角度审视数据治理逻辑的架构,将数据质量、数据服务、数据决策、数据管理4个方面视为人工智能时代高校数据治理的核心要素,并尝试阐述人工智能赋能高校数据治理的基本逻辑(如图1)。首先,数据管理涉及对数据的采集、分类、整合及存储,“管”好各类数据有利于推动“数据信息提取与应用”,这也是有效推进数据治理的技术支撑。其次,数据质量的好坏是影响数据治理成效的关键因素[14],可将数据质量视为推进高校数据治理的基础保障。再者,数据决策是数据治理的核心手段,如何利用数据促进治理计划、方案与行为的优化均在很大程度上依赖“基于数据的决策成效”。最后,数据服务是数据治理的根本目标。以人为本是高校数据治理不可忽视的落脚点,数据治理实践需以数据服务的优化为根本目标,并应落位于数据服务潜能的有效激发[15]。其中,数据管理是技术支撑,数据质量是关键保障,数据决策是基本手段,数据服务是核心目标,可依赖数据管理、数据质量与数据决策,实现更为优质的数据服务。

图1 人工智能赋能高校数据治理的基本逻辑

(一)人工智能推动高校数据管理的智能化转型

高校在教学管理、科研管理、后勤管理、行政管理等诸多方面均可产生大量的数据流,不同数据流的交聚与提取不可杂乱无章,如何推进高校数据管理职能的优化具有重要价值。高校数据管理一般涉及对高校各职能部门或单位数据的采集、存储、共享、安全等[16]。在人工智能时代,人脸识别、图像识别、智能传感等智能技术的应用,促使以往难以采集的师生关键数据得以有效整理与归类,在财务、人事、科研、学院等高校各职能部门或机构间实现跨部门、跨功能、跨系统的数据流智能监测成为可能。如此一来,人工智能推动了高校数据管理智能化转型,智能技术与数据管理的融合不仅带来了数据采集与分析方式的革新,也对数据安全防护与数据共享方式产生冲击[17],如何“管”好高速流动的数据成为数据管理的现实难题。传统高校数据管理模式侧重于对已有数据的存储与归类,而对数据资产的价值激发关注度不够。人工智能助力数据管理职能的优化集中体现在通过控制数据开放共享与隐私加密,利用大数据为学校教育创新与科学发展提供证据支持,实现对教育数据生成与流动的智能监测,从而促进数据资产价值的最大化释放。

(二)人工智能助力高校数据质量精准改进

人工智能与数据挖掘紧密相关,可通过机器学习、智能感知等技术实现高校数据质量精准改进。如何在人工智能时代实现数据挖掘质量的精准改进可被视为人工智能赋能数据治理的基础保障。智能感知、机器学习等智能技术的应用有利于高校从互联网抓取师生、管理者等人的关键数据(例如本科教学签到信息、图书借阅信息),这对于促进数据挖掘质量的智能监测而言具有重要价值。例如,可建立课程参与智能监测系统,及时提供学生课程参与监测分析报告,通过呈现参与质量的预警等级,能够精准描述并预测学生的课程参与质量与学习投入程度[18]。概括来看,借力人工智能,有利于实现对海量教育数据的精准挖掘与系统化分析,理清当前教育数据统计规律背后隐藏的实然特征,并归纳出一系列从常规研究难以得到的对策建议,进而有利于推进高校数据质量的针对性提升。

(三)人工智能促进基于数据的精准决策体系构建

基于数据证据的教育决策不仅寓意对于数据的决策,而且也涉及利用数据进行决策。前者一般探讨如何有效开展数据挖掘、数据共享等,后者一般涉及如何通过数据价值的释放为教育教学决策服务。我国近几年越来越关注人工智能在教育决策领域的应用,一系列教育政策研究院之类的智库机构(如国家教育宏观政策研究院)和政府教育管理部门均致力于实现智能数据挖掘与教育公共决策的深度融合[19]。在高等教育领域,教育决策涉及教育行政决策、教育教学决策等众多方面,其智慧化程度在一定程度上可被视为高校信息化建设水平的重要衡量指标。人工智能促进基于数据的精准决策体系构建逐渐成为高等教育领域的关注热点,这也是人工智能赋能高校数据治理的核心手段。基于人工智能技术,高校可在编辑、整合、量化、分析各类部门数据方面实现智慧化操作,动态抓取教师、学生、管理人员的实际需求,实现数据信息的智能分类与归纳,从教务管理、本科教学监测、研究生教育管理、校园安全防护等方面的实况出发,打造基于证据的高校舆情决策咨询服务系统,从而构建智慧化的高校决策服务体系。基于人工智能的智慧决策并不意味着对“人类智慧”的否定,作为“人工智慧”表征的人工智能与高校决策者的“人类智慧”相辅相成,而人工智能与数据治理的融合实际上可被视为一种新型的决策工具,其助力于高校基于数据的精准决策体系的建立健全,有利于高校清晰判定自身问题与未来发展路径,进而为教师和学生提供更加契合自身需求的教育服务。

(四)人工智能助推高校数据服务的个性化供给

人工智能赋能高校数据服务通常涉及教学管理服务、后勤支持服务等方面,且人工智能助推高校数据服务的个性化供给成为高校创新发展的关键支撑,也是人工智能赋能高校数据治理的根本目标。在人工智能场域下,高校数据服务激发潜能不仅体现在基于“数字画像”的学生评价、基于“情感计算”的学生创造力激发、基于“虚实交互”的课堂教学应用等“教”与“学”方面,对于依赖“数据智能”的高校管理服务的效能提升也具有重要的推动作用。在“教”与“学”服务层面,高校可利用智能筛选与推理技术,对来源不一的教育数据进行识别、清洗、归类、推理与分析,做到“教”与“学”场景的数据即时反馈,以此来矫正教育教学服务的盲点与不足。例如,密歇根大学有一项关于“基于学生参与度和情绪状态预测学习效果”的研究,使用人工智能采集学生学习行为数据,评测学生学习参与度,推导出参与度与学习效果之间的联系,以此为基础对学生提出有针对性的指导意见。在“管理服务”层面,高校可利用机器学习、智能专家系统等智能技术,实现对本科生、研究生等学生群体需求变化、个体进步等方面的精准研判,及时为管理者战略调整提供行动方案与路径方向。

三、人工智能赋能高校数据治理的现实挑战

遵循前文所述之人工智能时代高校数据治理的基本逻辑,本研究尝试从数据管理、数据质量、数据决策与数据服务4个方面分析人工智能赋能高校数据治理变革的现实挑战。

(一)高校数据管理忽视“多方协同管理”

传统高校数据管理的主体参与者以信息化管理者为主,所推行的“数据管理”仍主要偏重“信息化工作人员层面的数据管理”,在一定程度上忽视了教师、学生等人的多方协同管理[20]。人工智能的发展为利益相关者的协同治理提供了工具支持,高校数据管理亟须走向“多方共管”。在人工智能时代,海量数据不断产生与聚集,不同领域和不同类型的数据被连通,实现了数据的高度融合[21],促使教师、学生、管理者等多元利益主体均能在充分了解学校信息的基础上参与学校决策[22]。首先,以往高校数据治理主要由专门的数据管理人员负责教育数据的采集、存储、共享等过程性审查工作,教师、学生等利益相关者的治理参与程度不足,难以适应教师、学生等利益相关者在智能数据采集、流转与分析方面的多元需求。其次,数据采集与流动情境更为复杂,智能化与定制化数据服务等功能的发挥亟须实现多方监管,仅凭借“信息化工作人员”的“单维度管理”难以有效实现数据的精准挖掘与分类。再者,尽管在政策层面上,教育部发布的《教育信息化2.0行动计划》提出要“促进政务数据分级分层有效共享”[23],但在实践层面上,学校、学院、各级机关单位等教育数据利益相关者的“共治”能力较为薄弱,利用数据辅助教育教学与管理决策的意识薄弱,导致人工智能时代数据治理的协作氛围难以形成。

(二)高校数据治理缺乏相对统一的数据质量标准

数据治理是对整个数据生命周期的治理,涉及数据质量、组织、描述、共享等多个维度。作为原材料的数据质量,成了数据治理最基本的关键要素。当前高校数据治理在数据质量建设方面存在不少现实难题,比如各类群体数据体积过大、各部门数据更新速度不一、各部门信息割裂等[24]。在2021年4月举办的第二届MEET教育科技峰会上,国家教育行政学院联合腾讯研究院发布的《迈向更好的教育:未来教育的技术发展空间报告》显示:“虽然我国的区域教育主管部门和学校大部分都基本建成了教育信息化平台,但有64.2%的高校依旧认为信息孤岛普遍存在。”[25]如何构建相对统一的数据质量标准是推动人工智能时代高校数据治理的一大难题,而这个难题的破解对于破除教育数据割裂、垄断、孤岛等数据质量问题也具有重大意义。一方面,由于不少高校在早期信息系统建设中主要以简单实现业务功能为导向,尚未在学校层面形成统一的数据采集、存储、共享标准,导致高校底层数据架构设计混乱,使得存储于各个平台系统中形式不一的数据集难以被系统整合。人工智能的应用虽为数据挖掘功能的改善提供了便利,但也受困于数据质量标准的割裂与差异。另一方面,虽然不少高校的信息化办公室或信息化中心尝试制订宏观层面的数据标准与应用规范,但在推动不同部门之间的大量数据实现智能共享的过程中,由于推广应用不力或标准不符合实际需求,子单位或子部门可能经常借用各种理由拖延或抵制数据共享指令,使得高校数据共享经常处于“要”与“等”的状态。

(三)高校数据决策在权责限定与顶层设计方面存在缺失

高校数据决策一词由来已久,其内涵范畴目前已从“关于数据的决策”走向“基于数据的决策”。高校数据决策是一项系统化的复杂决策工程,需要技术开发商、学校、业务部门、师生等治理主体的协同参与[26]。当前高校数据决策在权责限定与顶层设计方面存在缺失。例如,业务主管部门受到传统惯性制约,往往难以投入专门的力量执行信息化建设任务,进而导致数据资源家底摸不清,缺少宏观分布图,寻找数据难,数据应用水平不高。由此来看,高校数据治理的效果在很大程度上依赖于治理主体间的责权划分与行动规划。一方面,不少高校在数据采集、传输、共享、公开等方面的权限界定较为混乱,数据质量与数据安全问题频发,仅仅依靠信息化办公室等进行数据治理的实践模式存在较多局限性。在人工智能场域下,高校应充分调动学校管理者、教师与学生等人协同参与数据治理,并在治理责任、权力、担当、协作等方面有所约束与限制,以期能有效规避数据治理权责混乱所引发的伦理与安全风险。另一方面,数据治理缺乏校级层面全局规划,数据治理分割问题也逐渐显现,具体表现为高等教育治理中的人与事的分割、专业分工不同的高校教育管理部门之间互设樊篱、数据治理分散在不同技术部门和业务部门等,进而导致信息标准不统一、数据流转不顺畅、数据权责不明确、共享度不足、数据质量不高等一系列问题,从而阻碍高校数据治理成效的有效提升。

(四)数据服务潜能激发不力制约数据价值高效释放

数据服务是实现数据价值的关键过程,服务层通常位于“人工智能+教育”通用技术框架的最顶层,是各类“人工智能+教育”技术形态实现的最终功能体现,如果数据服务潜能激发不力,终将影响数据价值的释放效果。而且,有效挖掘沉睡在校园中的大数据的价值,面临着数据源的可用性、数据融合的可行性、数据挖掘的复杂性、个人隐私侵权、数据共享意识薄弱等方面的现实挑战[27]。人工智能时代下数据服务潜能激发一般需要具备两个基本条件,一是数据服务应用接口,二是数据服务制度规范。但是,不少高校早期建设的信息系统并不支持可供调取的数据接口,尽管部分信息系统所提供的信息读取、对接功能相对比较简单,但高校之间教育数据共享存在较大难度且耗费成本较高,在一定程度上影响了数据治理服务的个性化供给,很难有效满足人工智能时代数据开放共享与高速流动的现实需求。开发丰富的数据服务应用接口,不仅涉及技术因素,还涉及数据服务制度因素,不少高校在数据服务权限设定、数据服务安全管理等方面仍缺乏制度规范的保障,进而制约高校数据价值的高效释放。

四、人工智能赋能高校数据治理的实践路向

立足人工智能赋能高校数据治理变革的基本逻辑与现实挑战,本研究进一步提出人工智能赋能高校数据治理的实践路向。

(一)创设落位智能共管的高校数据管理职能优化机制

在管理层面,高校数据管理亟须走向“多方共管”。人工智能时代的数据管理职能优化将“管”好数据作为首要目标,应落位到数据存储、分类与整理等方面,利用智能分类与识别技术实现智能共管。人工智能时代数据的产生与采集更为智慧化,但生成的结构与非结构化数据繁多且来源不一无疑大幅增加了数据管理难度。为此,创设落位智能共管的高校数据管理职能优化机制极具必要性。首先,应关注智能共管工具与方式的变革。利用智能感知、机器学习等技术精准计算师生等人的情感偏好、思维倾向以及能力态度等,有利于根据教育数据的种类与性质实现精准分类管理。其次,应注重专业化数据管理人才队伍建设。以往我国不少高校从事高校数据管理的人员对数据治理的认知存在缺位与偏差,其数据治理能力更是有待提升。有必要加强对情报信息等专业的人才引进,加强对已有信息化工作人员的专业化数据素养培训,利用智能化资源推送优势,开发相关培训资源并制定培训方案等。

(二)完善校本化高校数据挖掘与共享质量标准

如前文所述,数据质量保障对于高校数据治理成效的提升具有基础性作用,而高校数据治理缺乏相对统一的数据挖掘标准。以往高校数据质量标准建设对本校数据样态与分布规律等方面的观照不足,人工智能时代的高校数据治理应更加注重落位于本校实际需求,完善校本化高校数据挖掘与共享质量标准。首先,在数据采集方面,高校各级部门的数据治理建设应以已有的信息系统为基础,根据本校数据采集需求与历史难点,针对神经网络算法、网络爬虫算法等不同智能挖掘技术在数据采集方面的应用特点与差异,制定校本化的数据采集质量标准,强化教育数据采集的规范性[28]。其次,在数据流转方面,高校应落位于本校数据流转规范与质量要求,着手构建校本化数据流转质量监测标准,借助软件为数据智能的共享过程提供数据准确性校验,着力实现智能化提交数据更正请求和在线跟踪更正进度等功能。

(三)构建基于责权厘定的智能化数据决策体系

如前文所述,在决策层面,高校数据决策在权责限定与顶层设计方面存在缺失。以往高校虽然对数据治理建设做了较大投入,但数据决策的智慧化建设水平尚处于初级阶段。因此,在决策层面,有必要构建基于数据责权厘定的智能化数据决策体系。首先,从数据治理主体角度而言,高校数据治理主体(如学校行政管理人员、信息化工作人员)的治理诉求与利益观照有所不同,对数据本身所承载的责任与权利意识存在偏差,亟须在高校数据采集、存储、共享、应用等方面做好责权划分,从规范多元治理主体参与数据治理行为的角度,通过大数据平台鼓励公众表达数据治理诉求,打造结构清晰的多方数据治理格局。其次,从数据决策体系角度而言,基于数据治理责权的厘定,需融合多方人才智慧与优势,培育多方参与的高校数据治理合作土壤,着手构建智能化精准数据决策体系。可通过智能筛选、提取与整合数据信息,打破数据治理决策的碎片化和信息不对称困境,建立基于数据智能监测的数据决策机制,以期能够在凝聚数据治理主体合力的基础上确保数据决策的精准制定。

(四)优化指向数据价值释放的智能数据服务体系

如前文所述,在服务层面,数据服务潜能激发不力制约数据价值高效释放。随着人工智能在高校信息化建设中的应用,高校智慧化水平日益提升,数据价值的最大化释放成为高校智慧校园建设的关键之举。在高校智慧校园建设过程中,教学管理、课堂教学、教学评价等方面的智慧化发展均依赖于数据服务潜能的激发。在人工智能时代,教育数据量极其巨大,数据价值释放场域愈发复杂,传统大数据技术很难满足数据服务智能供给与分析的现实需求。为此,有必要实现立足数据价值释放的数据服务潜能智慧激发。首先,可尝试利用智能终端、智能专家系统等技术为数据利益相关者提供接入数据资源的接口,及时打包与封装师生等人的关键数据,实时处理来自师生的搜索和分析请求。其次,可利用自然语言处理、深度学习等智能技术,可视化分析教育教学、教学管理、后勤服务等多类数据,设置涉及教育教学与师生发展等尤为关键的数据价值观测点并进行实时观测,为师生教与学质量的改进提供精准支持服务。再者,利用智能挖掘、自适应、图像感知等技术,实现数据服务潜能激发困境的智慧判定,从数据架构、质量、标准、安全等指标的风险识别与监测角度,实现高质量数据挖掘与分析服务,推动基于大数据的高校教育管理与决策服务优化。

五、结 语

自数据治理一词出现后,高等教育领域也逐渐关注并研究数据挖掘、数据采集、数据共享等若干要素。概括而言,高校数据治理发展经历了初始探索、快速发展、战略转型3个阶段。在以人工智能、5G、云计算等技术为核心支撑的智能时代,人工智能对于提升高校数据治理水平具有关键作用,高校数据治理正式迈入战略转型期。高校数据治理多年来的发展历程表明,当前高校数据治理缺乏相对统一的数据质量标准、高校数据决策在权责限定与顶层设计方面存在缺失等众多问题依然存在,相关问题的破解将成为影响高校数据价值释放的关键。本研究致力于探索人工智能时代高校数据治理变革的基本逻辑、现实挑战与实践路向,正是对人工智能时代高校数据治理现实挑战的有效回应。在未来高校创新发展过程中,如何推动“智能化高校数据治理”真正落地,值得众多高等教育工作者关注与探索。此外,人工智能与高校数据治理的深度融合不仅应关注技术变革效应,也需要关注人文关怀与伦理规约,这可能会成为未来人工智能时代高校数据治理的研究趋势。

猜你喜欢
数据服务数据管理决策
地理空间大数据服务自然资源调查监测的方向分析
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
为可持续决策提供依据
基于数据中台的数据服务建设规范研究
CTCS-2级报文数据管理需求分析和实现
决策为什么失误了
如何运用税收大数据服务供给侧结构性改革
基于频繁子图挖掘的数据服务Mashup推荐