郑永和 严晓梅 王晶莹 王杨春晓 刘士玉
(北京师范大学教育学部,北京 100875)
近年来,以大数据、人工智能、云计算和物联网等为代表的新兴技术迅猛发展,推动了社会各个层面的数字化重组,教育领域的技术创新也不断涌现,带来教学实践和教育研究在内容与方法上的深刻变革。我国政府积极推进人工智能技术与教育的融合,颁布了一系列促进教育现代化发展的实施计划。2018 年4 月教育部发布《教育信息化2.0 行动计划》,提出要充分利用云计算、大数据、人工智能等新技术,构建全方位、全过程、全天候的支撑体系,助力教育教学、管理和服务的改革发展。2019 年2 月,国务院发布《中国教育现代化2035》,明确指出互联网、人工智能等新技术的发展正在不断重塑教育形态、知识获取方式和传授方式,要“利用现代技术加快推动人才培养模式改革,实现规模化教育与个性化培养的有机结合”。在当代教与学关系发生深刻变革的转型时期,我国政府以及教育和学术界在实践应用与理论研究层面积极行动,担当教育智能化和现代化转变的时代使命。在实践应用方面,以亿欧智库对人工智能教育企业的融资情况分析为例,近五年来,资本市场对人工智能教育领域的投资量激增,相比于其他国家和国际组织,我国教育企业发展更为迅速(如图1 所示)。2014 年我国人工智能教育企业融资总额赶超美国,至今遥遥领先于美国、欧盟地区和以色列;且自2017 年开始,我国教育人工智能市场融资活跃,企业融资事件数量超过美国成为全球榜首。
在理论研究方面,近年来,我国学界围绕教育大数据和人工智能的学术研究论文数量迅速增长(如图2 所示),学者们纷纷提出了新技术应用于教学领域的理论框架与发展构想。例如,杨现民等人总结了数据驱动教学的新范式,基于大数据技术构建了高效互动课堂理论框架与5J 模型,梳理了线下互动课堂和线上网络教学两种典型教学情境的数据体系与分析方法,并提出学校导入教育大数据的三大动因、四种模式、五大实施路径与六大实施策略(杨现民,王榴卉,唐斯斯,2015;杨现民,李新,田雪松,2018)。2016 年4 月,北京师范大学发布我国首部基础教育阶段的教育大数据蓝皮书《中国基础教育大数据发展蓝皮书(2015)》。这份报告反映了我国教育大数据的研究和实践(卢秋红,2016)。
图1 全球人工智能教育企业融资情况
图2 2013—2019 年中国知网人工智能与教育大数据的核心期刊论文发表状况
然而,教育智能化的迅速发展也面临许多新问题与新挑战。一是目前我国基于大数据和人工智能技术的教育研究还远远落后于实践的发展,缺少系统的研究设计和方法论体系,没有形成可以指导实践的理论框架与保障高质量运行的规范标准。二是领域研究与实践呈现出多学科协作的良好态势,但缺少系统性布局,实践反思与理论沉淀不足;同时,在多学科协同研究的过程中,研究主体往往受到不同学科间术语差异的影响,且局限于不同的研究计划与方法论体系,而不能协调一致、体系化地推进教育智能化发展。三是教学系统的复杂性和教育数据的特殊性对数据分析技术提出了新要求,但缺乏兼备教育理念与技术创新能力的跨领域人才,无法灵活运用多学科知识与方法来深入探索教育环境中的底层规律。为应对以上挑战,该领域亟需系统化地开展适应现代技术发展的科学研究,从多学科协作向跨学科(transdisciplinarity)的“计算科学+教育学”发展。据此,应建立计算教育学学科,构建以量化教育数据为基础的学科理论框架,建设以计算为核心的新型方法论和交叉学科人才培养体系,同时推动相关规范和标准的制定,指导教育智能化的创新实践,加强系统化学科融合的创新实践与规律探索,生成一个超越性的学科新形态,以此促进教育智能化的可持续发展,为构建新时代的教育支撑体系提供保证。建立计算教育学学科恰逢其时。
为此,本文试图在以下方面阐述计算教育学的学科建设。首先,论述建立计算教育学学科的应然性,以及建立学科所具备的基础保障;其次,辨析计算教育学作为学科的立场与价值观;再次,分析正在逐步形成的独特研究范式;最后,依据独立学科的标准,提出计算教育学还需加快巩固知识体系和社会建构;同时结合教育的需求和实践的基础,展望计算教育学的未来发展并提出推进学科发展的建议。
信息时代属于知识爆炸的时代,以创造力和智慧思维为驱动,科学和技术的不断推进使得数据科学破土而出,教育领域获得了宝贵的“数据矿产”,待研究者挖掘与分析,而相应的技术、理念和方法亟需一个集合体来统筹与规划。因此,信息时代的教育恰到新范式和新方法应运而生之时,计算教育学的产生具有必然性和应然性。计算教育学产生的动力机制一是教育实践智能化发展的外部推动,二是教育研究科学化发展的内部动力;技术引导、理论发展和教育大数据产生这三方面是其产生的基础保障。
1. 教育实践的智能化发展是推动计算教育学产生的外部动因
在新时代,重大科技创新的需要明确了国家对创新人才培养的新要求,也体现了对新技术深度应用于实践的新思考,理论与实践层面的变革共同引领了教育智能化的发展。2019 年5 月教育部钟登华副部长在人工智能教育大会上指出,为进一步提升我国的教育质量,顺应教学内容与教学方式的新变化,应积极探索人工智能为代表的新一代信息技术在教育领域中的有效应用。在实践方面,教育教学和研究体系正在经历数字化转型的关键历史时刻,教育的组织结构、管理体系、服务模式、理论方法、环境工具和应用实践都在发生深刻变革。具体包括:提高教学效率,及时根据学生的个性化需求提供有针对性的教学资源和教学方式;构建智慧学习环境,助力学生发展高阶认知能力,包括综合利用所学知识解决复杂问题的能力、批判性思维、创新能力等;开展科学测评,更高效、更全面、更及时地了解学生的学习情况,根据认知发展规律,提供及时学习支持;进行基于数据的教育管理,更科学和更精准地配置教育资源,制定合理的制度和措施,进一步提升教育的效率和效果。为了实现教育体系中必要环节的智能化,满足新时代对教育的个性化与公平性相协调的需求,急需建构更为全面科学的教育数据模型,开展更多基于复杂算法的精准教育预测的跨学科研究。以数据为基础,以计算为手段的计算教育学为高效地推动智能技术应用于教育研究提供有力的新工具和新方法,从而开展对教育教学内在机制的深度探索,构建新时代中国教育研究科学化和系统化的理论体系,实现教育问题的精准定位、智能分析与科学治理,满足新时代对教育的个性化与公平性相协调的需求。
2. 教育科学研究方法与范式变革是计算教育学萌生发展的内在动因
在自然科学研究范式影响下,教育研究得以从经验为主的思辨范式向实证研究转变,研究方法也从定性描述和理论思辨转向数据分析为主,研究课题也转向更具有普适性的底层规律探索。自赫尔巴特(Herbart JF)试图整合教育学与自然科学,使之具备科学品格以来,研究者们对教育学的“科学性”进行了大量探索。我国学者袁振国提出教育学走向科学需要加强实证主义的精神、规则和方法,并强调了量化的重要性(袁振国,2017)。但是袁振国和余胜泉等人都指出教育环境、教育对象的复杂性和动态性等特征导致了自然科学研究范式与教育研究方法融合的困难,特别是自然科学实验研究中客观、量化、可检验、可重复等标准在教育研究中遇到挑战与问题(袁振国,2017;余胜泉,徐刘杰,2019)。
随着大数据和人工智能技术在教育研究中的应用,以个体数据为主的实证研究逐步向以海量关系数据挖掘的新范式推进。在此基础上,以数据科学为技术基础的计算教育学架起了“计算”与“教育学研究”之间的桥梁,为解决教育研究中遇到的问题提供了新的工具,具体包括为教育研究提供了覆盖更多教学环节的可计算的量化数据;同时,自然生成的教学行为数据为提高教育研究的客观性和可检验性提供了新的方法和途径;计算模拟实验、虚拟技术等也为实现教育研究的可重复性提供了新的方法和可能。正如Cioffi-Revilla 认为将数据科学的技术和方法应用于社会学领域的研究,就如同当年伽利略发明的望远镜作为主要的观察工具推动了自然科学领域实证研究的发展,进而帮助科学家获得对物理世界更深刻真实的理解(Cioffi-Revilla,2010)。计算教育学的诞生响应教育学研究科学化发展的需求,延续当代教育研究范式与自然科学范式融合的趋势,为教育领域的实证研究提供了有力的新工具与方法,助力研究者获得对教学行为和认知规律更深刻的理解。
1. 理论研究的深化为计算教育学框架形成提供支撑
随着人工智能技术的发展,计算主义也从一种新兴的认知哲学范式发展成为一种新的世界观,为计算、算法、智能和行为等核心概念提供了理论认识,为结合领域需求的计算实践提供了丰富的理论框架与指导(李建会,符征,张江,2012)。例如,计算经济学与计算社会学的发展为计算教育学提供了基于数据科学来揭示个体和群体行为模式的宝贵经验与构建理论体系的参考。而认知科学、神经科学和学习科学等领域发展进一步推动了教育领域对学习机制与过程的深入分析。同时,将教育作为一个复杂适应系统,复杂系统理论、计算经济学理论和计算社会学理论的提出都为计算教育学的发展提供了理论框架的支撑,为从整体上研究复杂的教育系统提供了可能,为揭示教育环境和教育主体的复杂特征提供了理论基础与框架。正如杨开城指出的那样,教育大数据的实践体现了复杂适应系统在教育现实中的显现。其中复杂系统的理论群体,不仅包含涌现生成、遗传算法、进化编程等理论与方法,也包含耗散结构理论、自组织临界、元胞自动机、混沌理论等(杨开城,2019)。但它们在教育研究中的适切性还需要进一步研究与检验。因而在教育领域,基于复杂系统理论、认知科学、神经科学、学习科学等领域的不断发展,借鉴计算社会学理论与方法,计算教育学将建立多元而统一的理论基础。
2. 技术先导为计算教育学提供基础保障
新一代信息技术的发展使教育教学和研究方法的变革成为可能。参考刘邦奇和王亚飞总结的智能教育技术体系与框架(刘邦奇,王亚飞,2019),本文提出了与计算教育学相关的多层次技术基础,如图3 所示。其中,硬件的发展带来算力的大幅度提升,结合芯片和传感器制造工艺与技术的精进,为采集和处理教育大数据提供了硬件技术基础;云计算、物联网、5G 通信等系统基础建设,基础开源框架和技术开放平台的构建,共同为实现基于计算的教育智能化实践提供了信息设施保障。数据科学的发展,包括机器学习、模式识别等算法的发展,云和分布式数据存储技术,数据的整合、聚合和校准等管理技术,数据分析与数据可视化、网络分析等多种技术的综合使用,共同支持教育研究者挖掘海量教育数据中的深层关联关系,加强了智能分类、文本挖掘和模拟仿真等技术在教育领域的成功应用。计算机视觉、语音识别、自然语言理解等人工智能技术的成熟与发展,拓展了智能技术在教育领域的应用范围,推动了教学实践创新与教育研究向基于数据和实证的方向发展。例如,自然语言处理技术提高了计算机组织和分析来自互联网等处的和各类教育文本的能力,从而与其他智能技术和教育大数据一起,可以提供更精准的教育预测与预警。人工智能技术历经智能和心灵计算、生命计算,发展至世界和宇宙计算(李建会,符征,张江,2012),为实现教育研究对象的可计算性提供了基础的技术保障。
图3 计算教育学的技术基础与举例
3. 教育大数据为计算教育学提供研究基础
由于计算机和网络技术的快速发展,记录和共享数据达到了前所未有的量级,多模态的教育数据采集方式层出不穷,实时的海量教育数据不断累积。在智慧学习环境中,人们的各种教学活动和行为会在不同的数据库中留下痕迹,为计算教育学提供了各个环节的数据记录。由于智能技术的更全面应用,除了传统学校管理系统能够提供的学习者在校基本信息、学业成绩和成长信息之外,从教学环境、模式到制度等各个方面的刻画能得到数据的完整支撑(肖玉敏,孟冰纹,唐婷婷等,2017)。从先前的鼠标点击到如今的体感技术,人机交互的发展为学习者的多元化信息留存提供了越发坚实的技术支撑,计算机能够将教学过程中自然生成的海量学习数据进行多维度、多构面的立体化数字化存储与分析。杨现民等人将教育领域中的大数据划分为基础层、状态层、资源层和行为层四种数据。基础层中,存储着国家规定采集的教职工与学生的人口学基本信息和人事档案中的信息,例如教师的学历背景、教龄,学生的学籍变动等。状态层是各种教育环境、教育装备等基础设施的分布情况以及教育业务的运行状态信息。资源层包含各类教学资源的信息,例如教案、教材、试卷、作业等课程资源。行为层是广大教育用户的行为数据,包括学生的学习行为、管理人员的操作行为、教师的教学行为以及学生的兴趣、动机、消费情况等其他描述性行为(杨现民,唐斯斯,李冀红,2016,第52 页)。多类型、多维度、多形态的数据集合可将教育全过程进行实时的全样本的数据化记录,拓展了研究素材的时程性和教育学研究的问题域(González-Bailón & Sandra, 2013)。但要使得“教育数据矿产”发挥真正的作用与价值,还需在计算教育学的框架下,采用科学的技术方法进行清洗、整理与分析。
学科视角可以更好地概括教育学在大数据和人工智能时代所呈现出的新发展、新路径和新范式。关于学科建构,龚怡祖指出学科的建构既包括了内在的知识系统化建设,也包含了外在的社会制度建构,并同时形成两种规范性的机制运行(龚怡祖,2013)。对学科本体知识建构的要求,潘懋元认为一个独立的学科应该包括“独特的研究对象、独特的研究方法和完整的知识体系”,并确立学科的价值、思维方式、研究领域及核心概念(潘懋元,1991)。在此基础上,张应强认为现代学科还具有以应用性为主,以社会需要为学科演化和发展的动力,以重大的社会问题和综合性问题为研究对象,以多学科研究和交叉研究为主要方法的新特征和新趋势(张应强,2011)。以下将首先从现代学科建制的角度辨析计算教育学学科基本立场与价值观。
随着实践的发展,计算教育学得到越来越多学者的重视,其定位与价值也引起了学界的关注。我国学者从学科目标、研究特色和技术等不同角度对计算教育学的内涵与外延开展了探讨。例如许新华将计算教育学等同于计算机(辅助)的教育学(许新华,2019)。而李政涛等人将计算教育学的渊源回溯到MOOC 课程兴起带来的大量在线学习交互行为和学习分析技术的发展,他在总结了国内学者对计算教育学研究对象、研究方法和目的与意义的共识基础上提出计算教育学是一门以信息科学为基础、以精确定量为方法的跨领域交叉学科,为教育学本身的研究与发展提供了新的方法、路径和动力(李政涛,文娟,2019)。综合国内外不同学者对计算教育学的定义,本文认为,计算教育学是一门融合多学科知识,基于量化的教育数据和计算的方法,以揭示日常难以发现的教育教学规律,注重体系化的理论建构的跨领域新兴学科。借助现代科技手段,计算教育学把各种复杂的教学行为和教育现象进行数据化处理,使之成为可计算的符号,再用数学工具对教育问题进行计算分析,从而研究并解释教育现象与规律。但计算教育学作为一门新兴学科,具有生成性和建构性的特征,其内涵也将随着实践与研究的深入而不断发展。
基于技术革新的创新实践为计算教育学的发展提供了丰富的研究内容,推动了计算教育学发展与教育理论升级。同时,计算教育学也肩负引领和指导实践的时代责任与使命。信息技术与数据科学在教育领域的广泛应用也带来了新的挑战,例如在教学实践和研究中面临的隐私保护、数据安全等新的职业道德问题;担忧不恰当的技术使用会增加应试化的机械训练,过度的智能技术辅助影响学生认知能力的发展,过量的虚拟和在线学习可能造成对青少年儿童的身心健康的危害等新问题。应对这样的问题与挑战,新兴的计算教育学将继续扎根于丰富和活跃的创新实践,反思与总结新环境下的教育学特征,整体认识教育理论与教学实践相融合的新型共性问题,支持以学生为中心的教与学,提升教学过程体验,优化教学方式,提升教学效果,形成行业标准规范以指导教学实践的健康发展。
计算教育学的学科本质决定了需要融合信息科学、教育技术学、教育学、心理科学、脑与神经科学、系统科学、复杂性科学等多个相关学科的理论与技术研制多维度、多元化的分析模型与算法,综合分析复杂而动态变化的教育系统,最终揭示教育现象和规律。因而,跨学科性贯穿于计算教育学体系的各个环节。例如在研究过程中,以教育过程中产生的数据为基础,面向学生、教师、学习环境、学校、教育机构和其他利益相关者和组织等主体,需要依靠多学科知识,从复杂的教育系统和教学环境中数据化地采集和记录复杂的教学行为;在分析阶段,利用物联网技术、计算机与智能技术、通信技术和控制技术,对教育大数据进行数据采集和挖掘,并依赖数据科学计算处理大量非结构化的数据;在应用阶段,计算教育学需要依赖教育学和心理学等相关知识,从大量原始和结构化数据的计算结果中,科学合理地揭示学习过程的复杂性,并结合学科教学和教育技术等不同领域的知识开展智能预测、推荐、干预等教育智能化实践。
新技术应用在不断增加教育体系复杂性的同时,也为认识和理解这种复杂性提供了新的工具和方法。新一代人工智能技术与教育理论、认知理论、实验设计和相关学科研究方法相融合,带来了基于数据科学的教育研究范式转变。计算教育学对复杂的教育系统开展以计算为核心的研究,以新兴的研究方法适应新的教育环境,不仅体现于其数据采集工具和分析方法的变革,更体现在方法论层次的变革;不仅是一种使用海量数据的现象和采用各种算法作为分析工具的趋势,更是探讨教育过程与问题的新理论、新方法乃至新范式。根据国际教育研究手册,一种教育研究范式是在一定研究方法论基础上形成的研究原则和方法体系,包含了其适用范围、主要流程、局限性和评价信效度的指标等方面。以下将体系化地审视基于计算的新教育研究范式,通过梳理定量教育研究与计算教育学之间的传承与发展,描绘计算教育学研究的特征;并根据Jim Gary 2007 年在美国国家研究委员会—计算机科学和电信委员会加州山景城(National Research Council-Computer Science and Telecommunications Board NRCCSTB)会议上提出的四种研究范式分类,辨析现阶段计算教育学研究范式的发展路径;探讨新研究范式的研究局限性和信效度等方面的标准。
计算教育学的诞生伴随着教育学研究方法从计量到计算的演变,数据采集、处理和分析均与传统量化研究方法不同,这为解决教育研究领域的挑战提供了新的工具与方法。传统教育研究常用的定量与定性的研究方法无法兼顾整体性和动态性的分析,不足以诠释新时代教育的新需求,难以刻画新时代学习者的特征和教与学的复杂过程,缺乏大规模、多模态的科学数据分析的支撑。面对日趋复杂的教育系统,要进行有效分析,解决不断涌现的跨领域问题,亟需顺应时代和科技发展的新方法、新工具和新体系。
不同于传统计量方法,计算方法包含数据、算法、架构、问题域和复杂信息系统等多方面技术与方法,是能够捕捉、获取和处理有关人类学习行为与教育发展规律的科学方法,为寻找教育活动的内部主导因素和高关联性外部因素提供了可能。计算教育学以教育过程可计算为基础,包括教育系统中的个体与群体可计算(学习主体与学习环境的计算)、数据与知识的可计算(学习的媒介计算)、人—机协同的可计算(学习特征的计算与建模)、认知过程可计算等。相比于传统的通过抽样调查等方法采集一些结构化数据进行实证分析的计量方法,计算教育学通过对教育领域中量化数据(既包含大数据也包含小数据)的应用与研究,为精确描述和精准分析教育系统的复杂性和整体性提供研究工具,为实现多元化的教学资源与服务提供基础研究的支撑。通过对比计算教育学与传统的计量教育学,王晶莹等人提出从数据特征、数据获取效率与方式、研究路径、认识过程和关系认知等多个方面阐述计算教育学研究范式的特征(王晶莹,杨伊,郑永和,夏惠贤,2020)。在此基础上,基于实践与研究的经验,以下聚焦在传统的定量教育研究范式与计算教育学研究范式的对比,并对部分比较维度与内容进行了补充(如表1 中加粗标注的部分)。
表1 传统定量教育研究与新兴计算教育学研究范式的比较
计算教育学的研究对象是量化的教育数据,因而比较的对象聚焦在传统的定量教育研究范式上。在数据方面,传统的定量研究受到技术与方法的限制往往以结果性数据为主,例如学生的学业成绩、自呈式的心理和情绪状态等。因为教学环境和人类行为的复杂性,大量教学行为、活动和环境因素在传统量化研究中难以被数据化,无法获得直接的测量数据,难以提供给研究者全样本、实时的、过程性的教学数据,从而影响了对教学过程的全面而客观的记录,不利于研究的深入展开与分析。如传统研究中用视频和音频的方式记录学习过程的数据,由于没有多模态融合技术支持,难以形成规模化智能处理。随着信息技术在教育实践中的渗透,教育研究对象的范围大大拓宽,智能环境中的数据采集装备、分析系统可以对学习者和教学者在无感知、非干扰的情况下记录他们教学行为的全过程,收集的是整个教育教学过程中静态和动态的所有数据,如教学资料、互动反应以及学生在每个知识点上停留的时间等。因而数据收集有更强的实时性、连续性、综合性和自然性,可以更好地反映教学过程的真实状态,支持研究者深入探究教学的规律。这使得计算教育学研究范式下的研究结果相比于传统教育研究结果,具有更高的可靠性、客观性,以及更广泛的适用范围。
在研究目标上,传统量化研究多以理论修正为主要目标,往往从一个理论假设开始,选择相关的若干组影响因素开展教学实验,验证并分析变量之间的关系,从而根据实验数据修正之前的假设。但基于数据挖掘的计算教育学不一定有已形成的理论假设,往往从数据出发,对研究找到的数据之间的量化特征进行教育学的解释和意义建构。计算教育学以计算为工具,以期挖掘出教学行为特征中的底层规律,并构建科学的教育学理论以指导实践。
在研究路径方面,传统量化研究遵循自然科学研究方法,往往自上而下,即先根据理论提出假设、再构建模型、创设实验、使用特定的测量工具收集与分析数据,从而验证假设,修正理论;而计算教育学通过大量数据的梳理和分析来发现教育现象和规律,基于数据发现特征,构建理论解释,开展预测应用,往往以自下而上的数据分析为基础。也有研究者提出在计算教育学的研究中,围绕教育意义与价值,数据分析更需要结合自上而下的理论解释(陈丽,逯行,郑勤华,2019)。
在认知方式方面,教育研究从关注因果关系转变到关注“关联关系+因果关系”。利用数据科学技术探索认知规律得到的是数据间的关联关系,研究者需要基于理论认知探索更深层次的原因,从而做出具有教育意义的合理解释。这对教育研究者提出了更高的理论要求,需要教育研究者形成并建立新的思维模式,从关注理论驱动,假设检验与解释,转变到重视测量与预测应用的计算教育学。
根据Jim Gray 在2007 年NRC-CSTB 大会上的论述,科学研究正在经历从经验、理论、仿真向数据密集型范式的变革,如表2 所示。这种变革也影响到社会科学领域,包含教育研究。但与自然科学领域的发展不同,韩军徽和李正风等社会科学研究者们认为计算社会学中目前存在大数据社会分析(第四范式)和社会模拟研究(第三范式)两种不同研究进路(韩军徽,李正风,2018)。类似地,在教育领域已发表的文献和实践案例中搜索关键词“计算教育学”(以及“computational education”),发现也存在第三范式与第四范式同时兴起的趋势。
表2 教育大数据为计算教育学提供数据基础(HeyTony,2009)
1. 计算教育中的仿真模拟实验
在教育学领域,以计算手段来模拟、仿真与分析教育现象的第三范式正逐渐兴起,并得到研究者的重视。在这种仿真模拟实验中,研究者使用计算机建模和基于大数据的网络分析,在计算机或虚拟世界中探索教育系统的运行状况,探寻教育主体之间信息互动的模式,获知系统在变化过程中的特征,从而揭示系统的规律或模式,评估教育系统演化的各种可能性。
仿真模拟实验作为一种教育研究范式的发展,可以追溯到20 世纪90 年代中后期。随着计算机建模技术的成熟,基于计算机模拟环境的教学实践逐渐兴起(Yaqoob I , Hashem I A T, Gani A , & et al. ,2016)。但大部分的教学研究都将模拟的仿真环境作为教学环境,围绕学生在模拟环境中的学习模式和学习成效开展研究,这种将计算机模拟作为研究方法的应用受限于教学系统的复杂程度而迟迟未有突破。直到21 世纪初,随着欧美国家“第二人生”(Second Life)等在线模拟游戏的普及,部分社会学研究者尝试在在线虚拟环境中开展人类行为模式的分析和虚拟实验,从而兴起了社会学虚拟仿真实验研究的热潮。2007 年Nigel Gilbert 在计算社会学领域提出了基于主体的社会模拟(agent-based social simulation)来实现可多次重复、多主体、多属性、多情景的仿真社会模拟实验技术,深度分析了个体与群体行为,揭示宏观现象的微观成因、内在机理和传导过程。我国学者王国成在社会计算领域,提出融合人类主体(Human Subjects)参与的实验和基于虚拟主体(Computational Agent,CA)的实验方法,“通宏洞微”地开展了广泛的社会模拟研究,为宏观调控提供微观基础(王国成,2015)。近年来,随着教育大数据在教育实践领域的普及,基于主体的模型(Agent-based Modelling,ABM)方法也逐渐进入教育领域的研究与实践中,为我国研究者所重视。例如,余胜泉等人借鉴计算社会学中的计算实验方法,提出计算教育实验,模拟真实的教育系统,通过改变输入变量属性观察系统的演化过程和结果,总结教育系统的演化规律(余胜泉,徐刘杰,2019)。在实践方面,美国Lamb 等人基于神经网络计算,建立学生在教育游戏中的行为模型,从而模拟学生参与某个在线科学教学活动的情况,测试该教学活动对学生反思性能力提升的影响(Lamb,R.,Vallett,D.,Akmal,T.,& Baldwin,K.,2014)。Lamb 在模拟环境中通过对上万名学生的测试优化了在线科学教育活动。
研究者们提出通过计算机模拟与仿真来研究教育中的现象和问题可以避免部分教育实证研究中的困难,包括征集测试者的困难、因为开展对比实验而引起的道德困境、真实情境中开展教育实验的风险等问题,也可以缩短实验时间,降低研究成本(余胜泉,徐刘杰,2019;Lamb,2017)。模拟仿真研究也为教育实验研究提供可重复、可检验的可能性,并且避免了由研究者主观判断带来的误差,从而提升教育实验研究的信效度。因此,学者们呼吁发展基于计算的仿真模拟教育实验,通过对学习者、教学过程、教学环境的计算,界定教育系统要素之间的关系,建立起教育系统要素关系的数学模型,然后利用计算机仿真技术对教育体系开展全程全覆盖的复杂实景模拟,分析模拟各种可能出现的教学场景、诱发因素及传导机理,最后概括推断微观教学行为、活动、策略与宏观教学现象的内在关联。
2. 计算教育学体系中的数据密集型科学探究
数据密集型的科学发现方式在教育研究领域的兴起源自教育大数据的发展与应用,包括数据的采集与存储、数据结构化、清洗与预处理、自然语言过程与实体识别、数据仓储与关联数据、机器学习与数据挖掘、数据开放与检索、数据可视化与人际互动等过程。第四范式与其他范式的主要区别在于,它是基于已有的大量数据,通过计算得出之前未知的理论。华东师范大学副校长周傲英教授在题为“数据驱动的计算教育学”的报告中,从第四范式、大数据和教育科学等方面阐述教育问题,提出了基于数据驱动的计算教育学观点,用教育大数据作为动能,运用人工智能作为计算工具来研究教育问题。教育大数据具有海量、多样、快速和价值的4V 特征,这使得应用于教学领域的数据密集型的科学发现可以对复杂教育系统内在机理进行整体性的研究,提取以前无法获得的潜在有用信息。基于统计、数据库技术、模式识别、机器学习等学科知识,借鉴计算社会学中常用的方法,包括自动信息采集系统(automated information systems)、社会网络分析(SNA)、社会地理信息系统(social GIS)、复杂模型(complexity modeling)和社会模拟模型(social simulation models)等,计算教育学可以分析和处理不同复杂度和深度的数据,探寻教育数据间相关关系而非探究因果关系,用以揭示教育系统深层规律和动态演化的特征,探索不为人知的底层教育规律,并能实现预测和决策优化等功能。例如,为支持教育质量动因系统的整体性研究,可以通过采集实时动态的课堂数据来补充横断研究数据的不足,采用计算的方法,基于大数据来刻画真正的动态模型,评估来自不同层面的因素对教育质量的直接和间接影响,帮助教育政策制定者和教育实践者针对薄弱环节提出提高教育质量的最优策略。实践中,北京师范大学郑勤华在高校教育治理领域开展研究,通过对学生的生活与学习行为数据的分析,发现学生学业成绩与学生生活习惯之间的相关性,从而揭示大学生学习规律,为高校开展精准管理与提前干预提供科学依据。但是,目前基于数据密集型的科学探究范式仍遇到很多来自技术手段和教育本身复杂性的挑战,在教育领域的应用仍然处于探索阶段。
计算教育学的研究范式与传统的定量研究、定性研究均不相同,因而衡量计算教育学研究的信度与效度的标准与方法也有所不同。计算教育学研究的信效度可以借鉴自然科学实验研究中的可重复性、可比较性、可标准化和可推广性来考量。数据科学对教育研究的可重复性赋予了新的内涵。在大数据时代,在不重复观测或实验的情况下,就可以检验研究者的发现过程以及发现结果的可靠性。因为大数据留下了研究者研究过程的数据轨迹,提供了可以循着其轨迹进行科学检验的途径,不必耗时费力地重复观测或实验就可以查询研究者的原始科学记录。其次,计算教育学研究能收集和分析实时更新的海量教学数据,这些数据具有大范围、真实和完整描述的特征,能够显著有效地解决传统教育研究中非代表性取样问题,并避免实验条件真实性的拷问。数据密集型科学发现中所使用的数据往往是痕迹数据,也就是人们在教学活动过程中自然留下的“数字脚印”(Digital Footprint),是人们日常行为的实时记录,被记录的行为具有自愿化的特征,是自然发生的、反映人们自觉自愿的行为,客观且真实,有助于提高基于数据的研究结果的效度和信度。
研究者需要充分了解基于计算的研究方法,对影响研究信效度的因素保持清醒的审思。首先,计算教育学也存在理论和主观偏差,只是与传统量化研究中被“理论污染”的阶段有所不同。在数据密集型科学发现中,挖掘工具和数据库的选择却反映了数据挖掘者的偏好(黄欣荣,2015)。即便原始数据是客观的,但数据挖掘却渗透了挖掘者的主观意识。在小数据时代,原始数据就已经渗透了理论;而在大数据时代,原始数据未被污染,但在数据挖掘过程中渗透了理论。其次,在计算教育学中需要注意的是大数据未必就是全样本数据,往往也是一种样本。研究者们对于教育大数据是否基本实现“研究对象=全样本”(肖玉敏,孟冰纹,唐婷婷,2017)存在争议。例如,我们可以根据微博数据研究某个教育热点议题的传播与公众的反应,但却很难得到全样本的微博数据,再加上微博也只是公众表达观点的渠道之一。因而,这种范式的研究结论会受到采集数据的工具和渠道的限制,在解读研究结果时,需要明确所使用的工具和获取的数据的特征与范围。在教育研究中,不能片面追求海量的教育数据,而是要为研究目的服务,选取能描述复杂教育系统和动态演化规律的多维度的大量数据(杨开城,2019)。再次,在计算教育学研究中尤其需要注意避免过度拟合影响,而需要开展交叉验证,因为所采用的数据并非为特定研究问题而产生,由数据挖掘得到的相关关系与特征,需要与其他研究方法得到的结论相互印证。
计算教育学的研究范式也不可避免地存在自身局限性。计算教育学适合发掘教育系统中的复杂特征、演变模式,适合回答“是什么”和“怎么样”的问题,善于呈现所发生的事件和事物的特征,探究教育系统的客观而普遍的意义,而不适合替代质性研究进行“为什么”的研究,不适合探究复杂教育系统中不同个体的能动性和突破性,不适合分析教育场景中教学活动和策略的意义与动机(赵超越,2019)。计算教育学的研究要处理好科学性与人文性、客观性与主观性、工具性与价值性等不同价值取向之间的关系,既要看到计算教育学对拓展传统教育学研究的价值和意义,也要看到其过于追求人类行为与教学、认知规律的可计算性所隐含的弊端,依据不同研究选题和教育的实际需求,合理、科学地选择研究方法,而不是盲目的以计算教育学去替代传统的教育学研究。
计算教育学在实践的推动下,已经初步形成了学科独特的价值体系与研究范式。但是要发展成为一门独立的学科,计算教育学还需构建体系化的知识结构,推进社会建构的成立。以下将从计算教育学试图解决的教育研究与实践中的重大问题来辨析计算教育学独特的研究内容,提出知识框架,并为计算教育学社会建构的发展提出建议。
计算教育学具有跨学科的综合属性,形成了独特的融合数据科学技术与教育学的研究内容。计算教育学的知识框架需要立足教育问题,从教育的角度,以计算为核心方法,建立计算教育学跨学科的知识结构。一方面,教育领域的独特性和复杂性对数据科学技术提出新的要求,需要针对性地研发适合教育场景和需求的理论框架、技术手段和研究方法。另一方面,智慧教育的实践创新带来很多教育领域的新问题。例如陈丽等人在分析了自然科学基金申请项目的主题之后提出问题塔模型,认为计算教育学需要讨论涉及教育学基础规律、教育环境、工具和资源建设以及在不同教学场景中的创新应用等不同层面的问题(陈丽,逯行,郑勤华,2019)。龚怡祖指出问题研究是学科生长的初始条件,基本研究范畴是向学科挺进的关键性力量(龚怡祖,2013)。以下就将基于目前的实践探索经验,尝试从信息技术层面与教育体系两个维度归纳计算教育学中六个主要方面的共性科学问题和研究内容,如图4 所示,以资探讨共同推动计算教育学的结构化发展。
1. 基础理论
计算教育学的学科发展需要构建体系化的理论框架。计算教育学是一门正在不断发展的新兴学科,更需要对丰富的实践经验进行系统性、理论化的研究,抽象成规律与规范,不断凝练学科的核心概念与内涵,建立学科的理论体系,规范学科的研究与实践,指导学科的健康发展。然而,计算教育学跨学科的本质对构建学科理论体系提出了挑战。计算教育学涉及数据科学、复杂系统、教育学和心理学等多个领域,因而计算教育学的理论框架构建需要梳理各个不同理论体系之间的关系,围绕教育的核心,建立具有内部一致性和体系化的理论框架。理论框架的纵向构建需阐述计算教育学的历史沿革,例如与计算主义中基于神经网络的联结主义之间的关系,与教育学理论中行为主义、建构主义之间的继承与发展关系。理论框架的横向构建则需以数据科学、人工智能、教育学、心理学等学科交叉融合作为理论基础,构建学科的多元而协调一致的理论框架,以达成对教育规律和认知的产生与发展的深入研究。理论框架的构建还需面对大数据与智慧教育融合的实践需求,例如可以基于复杂性科学的理论基础,遵循数据科学的方法体系,从非线性、不确定性、自组织性和涌现性等复杂系统的特征去描述教育环境与学生个人认知发展的动态关系等,建立教育环境、教学内容、教学模式、教师等主要外在教育要素与学生内在心智表征及信息加工能力等因素之间的影响和关系模型。
图4 计算教育学知识结构框架
2. 关键技术
借鉴美国斯坦福大学、康奈尔大学和微软研究院设立的计算社会学核心课程与实验室的研究内容,我们认为,数据科学技术的领域化内容应该成为计算教育学知识结构中的重要组成部分。由于教育系统的复杂性和教育数据的特殊性,对数据科学技术中提取教育学数据、分析和表达数据等各个环节都提出了新的挑战,如图5 所示,需要围绕教育问题和教育价值,研发并采用合适的数据科学的方法与工具,实现对教育数据有效的存储、处理和分析。
图5 计算教育学研究与实践流程
在数据获取阶段,主要讨论教育数据自动获取相关的关键技术,包含数据检索、数据脱敏、数据清洗和数据整合等相关环节。目前已有通过物联网可穿戴设备、摄像头、传感器等技术手段,采集教学过程中学习者的各种数据,包括学习者身体状态、学习情况、环境信息等,并利用边缘计算技术实时采集和整理有用信息,且上传至教育云,形成计算教育学数据库。在数据分析阶段,主要讨论基于数据挖掘的方式对教育数据进行分析的常用方法。教育领域的数据不但具有海量性、动态性、多样性、真实性等大数据的特征,还具有非结构化数据多、数据的实时性强、有大量随机动态产生的数据等独特性,这些特征对数据科学技术提出了新的挑战。国内学者黄荣怀等提出并论证面向智能教育的三个基本计算问题,即认知计算、行为计算和环境计算,指明了计算教育学的技术发展方向(黄荣怀,周伟,2019,第11 页)。投身计算社会学的研究者们融合数据科学技术与传统的社会研究方法以揭示复杂社会系统中的人类行为规律的做法,可以为教育研究者借鉴。例如大卫·谢佛将数据科学技术运用于社会民族志研究,开发了一种认知网络分析(Epistemic network analysis,ENA)工具,采用社交网络分析的方法进行自动编码,以此有效衡量技能、知识和其他要素之间的联系,形成量化民族志的创新方法,从而对学生21 世纪能力做出智能评测(Shaffer,David Williamson,& Hatfield,David,2009)。在数据表达与建模阶段,对学习者行为进行计算建模和预测能帮助研究者发现和认识学习行为规律,从而有效分析学习行为和制定教学辅导决策,是计算教育学学科的一项长期基础研究工作。计算教育学广泛收集学生的学习行为数据,在脑科学发现的基础上,利用人工智能方法建立行为和学习结果之间的统计关联,研究学习者的认知表征和建模方法,促进教与学中新方法和新理论的形成与实践。因此,该部分具体的研究问题可包括:教学过程数据的采集和分析研究、多通道教学行为和情境数据治理研究、异质教育大数据高效组织与管理和有效融合和分析研究;构建跨学科知识关系与图谱、交互式深度学习的认知模型与计算框架,基于评测大数据和知识图谱的学习者能力建模等方面的研究。
3. 研究范式
计算教育学的发展呈现出以技术为先导的特征。围绕海量的教育数据和计算为核心的数据科学技术,形成了自己独特的研究体系与范式。为保障该领域研究与实践的健康有序发展,需要形成与技术相适配的计算教育研究体系,制定包括研究问题、研究设计、数据采集与分析、解释与理论构建、研究评价与伦理等各环节的规范与标准。一是,计算教育学跨领域的学科本质,对从事该领域的研究者提出了方法论和理念转换的挑战:对于教育背景的研究者,需要转换思维,了解并恰当使用基于数据与计算的研究方法;同样,对于技术、计算机或心理学背景的研究者,则需要了解教育场景的特征,围绕教育的价值,明确在教育场景中开展围绕教学行为活动研究的方法。因而,总结研究经验,形成研究规范和方法论,有助于跨领域的研究者积极投身计算教育学的研究中,并保障研究与实践的健康发展。二是,计算教育学采用基于数据和相关性的研究方法为研究者研读大数据、理解数据背后的含义提出了严峻挑战。研究者需要了解数据的特征和研究工具,即各种计算方法的局限性,结合教学场景的实际情况,做出合理而具有教育意义的分析与解释。例如隐含数据的获取途径和方式,数据分析过程中的理论偏差和主观假设,都需要通过规范化的研究方法,以及在研究过程和研究报告中标准显性化呈现以保障研究质量。目前,计算教育学常用的研究方法有计算模拟实验与数据密集型探究,但还需在实践中不断探索与总结研究的规范以及和其他研究方法体系的差别,从而建立标准。三是,信息技术在教育场景中的深度应用,也为计算教育学的研究与实践带来了道德和伦理的挑战。例如,研究人员会在未经参与者同意甚至在其毫不知情的情况下对参与者进行观察与实验,因而,亟需在计算教育学发展之初,就关注人工智能、大数据技术在教育领域应用的伦理问题,建立相应的规范与标准。具体研究问题包括:AI 技术应用于教育的伦理分析框架与基本问题、用户隐私、避免数据滥用的问题、人工智能环境下教育主体的可替代性研究、AI 技术应用偏见强化的风险研究等。
4. 知识生成
在技术推动的变革中,知识的内涵发生了变化,由符号化、抽象化、结构化、本质性、具有原理性的人类经验回归到人类的全体智慧;知识的外延呈现出个性化知识、操作化知识、网络演化等发展趋势。知识的生产、传播与消费模式的变化,带来知识的海量化、动态化、境遇化、综合化等新的特征,并且直接导致知识的生成与进化规律发生深刻变化,为新时代的教学带来新的挑战。近百年来,教育学、心理学、生命科学、计算科学等领域专家开展大量研究,试图通过理论假设、实证研究、认知机理和计算分析等多角度阐述认知学习的内在机理和外在表现规律。然而由于学习和认知与行为、情感和环境等紧密关联,具有内隐性、微观性、动态性及高维度等特性,其运行机理没有得到有效揭示,缺乏科学的阐述和表征。计算教育学通过计算来发现教育现象和教学行为背后的规律和基础模式,研究学习与认知的发展规律和形成机制,探究新形态下知识生成和进化规律,既能有效解决制约教育发展的“教什么”和“怎么学”的问题,同时还将为未来教育改革提供有力支撑。
计算教育学基于数据科学的方法,将学生认知发展过程和认知能力提升的结果数据化,并与外在的教育环境、教学内容、教学模式、学生的内在心智等数据结合,通过数据挖掘找出他们的内在关联性和紧密程度;融合脑科学、神经科学和心理学等领域的知识,对学生的认知机制、认知风格、认知策略、元认知体验与监控等进行分析建模,并建立网络化群体认知模型;从学生的认知发展、能力发展和素养提升等各方面,形成有理论、有方法、可验证、可落地的学习规律;开展面向教育资源共享的教育资源知识产权保护和交易监管技术等方面的研究。
5. 环境构建
技术发展为建立智慧学习环境提供了可能,带来了可以满足学生个性化学习需求的自适应学习机会和高沉浸式的学习环境,产生了新的学习方式与联结。物理环境与虚拟环境融合的智慧课堂为学习者提供了更为丰富的学习与功能服务,有助于降低学习者的认知负载,增强交互体验,提高学习效果和协作水平。但技术的深度应用也带来了对技术过度使用的恐慌与担忧,亟需研究者提供精确的学习模型,发现科学的学习规律,以指导技术在教育实践中的应用。
计算教育学的研究将有效组织教学资源,以知识汇聚为基础,以知识工程驱动,融合虚拟现实、增强现实、人机交互等技术,提升教师教学与学生学习的效率,并支持自适应在线教育系统的发展。一方面,在计算教育学中,采用数据科学的方法收集和分析教学过程中产生的数据,描绘学习者行为画像,构建学习者和学习过程的模型,以支持教学内容和教学方法教师干预手段的个性化推荐。另一方面,基于计算教育学,探究智慧课堂中人、机、物三者之间角色分配与协作关系,探寻交互机理,发展对学习体验的有效量化研究与评估手段,攻克相关核心机理与关键技术,构建体验感良好、人机物紧密融合的高效协同教学环境,大幅提升课堂环境下群体智能教与学的效率效果。具体的研究问题可以包括:①为实现自适应教育系统,需要将分散的各类教育资源和学生个人数据进行关联和共享,破解数据孤岛、数据壁垒等问题。②为实现多主体教育资源共享,需探究基于元数据的数据标准,抽取教育资源的元数据信息的方法与技术,实现资源共享的统一数据标准,并研究去中心化的教育资源共享技术,探究用户隐私数据保护与资源共享技术。③开展在线教育学习过程的全息刻画、规模化综合教学平台与工具的研发、知识工程驱动教学资源组织与优化及智能学习环境构建的研究、支持高效结构化研讨的人机融合技术和工具研究、应用AI/AR/VR 等技术的认知机理研究等。
6. 教学应用
应对新时代的挑战,计算教育学将助力以领域知识和智能信息技术融合为基础的教与学、管理、决策、实施、评价等教学体系中各个环节的智能化发展。以下将以教学互动和教学评价两个环节中的关键研究问题为例,说明实现教学体系现代化过程中,计算教育学可以解决的科学问题。
课堂中积极有效的教师教学、学生学习、师生互动是实现高质量教育、提升课堂教学质量的重要教育因素,外在表现为教师和学生的行为、表情和声音等多模态非结构化信息。学生学习状态可以体现为课堂学生专注水平、学习情感表现,可透过学生的表情、行为进行分析;教学效果可以利用课堂答题器等师生互动进行适应性测量、用深度知识追踪等方法评估。课堂师生互动包括认知互动和情感互动两种类型,认知互动促进师生的共识,情感互动达成师生的共鸣,互动不仅能有效帮助学生提高知识和技能,还能让学生获得积极的学习体验,促进学生心理健康发展。因此,揭示课堂教学环境下,教师、学生和教学过程等复杂教育学研究对象在多模态高维数据空间中的可归约性和可计算性本质,并通过对计算结果的教育学解释验证研究结论是非常值得研究的问题。计算教育学研究将建立教与学过程的数据分析模型;将开展对群体智能与协同学习中的组织与涌现、测度与分析、导学与进化等环节的研究;将开展移动环境下自导式学习方案的自动生成问题等方面的研究。
教育评价是衡量教育发展、分配教育资源、促进教育改革的重要依据。以大数据、人工智能等为代表的新一代信息技术的快速发展,将会对传统的教育评价理念、方法和模式产生革命性影响,为实现更加多元、精准与智能的教育评价带来契机。利用新兴信息技术开展教育评价创新,实现信息技术与教育评价的深度融合,是推动教育评价体系重构、加快教育领域综合改革的科学力量,这对于促进教育公平、提高教育质量、优化教育治理具有重要作用。例如,将区块链技术应用于教育评价和教育伦理的研究当中,来保证教育数据使用过程的公开、公平、公正,具体的研究问题包括:教育大数据中因果关系的挖掘分析、数据驱动的实时教学决策、基于智能推断的学生能力评估及归因分析、数据驱动的精准化学习评价机制与方法、面向课堂教学评价的形式化建模与智能计算、面向群体在线协同学习的量化测度与分析、教育评价的数据可使用性研究和信赖度研究等。
规范化的学科设置是管理者对学科发展和科学研究进行管理的基本而有效的手段之一。根据社会科学的理论,一门学科社会建制的确立是其学科研究与发展的物质基础(方文,2001,第128 页)。学科的社会建制给予该学科以外部承认和组织支持,为该学科发展提供外部制度环境。在现代社会中,学科建制化的意义,主要是通过“合法化”的途径,获得编制、资金(基金)等外部制度环境的支持。计算社会学的发展历程,也验证了学科社会建制的重要性。计算社会学自2009 年诞生以来(Lazer,2019),研究成果频频出现在以往主要刊登自然科学论文的顶级杂志上,研究中心和专业学会相继成立,不少世界著名大学已设立相应的课程或学位(郦全民,2019)。对于计算教育学而言,其社会建制的发展尚处于萌芽与探索的阶段,以下将从学科社会建制的几个要素来分析计算教育学的学科发展基础,并提出建议,其中包含学术共同体与学术阵地、规范的学科培养计划、学术公开与评价机制、稳定的基金资助等方面。
1. 发挥学术共同体作用,推进学会建立和发展
学科的建制以学术共同体为基础。学术共同体源自库恩的“科学共同体”概念,指专注于某一领域研究的科学家群体,他们对于该领域的理论、规律、实验和应用都有本质上的一致性认识。在当代,专业性的学会组织是学术共同体很重要的一个载体和存在。目前我国尚未建立计算教育学的专业学会,但随着数据科学在教育领域的实践与应用,正逐步形成围绕具体研究问题的学术阵地,正形成积极探索与推进计算教育学发展的氛围。例如,由华中师范大学刘三女牙教授带领的大数据教育研究团队积极推动基于大数据和人工智能的教育评测研究与实践;由华东师范大学周傲英教授带领的数据科学学院积极尝试数据科学在教育领域的广泛应用与研究;由北京师范大学陈丽教授带领的团队基于联通主义的MOOC 教学实践,采用数据科学的分析手段,探索新环境中知识生成的基本规律等。
伴随我国发展人工智能的国家战略和《中国教育现代化2035》的推行,越来越多的研究团队投入到基于数据科学的教育研究中,但是不同研究团队之间对于计算教育学的核心价值和基本框架尚未达成共识,对研究范式还存在争议。为推动计算教育学的长足发展,需要积极推动计算教育学学会的成立,并在学会的组织下定期召开国内和国际学术研讨会,创办专业期刊。由于不同的学科领域长久以来独立发展,拥有独立的学术规范、语言体系和研究实践系统,造成跨领域研究与合作的困难。计算教育学的发展需要研究者们打破学科的藩篱,共同推动计算教育学基本问题的研究,并形成共识。
2. 依托学历体系建立人才培养计划
计算教育学的稳步发展,亟需建立科学合理的研究梯队。系统化的学科人才培养计划是储备学科建设者的重要社会结构。目前我国尚未有计算教育学的学科人才培养计划和学科建制。而计算教育学的跨领域特性对研究者提出了很高的综合能力要求。教育研究者往往不具备理解和运用较为复杂的数据处理方法的能力,基于数据科学的数据收集和分析方法对很多教育研究者而言是一个“黑箱”;而计算机和信息科学领域的学者则缺乏教育学的理论基础和知识背景,对教育领域的问题不了解。因此,需要通过学科建设,依托学历体系推动专业人才的系统化培养。
建立计算教育学学科旨在培养具有大数据思维、能够灵活运用数据挖掘及分析技术解决教育场景中实际问题的跨领域人才。计算教育学将从大数据应用的三个主要层面(数据管理、系统开发、海量数据分析与挖掘)系统地培养学生掌握解决各种复杂教育问题的方法,同时系统性地教授教育学原理与研究方法,提升学生解决教育中实际问题的能力,使学生具有将教育学的知识与数据科学技术融合并创新的能力。为此,推动学科建设,通过完备的学历教育体系和学位授予制度,开展完善的本科、硕士和博士的学历培养,为计算教育学的发展储备高素质跨领域研究和实践人才尤为重要。研究者们需要尽快根据计算教育学的学科基础框架,形成知识体系,建设教材和教学资源,开展课程教学。
学科的社会建制对共同体成员身份认同和学科认同具有重要作用。在大学或研究机构建立独立的学系,可以为该学科的学者提供以固定教职为基础的职业化发展支持。建立一定数量的研究机构,在“编制”的支撑下吸引一批研究者专业从事计算教育学的研究,使他们拥有自己的学术组织,有相应的平台产出研究成果并展示和交流,获得国家或社会资金支持,持续、系统、深入地开展研究,发展出稳定的研究梯队,推进以从事教育大数据为基础、以新技术为支撑、以应用为导向的研究和开发工作。
3. 建立学术公开与学术评价机制
学术公开是学科发展的重要基础,学术评价是学术成果的“试金石”,两者都是学科核心价值实现的重要保障制度。计算教育学的学科发展虽尚处在萌芽阶段,及早确立并完善学术的公开与评价机制将为计算教育学的健康发展提供积极的引导和保障。
学术公开包括重要的教材、专著、学术论文的公开,它们是学科科研成果发表的重要标志,也是当代学术竞争的重要手段。计算教育学相关领域的学术论文在国内外的发表量正在逐渐增长,但因为计算教育学的跨领域性本质,顶级学术期刊对于新兴研究范式和跨领域研究的接受度较低,导致跨领域研究的学术发表困难,前沿学者仍然面临寻找合适期刊发表的挑战。例如计算教育学的研究范式还不被大部分传统教育学期刊编辑所了解和接受,而部分信息技术期刊则认为计算教育学的研究成果缺少对数据科学技术方面的创新和推进。因而,需借助学会等学术共同体积极推动期刊的专题讨论或以专辑的方式集中研讨计算教育学的研究成果,扩大学术影响力,推动更有质量的学术论文的发表,进而组织相关的学术专著和学科教材的编撰与发表。
针对计算教育学科的跨领域性质和面向实践的特征,需要创新相应的学术评价机制以鼓励研究者积极开展跨领域合作研究和创新实践。由于学科长期独立发展,因而有其各自不同的学术评价标准,相关学科的评价标准对于计算教育学等跨领域研究并不适用。例如,计算机领域技术发展迅速,学者更多看重顶尖会议交流文章,而教育学领域则更多看重期刊文献。高等院校中人文学科领域(包括教育学)以学术文章数量为主的评价方式无法科学地评价实践创新和社会效益等成果的价值,也不利于鼓励专业人员开展实践创新,有悖于计算教育学面向实践的核心价值。这些问题都需要创新学术评价机制来保障并鼓励计算教育学中的跨领域研究。
学术评价机制还应包括制定合适的学术规范,特别是隐私与伦理保护的相关机制。计算教育学在技术先导的特征与市场活跃的实践推动下,技术应用对教学与研究的改变远超规范、准则与法律的修订速度。面对同样的挑战,计算社会学提出四项原则帮助研究者应对研究道德与伦理的挑战,即对他人的尊重原则、有利化原则、公正原则以及对法律和公共利益的尊重原则。计算教育学也可以结合教育研究的特征,制定相应的原则和准则帮助教育科研工作者开展具体实践工作。
4. 健全学术项目资助与管理制度
学科的发展需要有健全的资助体系,需要积极争取国家与社会的资源与支持。目前依出资主体可以将资助体系分为两部分,一是不同层级的政府出资,二是企业或民间出资。
在政府出资方面,我国国家自然科学基金委于2018 年设立了教育信息科学与技术二级申请代码F0701,集中受理信息科技与教育学科交叉领域的基础理论、基本方法和关键技术等研究项目,为计算教育学的发展提供了关键的制度保障,并奠定了重要的研究基础。截至2019 年,两年来F0701 代码下共资助研究项目142 项,涵盖教育信息科学与技术的基础理论研究、交互学习环境构建、虚拟与增强现实学习环境构建、教学知识可视化研究、教育认知工具研究、教育大数据分析与应用、学习分析与评测、自适应个性化辅助学习研究等方面。为进一步推动计算教育学的发展,应在F0701 现有系统资助布局基础上,在重点项目群、重大项目、重大研究计划等重大资助项目上取得突破,引领计算教育学学科发展。
回溯以往,教育领域不少研究出于经验、感悟,缺乏实证、缺乏数据支撑,可靠性有待增强。随着互联网、大数据和人工智能时代的到来,自然科学基金设立教育信息科学与技术资助项目,推动自然科学和人文社会科学,特别是推动生命科学、信息科学、智能科学与教育基础研究的交叉融合,必将对教与学的基本规律问题作出更加深刻的科学回答。2020 年,科技部在“科技创新2030—新一代人工智能”重大项目第一批项目指南中,开始部署“混合增强在线教育关键技术与系统研究”,由此可见,以科技创新促进教育变革已经成为政府科技管理部门的重要视角。
在企业或民间出资方面,由于计算教育学的社会实践性,计算教育学的发展需要广泛动员社会资源以资助学术研究,连接产业界的实践与创新,创新资金支持制度,建立产学研用一体化的平台与机制。计算教育学的发展与产业创新和技术发展密不可分。教育实践的创新探索为凝练计算教育学的关键科学问题奠定了重要基础,实质上有力推动了计算教育学的基础研究。源自产业界的技术和资金,一方面为推动计算教育学发展提供了更丰厚的经济基础,另一方面也带来了可能影响研究客观、中立与独立的道德风险和知识产权归属的问题。因而亟需创新制度,厘清权益和责任,平衡不同利益诉求,保障研究的独立与科学性。
信息技术领域软、硬件的发展,数据收集和分析技术与工具的成熟,智慧教育环境中产生的海量数据,以及复杂系统论的渗透和计算社会学的镜鉴都为计算教育学的产生奠定了坚实基础。本文论述了计算教育学作为独立学科发展的必要性和意义,从计算教育学发展的动力系统和学科基础探讨了发展独立学科的可能性,并通过现代学科的视角,分析计算教育学已经开始的学科萌芽,但还需提炼学科知识结构,致力学科的社会建构,如图6 所示。在技术与社会发展的共同推动下,教育的智能化发展成为推动计算教育学的外部动力;同时教育研究向科学化发展的内部变革也驱动计算教育学的诞生。迅速发展的多元化理论基础,多维度数据基础和新一代智能技术共同奠定了计算教育学成为独立学科的基础。通过理性审视计算教育学的边界和发展现状,计算教育学的核心内涵是以量化数据为基础,以计算方法为核心,以揭示教育领域的底层规律,构建精准理论为目标。
目前计算教育学的知识架构初具雏形,学界已初步形成了计算教育学基本立场与价值观共识,并形成独特的研究范式。学者们认为计算教育学的核心价值是围绕教育领域真实问题,注重实践与应用,注重跨领域综合性研究;研究体系以计算方法为核心,研究范式已经从自上而下的量化研究转向自上而下与自下而上相结合的基于数据的教育规律探索研究,目前形成模拟实验与数据密集型探究共同发展的特征。然而,基于计算教育学自身的综合性学科本质,以及其作为新兴学科的发展性,计算教育学的内涵与外延依然在不断发展,还需要研究者们深入探讨与研究。不局限于基于数据科学的教育研究范式的发展,计算教育学作为一门独立、新兴、面向应用的跨领域学科还需要系统性地加强基础理论研究,建立学科的知识框架,并推动计算教育学社会建构的建立与发展。综合目前的实践发展趋势和教育发展需求,本文提出计算教育学的价值与意义,包括宏观层面的教育资源配置,中观层面的教育公共服务,微观层面的教育政策和策略的实施过程及各教育要素的演化过程,从而分析教育政策和策略的实施效果,为改进教育政策和策略奠定基础。
图6 计算教育学发展的框架
计算教育学的突围将为我国教育学发展提供重要机遇,突破目前教育学研究存在的局限性,构建教育学全新的研究路径,大力推动教育学认知体系的结构化变革。为满足计算教育学科学而有序发展的需求,实现以学科建制的方式进一步推动计算教育学的体系化发展,结合我国发展现状,提出知识建构与社会建构共同发展的路线,理论研究与应用实践并举的生态建构发展思路。以下提出四点建议。
第一,加强基础研究。一是在资金和技术的共同推动下,业界普遍关注在教育领域应用中遇到的工程技术挑战,但计算教育学,作为一门新兴学科,亟需开展理论研究,对实践经验进行系统化总结沉淀、反思与分析,提炼抽象出学科的基础理论,为学科发展提供必要的知识框架,并指导行业发展方向,制定技术应用的规范与标准。二是计算教育学要成为联通自然科学与人文社会科学对教育学研究的桥梁。虽然教育大数据的应用发展迅速,基于数据科学的研究范式也得到研究者的认同,但还需要不断建构计算教育学研究范式的理论基础、实践规范以及对操作化的具体解读,推动教育领域全数据革命,综合应用多种研究方法。其中,计算教育学需要综合利用各种数据,不仅仅是大数据,也包含小数据,获得对教育领域更深刻、更清晰的认识;在研究方法层面注重与其他实证研究方法和思辨方法的融合,避免出现大数据与小数据的断层、不同研究范式之间的断层,以支持教育学研究转向多维度的真实事件分析,支持对教育复杂系统的全面动态分析,支持自然科学研究范式向教育学领域的渗透。
第二,响应教育实践需求,开展应用研究。华东师范大学陈玉琨教授提出计算教育学应肩负起推动教育实现革命性变革的重担,并提出计算教育学发展应关注以下教育领域的重大问题:一是以改革教材和教法为突破。结合技术发展的趋势和社会需求,要实现智慧教育,发挥人工智能技术的作用。陈玉琨认为计算教育学应该揭示学生的认知逻辑,结合学科逻辑建立多维的学科体系,支持适应性教学资源的研发与教学方法的创新。二是开展以数据和文本分析为基础的教育政策分析。陈玉琨认为基于教育大数据和自动文本分析技术,可以揭示教育系统和政策的历史演变,并及时了解人民群众与国家和各级政府对教育的期望,从而预测教育发展的趋势,为科学和精准的教育治理提供研究支撑。三是开展以计算为基础的学生情感分析。陈玉琨提出应全面关注学生的发展需求,包括学生的心理健康,积极面对学生越来越普遍和严重的焦虑问题。通过情感计算等数据科学技术,精确及时记录学生情绪变化,为学生建立更科学的学习者模型,重新定义教育心理学。
第三,成立专业学会,扩大学术影响力。计算教育学的兴起出现了概念模糊与异化的现象。因而,亟需凝聚学术共同体共识,以学会的形式推进并保障研究生态的健康有序发展。首先,需要以学会为基础系统性地提出战略发展规划,凝练学科的核心价值和研究规范,明确计算教育学的内涵与外延,共同推动学科地位(逻辑起点、研究范围)和基础理论(理论体系、学科体系、本体、客体等)问题的研究,开展学术研讨,达成共识。其次,以学会为平台,凝聚领域内的研究力量,组织不同研究团队和学术团队开展研讨和跨领域合作。构建合作机制,帮助研究者们围绕共同的问题,加强交流与合作,建立统一的术语表(韩军徽&李正风,2018),综合利用不同学科的知识和工具。再次,学会可以通过组织专辑类学术文章,创办专业学术杂志,举办国内外学术研讨会等方式,展示该学科的研究成果,扩大学术和社会影响力。目前,我国华东师范大学周傲英副校长推动的计算教育学系列学术研讨会已经成功举办了四届,极大地推动了计算教育学学科的结构化发展。在此基础上,还需依托学会,更系统化地设计会议主题,更大规模地吸引不同领域的专家和实践者从不同的角度充分开展学术研讨,共同解决教育学面临的复杂问题,构建领域的共识与基础。
第四,建立产学研用一体化的平台,凝聚社会各界的力量推进学科发展。在高校和科研院所,虽然计算教育学的以数据为基础、以计算为核心的范式和特征得到研究者的认同,也兴起了关于模拟计算实验与数据密集型探究的理论探讨,但在我国还缺乏使用这两种研究范式的落地实践经验,大多仍处于理论探讨层面。同时,资本推动的产业创新蓬勃发展,却缺少研究性的总结和反思,也缺少揭示教育规律的基础研究支撑创新应用。因而建议在推进计算教育学的学科发展的道路上,通过搭建产学研用一体化的平台,建立平衡实践与研究的生态体系,促进计算教育学研究与实践的同步发展。
(严晓梅和王晶莹系本文通讯作者。)