顾小清,冯园园,胡思畅
(华东师范大学 教育信息技术学系,上海 200062 )
超越碎片化学习:语义图示与深度学习
顾小清,冯园园,胡思畅
(华东师范大学 教育信息技术学系,上海 200062 )
泛在技术的普及使得信息的获取更加便捷,与之伴随地是信息消费中的碎片化、多任务和浅层读图的现象。针对这一问题,该文依托于“语义图示”所开展的研究,提出一个有助于提高学习深度的方案——语义图示工具模型。作为一种帮助学习者达到深层学习的工具,语义图示工具的设计超越碎片化的知识获取方式,为学习者提供系统而全面的学习支持。该文首先追溯机器学习和教育领域中深度学习的发展;接着在语义图示工具的设计中,借助人工智能技术,设计专家系统作为后台支持,以实现可视化语义建模、语义推荐以及动态模拟的核心功能,这些功能旨在通过语义图示帮助学习者做出决策、解决问题,以超越碎片化的信息获取方式;最后,该文以案例的方式呈现语义图示工具中的几个核心功能,以示例如何通过可视化的语义图示超越碎片化的语义获取。
碎片化;语义图示;深度学习;机器学习
信息技术的飞速发展及其在社会生活中的普及,除了给公众带来更多的信息选择和信息消费方式之外,同时带来的,是信息获取和信息消费的“碎片化”——泛在技术所带来的副产品。一些调查显示,近7成用户每天通过手机访问互联网[1],平均每天会查看自己的移动设备150次[2],花费在移动设备上的时间每天长达2小时42分钟[3]。据第十一次全国国民阅读调查结果显示,数字化阅读方式的接触率为50.1%,其中44.4%的读者通过网络在线阅读,41.9%的读者通过手机阅读。并且信息获取功能越来越受到成年网民的重视,有74.2%的网民将“阅读新闻”作为主要网上活动之一,有45.0%的网民将“查询各类信息”作为主要网上活动之一[4]。
以上调查从不同角度刻画出信息获取和信息消费的碎片化特征。碎片化的原因,一方面由于信息来源的多样性和信息获取的多渠道。在信息来源方面,小众媒体、自媒体和大众传媒共存;在获取渠道方面,移动终端成为公众获取多种渠道信息的主要载体,主动获取和推送方式并行。另一方面,信息获取的图像化、信息消费的多任务特征,某种程度上也引起了碎片化的发生。信息技术的飞速发展推动了“读图时代”的到来,读图以“图说”形式代替“言说”,符合当代人的生活节奏和阅读取向[5]。图像的生动现场感给人们带来的视觉冲击,有时是任何语言的描述都无法企及的。虽然说“一图胜千言”,然而,图像的出现打断了文字固有的逻辑性与连贯性,其所呈现的信息难以达到系统性和完整性的知识建构要求。而且,当面对图像时,读者满足于图像所提供的直观信息,被动的接受而丧失了对文字的主动索取以及再造想象的空间。虽然在某种程度上,图像的信息量大于文字,但是平面的形象缺乏文字所包含的深层含义。另外,典型的信息消费方式,往往也同时体现多任务的特征,从而加剧了信息消费的碎片化特性。无论是在线的阅读还是移动中的阅读,伴随着多任务的特征:电脑上同时开启多个窗口并行着多项任务;移动中更是如此,甚至是在通勤、对话、会议的间隙中并行着多任务。
随着泛在移动技术成为数字学习的一种重要载体,上述信息消费中的碎片化、多任务和读图现象也开始出现在数字学习领域。当学习者期冀在生活工作的间隙实现任意时间、任意地点的学习,借助移动泛在技术所实现的碎片化学习也就成为颇具潜力的一种学习方式。但是随之产生的碎片化、多任务和读图等特征所带来的学习深度问题也随之浮出水面。某种程度上而言,人类拾取信息的自然方式本身就是碎片化的,学习就是对碎片化的知识、信息等“构件”(Building Block)进行加工的过程[6],但这只是故事的一个方面。故事的另一面,是碎片化的信息获取所构成的学习,往往具有浅阅读的特征[7-10]。学习者从图像中获取信息,呈现感官化的审美取向,但同时可能带来的,是文字感悟能力和抽象思维能力的丧失,学习者对知识的理解停留在浅表的感受层面,并且图像作为典型的碎片化信息载体,在形式上难以建立系统的知识结构。与此同时,当学习者在不同的媒介(电子文档、电子书、电子课本)、不同的载体(电脑、手机、平板)、不同的任务之间跳转,人们开始担忧这样的学习恐怕缺乏对内容的深入思考,不能将信息做广泛联系,学习仅仅停留在了获取知识的浅层面,而缺少了对知识的汇集、过滤、归纳、反馈和创新。因此构建“深度”的学习环境就成为突破浅层学习的关键。如何在学习者的认知突触中留下轨迹,以便成为知识结构中的组成部分?如何有效地对信息组织加工、构建知识结构、引导学习者建构对整个问题的认识、促进学习者进行反思以及知识的迁移与应用?成为我们关注的焦点。
本文所介绍的,是我们团队针对上述现象,尝试以“语义图示”来突破碎片化和读图所带来的学习深度缺乏问题而开展的研究。语义图示,作为承载知识信息的新一代图示媒介,将抽象的知识信息通过带有语义规则的图形、图像、动画等可视化元素予以表征,促进知识从认识到理解的过程[11]。本研究在语义图示的研究实践过程中关注“深度”学习情境的建构,基于语义关系试图构建“语义图示”工具,通过建立知识碎片间的语义关联帮助学习者形成个人的知识体系,从而突破浅层学习,进行更深层面的可视化信息加工和知识建构,构建类似专家系统的语义模型,实现类似推理功能,帮助学习者认识和理解,达到深层学习。
数字学习所伴随的碎片化、多任务和读图特征,给学习方式带来多样性及便利的同时,也带来了学习缺乏深度的问题。应对的明智方式,肯定不是倒洗澡水地同时也抛掉孩子这样简单。那么,在拥抱技术给学习带来的可能性的同时,是否能够发挥技术的潜力,提供深度的学习?如果我们把碎片化的学习看作是价值有待挖掘的学习信息拾取部分,并把学习的深度聚焦于将碎片化的资源加以聚合、将片段性获取的信息加以逻辑组织,那么,目前发展势头迅猛的自动化技术,包括机器学习/人工智能技术,会是帮助提升学习的深度的良方吗?
50多年前,人们就开始关注人工智能技术,希望有朝一日计算机能够产生“自我”的意识,具有类人的、同时超越于人类局限的思维[12]。近年来,人工智能和机器学习技术取得了长足的进步,在大量现成数据的帮助下,计算机已经能够表现得十分强大。那么,能否借助机器学习和人工智能技术,帮助学习者组织碎片化学习资源,构建自己的知识体系,辅助和促进深度学习的发生?在下面的部分,我们首先对深度学习进行综述,以理清机器学习/人工智能技术与深度学习之间的关系。
(1)机器学习中的深度学习
实际上,抢注了“深度学习”这个名词的,最早就是机器学习领域。在机器学习中,深度学习被定义为“一系列试图使用多重非线性变换对数据进行多层抽象的算法”[13][14]。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法[15][16],是对人的意识、思维和信息过程的模拟,是一门人工智能的科学[17]。而深度学习是机器学习中表征学习方法的一类,其关系如图1所示。
图1 深度学习、机器学习、人工智能间的关系
自2006年起,深度学习(或者称为层次学习)成为机器学习研究的一个新领域。深度学习技术采用的方法主要是无监督学习,取代了人参与的特征选取的过程,自动进行特征学习,通过对原始输入数据的处理分析自主发现一些有效特征[18]。一个典型的设置:一台电脑面临着一个大的数据集,需要对这些数据进行分类,类似没有具体指令的情况下让孩子对玩具进行分类。孩子可能对它们的颜色、形状或功能,或其他的方面进行分类。机器学习者尝试这样做,例如对数以百万计的手写体进行大规模学习,把这些手写体数据相互对比,在相似性的基础上对他们“聚类”[19]。
之所以把这种学习称为“深度”,是相对于之前的机器学习方法的“浅层”性。深度学习技术是对人工神经网络(Artificial Neural Network,ANN)的发展,通过模仿人脑的逐层抽象机制来解释数据,设计算法对事物进行多层级分布式表示[20],组合低层特征,自主发现有效特征,进行特征继承,而形成抽象的高层级的表示[21],在更高水平上表达抽象概念,以建立、模拟人脑进行分析学习的神经网络[22]。
神经网络可以看作是深度学习的基础。该领域的研究可以追溯到二十世纪五十年代,弗兰克·罗森布拉特试图建立模拟人类感知能力的机器,1957年成功完成感知机的仿真,1959年实现基于感知机的神经计算机Mark1,在算法上发展了一种迭代、试错、类似于人类学习过程的学习算法,能够识别一些英文字母。上世纪八十年代,“反向传播”算法出现,“隐层”概念被提出,解决了原始感知器无法解决的异或功能,构建出更复杂的虚拟神经元网络。2006年,杰弗里·辛顿提出深度学习的概念,对“神经网络”进行改进,增加隐层的层数(深度),发现如果人工神经网络的隐层足够多,选择适当的连接函数和架构,并增加一个非监督学习的“预训练”网络组成,具有更强的表述能力[23]。
深度学习的发展不仅吸引了来自学术领域的目光,也吸引了工业领域的目光。过去的几年里,谷歌、苹果、IBM积极参与到深度学习技术的研究当中。2007年开始,纽昂斯通讯公司开发以语音识别技术为基础的虚拟个人助手“苹果语音助手”;2012年6月,谷歌大脑通过模拟神经连接来模拟人类学习[24];2012年11月,微软公开演示全自动同声传译系统,实现自动语音识别、英中机器翻译和中文语音合成,深度学习技术推动了语音识别精确度的提高[25];2014年3月,Facebook人脸识别技术的识别率达到了97.25%,准确率几乎媲美人类(97.5%)[26]。这些成功背后的技术支持都来源于机器学习领域的深度学习技术。
(2)教育中的深度学习
由于深度学习这个概念已被计算机领域“抢注”,我们用深层学习来阐述教育领域对深层/深度学习的研究。与计算机领域的深度学习意义不同,教育领域的深层学习是一种学习方式,目的是为了构建有意义的学习,在记忆的基础上理解、归纳、掌握、运用,结合原有认知结构,批判性地接收和学习新知识,建立知识间的相互联系,通过分析,做出决策和解决问题的学习。与浅层学习停留于信息的接收不同的是,深层学习关注于对新知识的批判性吸收,将它们与已有知识建立关联,引起对概念的理解和长期保留,以便于应用到解决新的环境中所遇到的问题[27]。深层学习与浅层学习的主要特征对比如表1所示。
表1 深层学习与浅层学习的特征[28]
续表1
早在20世纪80年代,认知科学家发现当学习者学习深层知识并清楚在真实世界和实际情况中如何运用这些知识时,知识会在学生头脑中保持得更为持久[29]。最初,深层学习的概念由Marton and Saljo(1976)提出,通过测试学生阅读文章,发现采用不同学习过程和策略的学生在理解和记忆中的表现有所不同,而采用深层学习还是浅层学习主要受到学习者意愿的影响[30]。随后Biggs(1987)沿用深层学习和浅层学习的概念,指出不同的学习动机和学习策略的结合对学习效果的影响,同时,个人能力和流程控制影响元认知。为了了解学习者理解能力[31],Pask(1977)将学习过程分为序列型(Serialist)和整体型(Holist),序列型指按部就班阅读文本,整体型指阅读所有吸引注意力的文本[32]。研究发现,整体型更强调已有知识的构建表达,而序列型更加关注程序细节,因此在理解力的表现上有很大不同。William & Flora Hewlett Foundation针对深层学习做了一系列研究,了解是否有一种实现方法推动深层学习的发生,发现:(1)通过设定明确的学习目标,设计基于项目的课程和实践,改善教学策略,给予学习支持,以及追踪内容评估,可以帮助学习者掌握核心知识和批判性思维能力[33]。(2)网络环境为学习者提供更多进行深度学习的机会,有助于复杂问题的解决,人际间的协作与交流,及时反馈,使得学习者更好地学习如何学习,进行跨学科学习,并建立知识与实践的联系,更好地应对和解决复杂问题[34]。索耶(2010)指出深层学习需要学习者在新旧知识、概念、经验之间建立联系,能够将他们的知识归纳到相关的概念系统中,在学习过程中寻找学习模式和基本原理,并评价新的想法,能够将这些想法与结论联系起来。同时,要求学习者了解对话的过程,对话的过程就是知识产生的过程,在这个过程中,能够批判地检查论据的逻辑性,并对其理解及学习的过程进行反思[35]。
可以看出,深层学习的发生受到学习者学习动机、个人能力、学习流程、学习策略、学习环境以及情感和行为投入等因素的影响,强调高阶认知目标层次和思维能力,总的来说,是一种有意义的学习,一种主动学习。因此,研究团队希望通过对机器学习领域以及教育领域中深度学习的研究,找到一个可落地的深度学习方案,来辅助学习者完成深度学习的过程。
碎片化学习中信息的片段化拾取往往是零碎的甚至闲散的,这样的信息获取往往缺乏对内容的深入思考,不能建立信息的广泛联系,学习仅仅停留在浅层面;同时,“读图”方式的信息感知往往停留在对信息的感性认知而忽略其内部逻辑联系,不易进行学习的推理。如果学习只能停留在这种无组织、孤立的知识片段层面,也就难以超越碎片化导致的浅层学习局限。那么,上述的机器学习、深度学习技术,抑或教育领域中的深层学习策略,是否是超越浅层学习的良方?
信息零碎、分散、缺乏逻辑性和连贯性是问题的关键。教育领域下的深层学习被视为一种学习方式,需要批判性地吸收建构知识,强调新旧知识之间的相互联系,通过分析做出决策,解决实际问题。深层学习的内涵恰好可以填补碎片化学习中浅层学习的空缺。超越碎片化实现深层学习,是探索解决碎片化问题的要义。但是,深层学习虽然描述了一种有意义的学习,提出了对学习的要求,却并没有给出可操作的实施方案。那么,机器学习/人工智能技术,是否提供深层学习道路?专家系统作为人工智能的重要研究领域,是一类具有专门知识和经验的计算机智能程序系统,其内部含有大量的某个领域专家水平的知识与经验,通过推理和判断,模拟人类专家的决策过程,解决那些需要人类专家处理的复杂问题[36],可以对人的意识、思维和信息处理过程进行模拟,从而像专家一样解决学习者学习过程中遇到的问题。
知识库和推理机是专家系统的核心,建立知识库的关键是知识的获取和表示,通过推理机将获取的知识进行逻辑化、系统化处理,可以作为辅助人类提升学习深度的有力工具。知识库存放着搜集来的知识,通过系统地表达或模块化,使得计算机能够推论和解决问题。知识库中的知识包含两种,一种为知识本身,对物质及概念的实体分析,并确定彼此关系;另一种为人类专家特有的经验法则、判断与直觉[37]。推理机基于某种逻辑规则,针对当前问题的条件或已知信息,反复匹配知识库中的规则,获得新的结论,以得到问题的求解结果。推理模式有正向和反向推理两种,正向推理是从条件匹配到结论,反向推理则先假设结论成立,看条件是否得到满足[38]。由此可见,推理机与专家解决问题的思维方式相似,而知识库通过推理机实现其价值。
如果使用机器学习技术作为专家系统的推理机制,则专家系统主要的功能和任务就是根据给出的一系列特征推理出正确的分类结果。这种专家系统表现为,当学习者给出知识的特征(或属性),如图2所示x1、x2、x3,专家系统可以依据数据训练而生成的预测模型进行推理,从而计算出知识目标变量,也就是最后的分类结果,如图2中输出结果。知识特征可以是一个也可以是多个,不同的知识特征有不同的权重,代表着对最后结果的影响程度,如图2所示w1、w2、w3。例如某个用于辨别鸟的类别的专家系统,可以根据所给的特征推理出鸟的类别,不同类型的鸟具有不同的特征,如后背颜色、体重、翼展、脚蹼等。当学习者向该专家系统输入某一只鸟的特征信息:“体重为3千克,翼展为11厘米,无脚蹼,后背颜色为绿色”,专家系统可以提取问题根据其中的知识特征推理出知识的目标变量值为“瑰丽蜂鸟”。专家系统这种独立而准确的“思考”能力是我们需要借鉴利用的。
图2 专家系统工作原理
利用这样的专家系统,在学生学习过程中扮演虚拟教师的角色,提供准确、实时的知识推送、信息反馈、动态模拟、学习建议,帮助学习者建立知识间的联系,促进学习者进行学习反思,能够在一定程度上辅助学习者实现深层学习,满足数字化学习时代超越碎片化的诉求。本文所介绍的语义图示研究,正是试图结合深层学习的方法和深度学习的专家系统,设计一个具有语义关系的图示工具,该工具不仅能够可视化地表征知识语义关系,便于人们对零散的知识片段形成整体而又形象的认识和理解,还能通过分析语义模型实现推理、反馈、模拟等功能,从而在一定程度上破解碎片化和读图所带来的学习深度缺乏问题。
在碎片化学习的时代,学习者必须突破浅层学习的局限,以实现深度学习的目标为努力方向,从而真正从数字化学习中受益。作为一种探索中的技术方案,本研究团队尝试以“语义图示”来寻求突破碎片化和读图所带来的学习深度缺乏问题。语义图示工具模型的核心包括:(1)进行可视化知识表征的语义关系;(2)语义模型以及专家系统生成的语义推荐;(3)基于语义规则的语义建模和动态模拟。工具模型如图3所示。该语义图示工具模型使得学习者能够以类似学科专家的方式,通过对带有语义规则的图形、图像、动画等可视化元素的操作,进行知识的建模,通过语义推荐功能,为学习者提供反馈和建议,使得学习者能够在有支架的情况下,像专业人员一样运用复杂的表征来进行交流,像科学家、数学家一样利用具体的可视化模型[39][40]。同时,学生可以可视化地建立系统的学习者知识模型,通过得到的推荐进行反思从而不断对形成的知识体系更新完善,通过语义的知识动态模拟直观清晰地把握概念之间的关系。
图3 基于专家系统的语义图示工具模型
能够用来进行知识的可视化表征或建立知识模型的语义关系图,是语义图示工具模型的最基本组成部分。深度学习的实质表现是知识建模,而语义关系图的主要功能,正是提供学习者进行知识梳理,建立知识对象和属性、知识关系及过程的知识模型。语义图示的这一功能提供了迈向深度学习的第一步。
语义图示强调将抽象的知识进行可视化表征,在可视化界面,学习者看到的不是大段文字,而是携带语义的图形、图像。当图形、图像携带语义,相比于传统的读图,学习者可以更容易地把握知识的逻辑关系,建立碎片信息间的联系。语义图示对信息的可视化加工,大大增加了阅读的效率,能够适应当代人的生活节奏与阅读取向。
学习者可以对这些可视化元素进行添加、删除、编辑等操作,通过拖放它们的位置、改变它们的属性,最后组成一个组图,来表征某一知识及其关系,形成自己的知识体系。为了方便学习者的操作,这些可视化元素还可以提炼为语义图示控件、语义图示模板,使学生能够快捷搭建自己想要的模型。
能够用来进行基于规则的知识结构化的语义模型,以及以语义模型为基础的专家系统,是语义图示工具模型实现深度学习的核心功能。语义模型是以模型为媒介来实现数据语义关系形式化描述的一种方式。狭义的语义关系可以理解为文本的词义关系。Kintsch and van Dijk (1978)在他们的早期模型中提出,文本的意义可以被解析为语义单元,它们依据连贯的语义关系互相联系[41]。阅读理解被视作是汇总语义单元的过程,推理被视作具有搭建文本连贯性缺口的桥梁作用。而广义的语义关系表示概念间的单向潜在联系[42]。常见的重要语义关系有:因果关系、上下位关系、所属关系、同义关系、反义关系、能动关系、被动关系等。语义图示中的语义关系是对语义的广义理解。通过赋予图形图像一定的语义规则,为建立语义模型提供基础。
语义模型可以通过两种途径产生:(1)人类赋予;(2)通过计算模型产生[43]。语义图示中的语义包含了这两种产生方式:学习者建立的语义模型由人来定义,而专家系统中的语义模型则通过计算机生成。语义图示工具模型中的专家系统,其核心正是由计算机生成的特定知识领域的预测语义模型。基于语义模型,专家系统能够进行基于规则的推理。需要说明的是,作为一种可落地的深度学习方案,这里所运用的专家系统采用的是基于经验专家的模型,而非通过机器学习获取。两种途径的语义根据彼此的语义模型进行沟通。通过在学习者的知识需求和专家系统的知识库之间搭建一座桥梁,将两者从语义的角度建立关联,对抽象的知识/信息进行基于语义模型的解析,以满足学习者对深度学习的需求。
语义图示工具模型的一项核心功能是专家系统通过获取来自学习者的知识特征变量,利用预测语义模型进行分析推理,最后得到输出,即知识的目标变量。当学习者通过可视化界面的交互操作完成知识表征时,所形成的可视化图像并不能直接被计算机理解,所以需要根据其语义将其解析成计算机可理解的语义模型。此时专家系统根据学习者在可视化界面建构的知识模型,基于专家系统的知识库生成相对标准的、正确的专家预测语义模型。专家系统得出的知识目标变量,很可能就是学习者遗漏的知识点,不确定的问题答案,这些反馈的信息就代表着学习者还需努力进步的方向,并反馈到用户操作界面上。
学习者获取碎片化知识片段时,很容易造成与先期知识之间的连接不足,专家系统可以推送相应的知识来提示学习者进行关联;学习者完成一次知识的建模后,可以与专家系统中较为标准完善的知识模型进行比对,专家系统给出反馈,提示知识的疏漏或者错误,学习者从而进行更深层的知识加工;在进行多次知识模型的比较后,专家系统根据总体的数据分析给出学习建议。这些反馈结果的形式多样,可以是一些数据,例如两种语义模型的匹配百分比、错误知识节点的数量;可以是知识节点,例如推送的学习者未能联系起来的知识节点;也可以是知识模型,例如专家系统生成的标准语义模型。
学习者在使用基于专家系统的语义图示工具时,不仅可以通过可视化的方式进行知识建模,帮助自己梳理知识,建立知识间的联系,并对知识有整体而形象的认识理解,还可以在学习的过程中不断得到提示、评估、建议,从而促进在学习中不断反思,锻炼高阶思维能力,进行知识的深度加工,实现深度学习。
当学习者在面对一些现实问题无法进行亲身经历和实践时,或者希望通过已知条件和现有数据,分析及预测趋势时,对学习场景“情境化”是很好的解决方案,实现情境性学习环境设计是深度学习关注的一个核心,也是语义图示工具设计的关键。
语义建模和动态模拟是语义图示工具的核心功能。学习不仅仅是传递和获得概念,学习者参与到类似学科专家研究的日常活动中有利于获得深度学习的发生[44]。语义图示工具为学习者提供一个交互式的、解决复杂问题的环境,超越单一的对知识进行记忆,在这里,学习者可以像学科专家一样建模、分析,将学习过程中的思维可视化,将学习者的内在认知过程外化,帮助知识建构和思路整理。同时,工具对真实存在的对象关系进行描述,建构相似的、有意义的、可被操作的场景。在建模的基础上,语义图示工具实现过程的动态模拟:(1)针对群体型。群体型的动态模拟建立在数量的变化上,透过变化曲线,可以分析数据的变化和走向,例如羊群中的羊的数量变化。(2)针对个体型。在个体型的动态模拟中,需要对粒度进行划分,这影响着整个系统的运算能力和灵活性,每个个体遵循各自的规则和算法调节自己的状态。通过个体型动态系统可以模拟群体中每个个体的运动和轨迹,以实现真实场景的模拟,从而解决现实生活中遇到的实际问题,例如羊群中闯进一只狼,每只羊的运动状态。
学习者通过建模,以及直观可视化的情境模拟,参与到学习场景中,在反复不断对系统进行建构和修改的过程中,锻炼学习者思维和逻辑能力。同时,工具的可视化结果为学习者提供反馈,形成一个学习闭环。
死记硬背和简单的记忆对个人的知识建构的作用是浅显的,起主要作用的是有意义学习的发生[45]。因此,本研究设计的语义图示工具试图帮助学习者实现深度的学习。以下的案例是现有的、能够借用来从不同角度阐释语义图示功能,包括达到实现语义层级结构模式的WordNet、实现语义推荐并与专家模型比对的Cmaptools,以及实现知识表征模拟过程的Insightmaker。
语义关系的构建是设计语义图示系统最关键和基础的部分。现有的工具中,WordNet的类似功能能够很好地对此予以阐释。WordNet是由普林斯顿大学的心理词汇学家和语言学家于1985年开始承担开发的一个基于心理语言学理论的在线词典参照系统。系统中的名词、动词、副词和形容词聚类为代表某一基本词汇概念的同义词集合,并在这些同义词集合之间建立起各种语义关系[46]。
传统字典通常根据词形,标准的按字母顺序对词汇排序,而WordNet试图根据词义而不是词形来组织词汇信息,更像是作为人的智能结构一部分的“内在词典”[47],那么能够表达词汇概念的性质和组织方式就显得十分重要。在词汇语言学中采用词汇矩阵的概念来表示词汇的组织方式,将词按照“词形”和“词义”映射,“词形”特指词语或主题词,“词义”表示词形所代表的词汇概念[48]。如表2所示说明了词汇矩阵的概念,假定列代表词形,行代表词义。如果同一表中,列中有多个表项,则该词形为多义词;行中有多个表项,则对应的词形是同义,相应的词为同义词。
表2 词汇矩阵[49]
词形与词义之间的映射是多种多样的,有些词形有多个不同的词义,有些词义可以用几种不同的词形来表达,WordNet中表示词与词之间的关系众多,以同义、反义、上下位关系、整体部分关系为例进行介绍。
(1)同义关系
因为判断词之间关系的能力是在词汇矩阵中表达词义的先决条件,其中同义关系是WordNet中最重要的关系。将同义关系与上下文相关联,如果两种表达方式在语言文本中相互替代又不改变其真值,则这两种表达就是同义的[50]。
(2)反义关系
反义关系并不是一种简单的对称关系,有些词概念上相对,却不能称为反义词。反义词是一种词形间的词汇关系,而不是词义间的语义关系,区分词形之间的语义关系和词义之间的语义关系十分必要。
(3)上下位关系
上下位关系是对词义之间语义关系的描述,又称为从属/上属关系、子集/超集关系或ISA关系。通常情况下,下位词继承上位词的一般化概念的所有属性,并且至少增加一种属性,以区别于上位词以及上位词的其他下位词。同时,上下位关系具有不对称的关系,通常情况下,一个词只有唯一的上属关系,产生一种层次语义结构[51]。对于名词来说,最终的根节点都是实体[52]。
(4)整体部分关系
整体部分关系指某一个词集是整体,而另一个词集在含义上是该词集的部分,“部分”可以进行继承。
语义图示系统试图实现的语义推荐功能,能够通过CmapTools予以阐释。CmapTools是人机识别研究院IHMC(the Institute of Human & Machine Cognition)开发的软件,用户可以利用它创建、导航、共享和分析评价以概念图形式表示的知识模型[53]。学习者可以通过Cmaptools整合网络资源、课堂资源、实验资源以及领域知识,进行课程安排,记录相关阅读,整理数据,支持小组协作,整理画图、照片、视频,进行多学科整合,用于演讲、研究和课前、课后评价等活动,同时Cmaptools为学习者提供脚手架支持,带来一种新的教育模式[54]。
Cmaptools包含“节点”“连线”和“连接词”。节点代表某一命题或知识领域的关键知识概念,节点间的连线表示概念间的逻辑关系,连线上的连接词表示概念间通过何种方式进行连接,如图4所示。
图4 Cmaptools要素组成
1977年,Novak提出知识组成的关键要素是概念以及概念间的关系的命题[55],当关键概念和概念间的相关关系通过概念图呈现给学习者时,Novak发现这对学习者学习十分有效[56]。因此Cmaptools包含一个重要的功能,即学习者以“专家骨骼”为基础,通过对“专家骨骼”修改或者重构,来帮助构建自己的知识体系。Cmaptools中包括近300种概念图合理涵盖1到12年级,6到18岁的科学领域,很多科学家专注于某一领域,并且不断改进概念图以达到更好的效果[57]。Camptools可以进行语义结构比对,以及根据节点的语义关系及相关节点进行推荐,但是这种推荐并不是机器学习的结果,而是之前人为的已经做好的一个稳定的语义结构,如图5所示。
图5 Cmaptools语义推荐
这种“概念图式”的知识建模过程,帮助学习者理清思路,梳理概念间相互关系;语义自动推荐功能为学习者提供脚手架,引导并支持学习者进行下一步学习;语义比对功能,与专家结构的对照能够快速发现自主学习中的不足并及时矫正。
语义图示作为超越碎片化的最重要功能,是实现基于语义的知识判断,而现有的工具中,Insightmaker所具有的知识表征模拟过程能够对此予以示例。Insightmaker是一个基于Web的可视化建模和模拟工具,包含两种通用的建模方法,分别为系统动力的建模和基于代理的建模,具有同样的建模要素和规则[58]。Insightmaker的模拟功能将知识间的关系和变化进行动态展示,超越了停留在静态理解层面上的认知,有助于达到深度学习的发生。
系统动力的建模,关注系统的整体集合。比如水桶漏水,将水视为一个整体,关心的是水的数量,而不是某一滴水。系统动力的建模主要运用四类基本元素,集合/原料(Stocks)、流程(Flows)、变量(Variables)和链接(Links)。Stock是储存原料的集合,例如一个银行账户是一个Stock储存货币。Flow表示Stock中存储的原料的移动,例如从存款到取款的过程,可以看做银行账户中存储的货币的移动。Variable是动态计算值或常量,例如一个银行账户模型中,可以设一个变量表示利率,这个变量既可以是固定的,也可以是随时间而变动的。Links表示不同原料之间的信息传输,如果两个原料链接,那么它们以某种方式相关。如图6和7所示,通过集合/原料、流程、变量和链接对罗亚尔岛上狼和鹿的相互作用进行建模,用真实的数据可视化模拟狼和鹿数量的变化。
图6 系统动力的建模案例—狼和鹿数量关系建模
图7 系统动力的建模案例-狼和鹿数量关系模拟
基于代理的建模,关注集合中的对象。对群体中的个体进行模拟时,我们需要独立的代理来代表人群中的每一个个体,每一个代理都需要一系列的属性来定义它的状态。例如,当对一个捕食模型进行建模时,追捕者应当设置“饥饿”和“饱食”两个状态,当捕食者状态为“饥饿”时找寻猎物,当状态为“饱食”时保持静止,如图8所示。基于代理的建模支持两种空间结构,分别为地理结构和网络结构。地理结构即通过给定每一个代理x,y坐标,代理间的互动基于坐标进行移动。网络结构表示代理与代理间的关联,代理间的互相关联会影响到它们的行为。如图8和9所示,这是一个果园。消费者围绕果园寻找果树,当他们发现了肥沃的果树,他们消灭掉所有的水果,即转换为不肥沃的果树。然而,随着时间的推移,不肥沃的果树渐渐长出新鲜的水果,又成为肥沃的果树。
图8 基于代理的建模案例—果园采摘与生长模型建模
图9 基于代理的建模案例—果园采摘与生长模型模拟
以上即为研究团队正在努力开发的语义图示工具。Novak曾在一次访谈中说过,学习新知识的方式有两种:一是机械学习,学习者将概念与命题隔离开;二是意义学习,学习者积极将已有概念与命题相结合,并对已有知识进行组织。然而,机械学习无法使得知识被长时记忆,只有意义学习可以应用在解决新问题的情境中,促进以后的相关学习[59]。语义图示工具设计的目的就是促进意义学习的发生,与以往概念图、思维导图不同,学习者通过语义图示工具建立知识模型,实现思维方式的可视化;借助工具的语义推荐和比对,实现对学习过程的支持辅助;运用系统动态模拟仿真,实现真实场景的模拟,提高学习环境的情境性和沉浸性。学习的发生正在从外部环境设计向内在认知过程和思维水平的培养进行过渡。
想要弄清楚深层学习“黑箱”的内部过程,需要借助技术手段,更多地关注学习者的内在学习过程,促进有意义学习的发生,使得超越碎片化成为现实。虽然新技术的发展,有利有弊,为教育带来更多可能性的同时,也带来了教育的困扰。但本研究在探究不同类型技术的过程中,剔除冗杂信息,旨在实现促进深层学习的功能,达到深层学习的教育价值,同时,处理好技术和教学的融合关系,更好地引发学习者深度学习的发生。
正如Berliner(2002)所说,教育是最难的科学,它和人相关;但同时也是最朴实的,其最终目的是为了促进人的发展。这也正是本研究团队的立足所在,关注教育,发展教育,期待技术不断地推动教育的发展[60]。
[1]Google.Our Mobile Planet:China [EB/OL].https://think.withgoogle.com/mobileplanet/zh-cn/,2014-12-31.
[2]Meeker M,Wu L.KPCB Internet Trends 2013[EB/OL].http://www.docin.com/p-659833489.html,2014-12-31.
[3]Flurry.Apps Solidify Leadership Six Years into the Mobile Revolution[EB/OL].http://www.flurry.com/bid/109749/Apps-Solidify-Leadership-Six-Years-into-the-Mobile-Revolution#.VIwA6_mUdvs,2014-12-31.
[4]“第十一次全国国民阅读调查”成果发布[EB/OL].www.chuban.cc,2014-12-31.
[5]杨松芳.解析“读图时代”[J].沈阳师范大学学报(社会科学版),2006,30(3):49-51.
[6]Gagne E D,Yekovich C W,Yekovich F R.The cognitive psychology of school learning [M].New York:HarperCollins College Publishers,1993.
[7]王佑镁.国内外数字化阅读发展及阅读服务创新研究[J].中国信息界,2012,(12):42-43.
[8]王佑镁.数字化阅读对未成年人认知发展的影响研究[J].中国电化教育,2013,(11):6-11.
[9]潘双林.网络阅读深度化的实践探索[J].中国电化教育,2012 ,(4):110-112.
[10]李晓源.论网络环境中的“碎片化”阅读[J].情报资料工作,2011,(6):84-87.
[11]顾小清,权国龙.以语义图示实现可视化知识表征与建模的研究综述[J].电化教育研究,2014,(5):45-52.
[12]Turing A M.Computing machinery and intelligence [J].Mind,1950,(49):433-460.
[13]Bengio Y.Learning deep architectures for AI [J].Foundations and trends®in Machine Learning,2009,2(1):1-127.
[14]Bengio Y,Courville A,Vincent P.Representation learning:A review and new perspectives [J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2013,35(8):1798-1828.
[15]Mitchell T M.Does machine learning really work? [J].AI magazine,1997,18(3):11-20.
[16]Alpaydin,Ethem.Introduction to machine learning [M].Cambridge:MIT press,2004.
[17]Langley P.Elements of machine learning [M].San Francisco:Morgan Kaufmann,1996.
[18][21]Deng L,Li J,Huang J T,et al.Recent advances in deep learning for speech research at Microsoft [A].Rabab Ward.2013 IEEE International Conference on Acoustics,Speech,and Signal Processing[C].Vancouver:IEEE,2013.8604-8608.
[19]Marcus G.Is“Deep Learning”a Revolution in Artificial Intelligence?[EB/OL].http://www.newyorker.com/news/news-desk/is-deeplearning-a-revolution-in-artificial-intelligence,2014-12-31.
[20]Bengio Y.Deep learning of representations:Looking forward[A].Adrian-Horia Dediu.Statistical Language and Speech Processing[C].Berlin,Heidelberg:Springer Berlin Heidelberg,2013.1-37.
[22][24]Jones N.THE LEARNING MACHINES[J].NATURE,2014,(505):146-148.
[23]Hinton G E.Learning multiple layers of representation [J].Trends in cognitive sciences,2007,11(10):428-434.
[25]Scientists see promise in deep-learning programs[EB/OL].http://www.nytimes.com/2012/11/24/science/scientists-see-advances-in-deeplearning-a-part-of-artificial-intelligence.html?pagewanted=all&_r=0,2012-11-23.
[26]Facebook’s DeepFace software recognizes faces as well as humans do[EB/OL].http://www.nydailynews.com/life-style/facebook-hightech-deepface-article-1.1728372,2014-12-31.
[27]Houghton W.Engineering subject centre guide:Learning and teaching theory for engineering academics [M].Loughborough:Higher Education Academy Engineering Subject Centre,2004.
[28]Lublin J.Deep,surface and strategic approaches to learning [R].Dublin:Centre for Teaching and Learning,2003.
[29][36][40][44]R.Keith.Sayyer.The Cambridge handbook of the learning sciences [M].New York:Cambridge University Press,2006.
[30]Marton F,Säljö R.On Qualitative Differences in Learning:I—Outcome and process*[J].British journal of educational psychology,1976,46(1):4-11.
[31]Biggs J B.Student approaches to learning and studying [M].Melbourne:Australian Council for Educational Research,1987.
[32]Pask,G.Third Progress Report on SSRC Programme HR2708[R].Richmond:System Research Ltd,1977.
[33]Mette Huberman,Catherine Bitter,Jennifer Anthony,Jennifer O’Day.The Shape of Deeper Learning:Strategies,Structures,and Cultures in Deeper Learning Network High Schools[R].Washington:American Institutes for Research,2014.
[34]Catherine Bitter,James Taylor,Kristina L.Zeiser,Jordan Rickles.Providing Opportunities for Deeper Learning[R].Washington:American Institutes for Research,2014.
[35]Kristina L.Zeiser,James Taylor,Jordan Rickles,Michael S.Garet,Michael Segeritz.Evidence of Deeper Learning Outcomes[R].Washington:American Institutes for Research,2014.
[37]Liao S H.Expert system methodologies and applications—a decade review from 1995 to 2004[J].Expert systems with applications,2005,28(1):93-103.
[38]毕学工,杭迎秋,李昕等.专家系统综述[J].教育技术导刊,2009,7(12):7-9.
[39]Hayes-Roth F,Waterman D A,Lenat D B.Building expert system[J].Addison-Wesley Pub,1983,(1):405-420.
[41]Kintsch W,Van Dijk T A.Toward a model of text comprehension and production [J].Psychological review,1978,85(5):363.
[42]Blanco E,Cankaya H C,Moldovan D.Composition of semantic relations:Model and applications[A].Aravind K.Joshi.COLING '10 Proceedings of the 23rd International Conference on Computational Linguistics:Posters[C].Stroudsburg:Association for Computational Linguistics,2010.72-80.
[43]牟冬梅,陈倩,王丽伟.基于语义模型的数字图书馆知识组织信息抽取策略[J].图书情报工作,2009,53(15):21-25.
[45][54][56][57]Novak J D,Cañas A J.Building on new constructivist ideas and CmapTools to create a new model for education[A].Jaime Sanchez Ilabaca.IX Taller Internacional de Software Educativo TISE 2004[C].Santiago:Universidad de Chile.2004.
[46][49][50][51]Miller G A,Beckwith R,Fellbaum C,et al.Introduction to wordnet:An on-line lexical database*[J].International journal of lexicography,1990,3(4):235-244.
[47]姚天顺,张俐,高竹.WordNet 综述[J].语言文字应用,2004 (1):27-32.
[48]Miller G A.Dictionaries in the Mind [J].Language and Cognitive Processes,1986,1(3):171-185.
[52]WordNet Relations [EB/OL].http://wordnet.princeton.edu/wordnet/,2014-12-31.
[53]Cañas A J,Hill G,Carff R,et al.CmapTools:A knowledge modeling and sharing environment [A].Alberto J Canñas.Concept maps:Theory,methodology,technology.Proceedings of the first international conference on concept mapping [C].Pamplona:Direccion de Publicaciones de la Universidad Publica de Navarra,2004.125-133.
[55]Novak,J.D.A Theory of Education [M].NY:Cornell University Press,1977.
[58]Fortmann-Roe S.Insight Maker:A general-purpose tool for webbased modeling & simulation [J].Simulation Modelling Practice and Theory,2014,(47):28-45.
[59]希建华,赵国庆.“概念图”解读:背景,理论,实践及发展——访教育心理学国际著名专家约瑟夫· D· 诺瓦卡教授[J].开放教育研究,2006,12(1):4-8.
[60]Berliner D C.Comment:Educational research:The hardest science of all [J].Educational researcher,2002,31(8):18-20.
顾小清:博士,教授,研究方向为教育信息化理论与实践、CSCL、学习技术系统用户行为研究(xqgu@ses.ecnu.edu.cn)。
冯园园:在读硕士,研究方向为知识可视化表征(irisfeng11@gmail.com)。
胡思畅:在读硕士,研究方向为知识可视化表征(cc_fairy@hotmail.com)。
2015年1月12日
责任编辑:李馨 赵云建
Go beyond the Fragmentation:Semantic Diagram and Deep Learning
Gu Xiaoqing,Feng Yuanyuan,Hu Sichang
(Department of Education Information Technology,East China Normal University,Shanghai 200062)
Wide use of technology in education enables the convenient access to much richer information,while on the other hand,produce the so called phenomenon of“fragmented learning”,when the learners frequently engage in multi-task and pick up fragmented information,among which visual are always preferred.This phenomenon resulted in shallow learning is the problem that this paper tried to focused on.A“semantic diagram”model was proposed in this study as a way to help learners achieve deep learning,which can provide learners with a systematic and comprehensive learning support,to integrate the fragmented knowledge into a systematic knowledge base.This paper reviewed the development of deep learning in the field of machine learning and education at fi rst; then introduce the design of the semantic diagram tools based on the arti fi cial intelligence technology,using expert system as a back-end support to visualize semantic modeling,semantic recommendation and dynamic simulation,in order to help learners make decision and solve problems.At last,this paper listed three semantic tools as examples to represent core functions and illustrate how it works to help resolve the issue of learning fragmentation.
Fragmented learning; Semantic Diagram; Deep Learning; Machine Learning
G434
A
1006—9860(2015)03—0039—10