杜华
【摘要】文字云图是通过文字云图工具制作而成的反映文字频率的可视图的一种形象比喻,可以作为一种有效的文本分析工具应用在教学中。文章梳理了国内外文字云图应用研究现状,指出国内该领域研究的不足。并以英语阅读教学为切入点,从文字云图的可视化表征、生成线索词、语义和表象的双重表征等优势分析了文字云图应用在英语阅读教学中的可行性,以Wordle为例选择高中英语教材中的一节课“Harry Potter”进行了研究设计与实践,研究结果表明文字云图的使用能够调动学生的兴趣,给学生的英语阅读带来积极的促进作用。
【关键词】文本可视化;文字云图;Wordle;英语阅读教学
【中图分类号】G40-057【文献标识码】A【论文编号】1009-8097(2012)09-0065-05
一文本可视化
“可视化”英文为“Visualization”,意为“视觉的”、“形象的”。它作为学科术语最早见于1987年美国国家科学基金会(National Science Foundation,NFS)名为《科学计算可视化》的报告。可视化作为一个专门研究领域与可视化技术的发展紧密相连。一方面,可视化技术使视觉对象从宏观宇宙天体到微观微生物都能得以显现;另一方面,可视化技术的“动态化”、“仿真化”、“虚拟化”不仅让不可视的事物可视化,而且让静态的可视变为动态的可视。
在不断涌现的海量信息中,文本信息是一种最普通、最常用的信息表现形式,利用传统的文本逐句阅读方式耗时费工,已然不能满足人们的需要。文本可视化(TextVisualization),即借助计算机技术将文本信息以图形化、可视化、形象化呈现,有利于人们理解文本内容,提高理解的速度和深度,是信息可视化领域较新的一个研究分支。文本可视化的实质在于针对海量的文本信息,最大程度的实现抽象和概括。其方法主要包括以下三种。
(1)基于词频统计的文本可视化。这种可视化方法通过词频统计发现特定的词频模式如高频词汇、异常词频等,从而分析文本的含义。高频词汇指文本中出现频率较高的词汇,这些高频词汇本身具有相对固定的含义,它们之间的连接关系对于我们分析文本的主旨、探索高频词汇在文本中的用途、寻找词汇间的搭配方式具有重要的意义。WordStat是常用的文本分析系统之一,它使用基于方法的词典进行文本的内容分析和文本挖掘,如D·Dillon、D·Cottree、lJ·Reser等在研究网络热点语境等运用WordStat进行文本分析。
(2)基于聚类算法的文本可视化。文本聚类是处理文本的重要方法之一,它通过将大量信息组织成少数有意义的簇,并保证同一簇内的文本之间是相似的,达到改善检索性能的目的。多应用在信息检索、网页链接关系分析等领域。
(3)基于语义的文本可视化。此法最为复杂,也最难实现。它不仅要发现文本中特定的词频模式,而且还要通过各种技术手段,发现文章中特定的隐含语义关系,并以图形化呈现,帮助我们有效阅读和理解文本内容。
二文字云图工具及其应用研究综述
1、文字云图
文字云图(Word Clouds、Text Clouds)也译为词汇云、词云、文字云、文本云图等,是一种基于词频的文本可视化形式,以颇具美感的图形将其呈现。缘起于标签云图(TagCloud),是目前大众标注网站普遍使用的标签可视化组织和表现方式,其原理逐渐推广应用于展示非标签类型数据,由此产生了数据云图、文本云图、搭配云图等其他类型云图。文字云图是通过文字云图工具制作而成的反映文字频率的可视图的形象比喻,图1给出一个示例,颜色样式都可以调节。文字云图中每个单词的大小取决于其在文本出现的频率,频率越高,在云图中显示越大。单词的重要性通过其字体大小来呈现。它可以直观地反映文本中的文字密度及重要性。
2、文字云图工具Wordle
常用的文字云图工具有Wordle、Tagxedo、Tagul、WordIt Out、Tag Crowd、Wordsiff等。Wordle是最流行的文字云图工具之一,由IBM高级软件工程师Jonathan Feinberg 2008年6月发布。在《数据可视化之美》一书的第三章,JonathanFeinberg详细介绍了Wordle的发明过程、内部工作方式以及在这个过程中从技术和审美角度所做的选择。点击网址http://www.wordle.net即可打开主界面,无需注册和登录免费使用,使用者将文本输入后,很快就能自动制作出具有不同风格样式的文字云图。用户可以设置一些参数值如字体、色彩、所显示的文字最大数目、文字显示的角度比如所有文字垂直、水平、部分垂直或者水平等。
3、文字云图的应用研究综述
文字云图可以作为一种有效的工具对文本内容作出快速的分析和研究,可以应用于各种文本分析和研究中,有助于读者从不同的角度理解文本的内容。近几年关于文字云图的研究并不太多(Cidell,2010:McNaught&Lam,2010;Pendergast,2010;Ramsden&Bate,2008)。Pendergast(2010)使用文字云图对于美国家庭与消费科学学会(AAFCS)发布的公文常用的单词进行分析,并建议在网站上公布的公文之后附上其标签云,以便更多的人理解。Ciden(2010)建议文字云图可以分析描述性数据。她对跨地区的会议录音和报纸上关于“绿色”建筑的文章进行研究,分别运用可视化的文字云图形式与文字频率报告两种形式进行了比较,从而得出运用文字云图有助于分析描述性数据。
国外研究文字云图在教育教学中的应用也不多。Ramsden&Bate分析了文字云图用于教育领域的可能性,他们描述了文字云图如何分析“教师对播客在教育中的应用这一问题的看法。”他们也总结了Wordle的其他应用,也对教师如何使用文字云图如生成器的选择、数据的准备、文字云图的解释等方面给出了一些建议(Ramsden&Bate,2008)。佛罗里达国际大学的Melissa Baralt和乔治城大学的Susan Pennestri与Marie Selvandin等学者运用行动研究法使用Wordle帮助学生提高外语(研究对象的母语为英语,外语为西班牙语)的写作水平,研究过程长达一个学期。研究结论是学生在应用西班牙语写作时会应用丰富的词汇、动词时态和准确的语法,写作水平确实有所提高,而且给教师和学生带来有效、新奇、愉悦的心理体验(Melissa Baralt,SusanPennestri,and Marie Selvandin,2011)。
与国外研究相比,国内这方面研究更少。笔者以“文字云”、“文字云图”为关键词检索了中国期刊全文数据库、中国优秀硕士学位论文全文数据库、中国博士学位论文全文数据库、中国重要会议论文全文数据库、中国重要报纸全文数据库,仅得到与笔者研究相关性极大的一篇文献,黄晓英(2011)的《文字云图在外语电化教学中的应用》,运用wordle进行外语课堂教学设计,分别用Wordle辅助听力教学、辅助阅读教学,“增加了外语课堂教学的活力”。因Wordle不支持中文,极大限制了它在我国教学中的应用范围,在我国大部分学科领域中都无法应用,最能发挥文字云图特长的学科无疑是英语,在英语词汇、阅读、写作、听力教学中有其独特的优越性。鉴于英语教学的复杂性,在本文中只研究英语阅读教学。
三文字云图在英语阅读教学中应用的优势分析
1、可视化表征(Visual Representation)
英语阅读是一个复杂的过程,在阅读过程中,阅读者根据本人大脑中已有的语言知识对阅读材料进行推测,并在阅读中加以证实和修正。英语文本阅读基本上都是采用逐句阅读、联系上下文的方式来进行。而将线性的英语阅读文本转化为文字云图,即是将文本进行可视化表征,“通过可视化组织,它可以形成促进思维发展的引导框架和网络,将解决问题过程中的各种思维结构以各种直观、形象和清晰的结构图示表现出来”。通过对文本进行可视化呈现的方式能够增强我们对文本内容的理解,提高理解的速度和深度。首先,学习者透过视觉表征的外表特征,如颜色、大小、形状、和位置等,将视觉符号及其空间关系具体地在脑中呈现出来。其次,学习者在原有的知识和经验基础上,经过分析综合和判断推理等思维活动后,准确把握感知材料内容,从而准确地把握整篇文章的主旨大意,同时还可以极大地激发阅读兴趣,提高阅读效果。
2、生成线索词(Verbal Clues)
所谓线索词就是能够帮助人们理解的关键的词。线索词对于我们阅读、理解、记忆有着非常重要的作用。文字云图中显示的是一些文字或单词,其出现频率及其重要性程度越高,在云图中显示的字体就越大,且以不同颜色的字显示。这些词即为能帮助学习者理解文本的线索词。通过将阅读文本制作成文字云图,可以生成线索词,促进学生对阅读文本的理解,从而把握文章的主要内容。例如,学生阅读某篇课文,将其制作成文字云图,依据双重编码理论,可以激活言语系统中的言语码,从而将线索词扩展为句、段、篇,进而再现全文大意。
3、语义和表象的双重表征(Dual Representation ofVerbal and Non-verbal symbols)
美国心理学家佩维奥(Paivio,1991)1991年在研究人的认知过程时提出了被认为是“本世纪最有影响力的认知理论之一”(Marks,1997)的双重编码理论。他认为人的认知行为由语义系统和表象系统这两个相互独立又密切联系的符号系统协调,专门负责信息的编码、组织、转换、存储和提取。语义系统即言语编码系统,专门处理语言信息,表象系统即非言语编码系统,专门处理非言语的客体和事件的信息。语义系统是一个按照序列、层级的方式排列的言语码网络,表象系统是以重叠的、嵌套的方式排列的意象码的集合。外部环境中的言语刺激物和非言语刺激物,经过感觉系统的觉察,通过表征加工分别激活言语系统中的言语码和非言语系统中的意象码。语义系统与表象系统之间的活动(言语码与表象码之间的转化)通过参照加工实现。两个系统内部的活动(言语码激活其他的言语码或表象码激活其他的表象码)通过联想加工实现。最后,两个系统中被刺激的言语码或意象码,经过感觉输出系统后,产生言语反应和非言语反应。语义系统与表象系统既紧密联系又相互独立,通过表征加工、参照加工和联想加工这三个加工层次紧密联系在一起。语义表征与意象表征都是知识的表征方式,两者既独立又相互联系,共同存在,互为补充,语义表征是对知识的直接描述,表象表征是对知识描述形象或映像的补充,两种方式可以相互转化并共同作用于人的大脑,构成对知识的双重记忆。
英语阅读是言语码和意象码在三个不同加工层次的激活,即在表征加工中的言语码和意象码的直接激活,在参照加工中的言语码和意象码的交叉激活,在联想加工中的言语码和意象码的扩散激活。在分析单词或段落或文本的涵义的同时在文字云图中将其以图形化显示,这正是给学习者以语义和表象的双重表征,当两个编码系统同时被激活时,可以使学习者对学习内容更有效的加工处理和保持,从而会增强学习效果。在课堂中应用文字云图可以使学习者在文字信息、语言信息、视觉信息之间建立有意义的联系。
四研究设计
前文分析了文字云图在英语阅读教学中的优势,下面结合课堂实践来探讨其具体应用。本研究被试来自商丘市实验中学高一年级五班。该研究选择的学习内容是人民教育出版社高中一年级英语上册Unit 12:Art and Literature。本单元的中心话题是“文学艺术”。本课“Harry Potter”是一篇叙事性的阅读短文,介绍和描述英国著名女作家J.K.罗琳撰写的系列书籍《哈利·波特》的内容及主人公哈利·波特的生活、学习、性格和信念,并启发学生如何面对困难,坚定信念从而最终克服困难。由于本研究在真实课堂环境解决复杂问题,同时将设计原则与技术可行性相结合,提供可能的解决方案,在研究中采用了设计研究范式,对高中英语教学活动进行设计和实施。在研究开始之前,和英语教师就阅读教学的组织形式等问题进行沟通,对文字云图的趣味性及其在英语教学中的有效性达成一致,旨在改善学生阅读能力较差,在阅读中容易产生焦虑情绪的现状。为了保证研究的真实有效性,在研究开始之前,我们对教师和学生进行相应的培训,让他们掌握文字云图的制作使用方法,并熟悉这种教学方式。教室选在多媒体网络教室。
1、“读前”(Pre-reading)部分设计
“读前”活动是一种在实际阅读课文之前的对阅读材料进行预测、猜测的准备活动。预测机制在阅读中有着非常重要的作用,它不仅能帮助学生准确地把握整篇文章的主旨大意,还可以极大地激发阅读兴趣,提高阅读效果。“读前”活动是正式阅读的热身活动,目的是调动学生的阅读积极性,激活相关的言语码和意象码,为正式阅读做好充分的准备。教师应该为学生提供充足的阅读的动因,研究表明,在阅读课堂里,生动有趣的开始对学习有着重大而积极的影响。它可以提高学生的集中注意力、激发好奇心、加强想象力以及激励内驱力。
课文是以某种序列从字母逐一排列成单词、句子和篇章的言语码,我们可以通过将其制作为文字云图的方式将其转化为直观形象的意象码,让学生把课文制作成文字云图的形式。在文字云图中生成的线索词Harry、Magic、World等以最为醒目的方式呈现(如图2所示),学生可以调整自己喜欢的云图样式。依据双重编码理论,言语码通过联想加工可以扩散激活其他的言语码。教师鼓励学生依据文字云图中的线索词来猜测文本的风格和主要内容,通过集体自由讨论,激活与题目相关的其他言语码,让每组同学讨论这些线索词的含义,通过集体自由讨论给出自己的答案。而后,教师向学生展示电影《哈利·波特》的海报,播放电影《哈利·波特与魔法石》的片段,提出问题:Who is the boy wearing glasses?Have you seen the film“Harry Potter”?Do you know who plays the role of Harry Potter?从而激活学生已有的知识和生活体验,为后续的阅读活动做铺垫。学生围绕这些问题开展了谈明星,说电影的热身活动,热烈的讨论营造了活跃的英语课堂氛围,有的学生甚至叫了出来:“I want learn about magic!”实践证明,充分的读前准备大大消除了学生的焦虑、抑制等一些情感障碍,对教学任务的顺利完成起了关键性的作用。文字云图的制作帮助学生把握全文大意,极大程度上把学生的阅读兴趣激发起来,有助于学生发挥想象,激活课堂气氛,检验学生使用英语思维和表达的能力,为后面的阅读活动作了很好的铺垫。
2、“阅读”(While-reading)部分设计
此部分是英语阅读教学过程中的关键步骤,主要是分析文章结构,理解文章内容,对文章结构的分析有助于学生在短时间内尽快了解全文大意以及证实“读前”活动中对文章主旨的预测。首先,随着在“读前”活动结束后,学生相关的意象码和言语码被激活,教师适时向学生提出略读任务,指导学生浏览全文。让学生首先略读课文找出每段的主旨句,并回答问题:Whattype ofwritingisthetext?让学生从整体上把握文章,使学生了解文章的体裁,把握文章的结构,培养学生快速阅读的能力,让他们在有限的时间内读文章,作习题,提高了学习效率。在阅读过程中引导学生关注每个段落的开头和结尾部分。
而后,将每一段都制作成文字云图,结合云图中的线索词,分析每一段的段落大意,教师给予引导、提示、讲解,将文章结构分为四部分。第一段的文字云图中的线索词有Rowling、Books、World、Strang、Magic、Real、Creatures等,主要介绍英国著名女作家J.K.罗琳的《哈利·波特》系列作品描绘的是一个充满了奇异、魔幻的世界,第二段的文字云图线索词Harry、Life等,主要介绍在《哈利·波特》第一部作品中哈利这个无父无母的孩子的悲惨生活。第三段的云图线索词主要有Harry、Learns、Hogwarts、Magic等,本部分主要介绍哈利在霍格沃茨魔法学校的学习生活冒险故事,最后一段的云图中主要有Harry、Different等,主要从情感上进行升华,告诉我们要相信自己、帮助别人、坚持梦想,出身和相貌并不能决定一个人的成长。我们可能来自不同世界,说着不同的语言,具有不同的习惯,但这并不影响我们具有共同的目标、期望、梦想。如图3-图6所示。
通过阅读,学生能了解有关J.K.罗琳的著作《哈利·波特》的发展,了解成功人士背后的艰辛,并能从中学习J.K.罗琳坚持梦想,决不放弃的精神和吃苦耐劳的品质,鼓励学生阅读名著以增长见识,励志奋进。对课文语段的理解、结构的分析以及由浅入深的阅读,也能够培养学生良好的阅读习惯。通过制作文字云图帮助分析文章的组织结构,学生能更好地把握文章中心思想和文章的扩展思路。
3、“读后”(Post-reading)部分设计
本部分指导学生在了解文本的基础上,提出问题Whatdo you think of Harry?What can we leam from Harry?Whatcan we do to make our dreams come true?引导学生进行深层次的思考和分析。指导学生联系自己的生活实际和体验,带着问题展开小组讨论,并进行汇报。这样设计立足文本,并联系学生生活实际进行小组讨论,使学生树立一种坚持梦想的精神和吃苦耐劳的优秀品质。为了扩展学生对内容的理解,可以建议学生阅读此系列书籍,观看此系列的电影。
五数据分析
在课堂观察中,我们看到学生在半个小时内即能熟练使用文字云图工具。一节课结束后,整个课堂充满了积极活跃的气氛,阅读课堂不再是沉闷的代名词,效果非常明显。学生很支持这种新型的英语学习方式,学生始终保持了较好的学习兴趣,明显流露出对进一步学习的期待。不足的是,因为学生阅读基础差,“读前”部分、“略读”部分时间比预想的要长,多少影响了下一环节的教学。
为了解学生对这种上课形式的态度,本研究数据分析部分设计了里克特四点量表(1=非常不同意;2=不同意;3=同意;4=非常同意)。分值越高,表明对此观点的认同度越高。在正式施测之前,进行了信度测试和因素分析,表明量表各维度项目信度较高(α>.70)。量表发放69份,回收69份,回收率为100%,采用Spss 13.0进行数据分析。研究结果(见表1)表明,89.9%的学生认为文字云图工具Wordle的使用较为简单、容易掌握,85.5%的学生表示在使用Wordle时很自信。在使用Wordle进行英语阅读教学的愉悦程度方面,95.6%的学生认为制作文字云图的活动很新颖有趣,90%的学生很享受制作文字云图的活动,88.5%的学生希望参与更多的这种活动。81.2%的学生认为创造力被激发,85.5%的学生更加享受英语学习,86.8%的学生认为英语学习变得更有趣,69.6%的学生认为Wordle使阅读变得更易于理解。在一节课结束后,笔者与教师和学生座谈,分享他们的感受。访谈与量表调查结果是一致的,学生们认为,“Wordle能把课文变成漂亮的图,里面有许多单词可以帮助我理解课文。”“我喜欢使用Wordle,很有趣,今天这节课跟以往的英语课完全不同。”“要是每次英语课都能这样上就好了。”教师也认为,“确实调动了学生上课的积极性。”
六结束语
研究表明,文字云图的使用确实使英语阅读教学更加生动有趣,给学生的英语阅读带来积极的促进作用。但它一方面具有优越性,另一方面也存在很大的局限性。正如Wordle发明者Jonathan Feinberg在《数据可视化之美》一书中提到的那样,“Wordle不是为可视化专家、文本分析专家甚至是有经验的计算机用户而设计的。Wordle视为一种可视化工具更为贴切。”它并不是优秀的信息可视化,也不能算是严格的基于词频统计的文本可视化。单词大小调整较简单,并未考虑单词的长度、字形。文字的颜色并无意义,仅是用来提高单词边界的对比度和增加一些美感。字体倾向于美学和表现力,而不是可读性。本研究读后部分、数据分析部分略显薄弱,我们将在后续研究中进一步加强,并向大家介绍支持中文的文字云图工具Tagxedo在学科教学中的应用。