计算机辅助汉字测评的现状与发展

2013-01-31 00:26熊玉珍彭德权
中国考试 2013年9期
关键词:笔顺汉语书写

熊玉珍 彭德权

汉字是汉语和中华文化的重要载体。汉字是形、音、义的统一体,有其独特的规律,在汉语教学中有着重要的地位,特别在汉语作为外语教学中,汉字教学是一个“老、大、难”的问题,也正因为如此,汉字测评的信息反馈作用,对教师和学生了解汉字教学和学习过程中的障碍和不足,提高汉字教学的效果有着极其重大的意义。但传统的汉字测评存在着许多局限性,测评反馈的质与量取决于任课教师,测评开展效率低,且由于时间空间的限制,不是每个学生都能获得及时而又充分的反馈。随着信息技术的发展,人工智能、人机交互、自然语言理解,特别是汉字识别和汉字输入等技术的成熟,计算机辅助汉字测评成为解决这一困境的有效方法。面向新形势下国际汉语教学的需求驱动,在现阶段的信息技术成果中的数字出版技术的支撑下,汉字测评面临新的机遇和发展。

1 计算机辅助汉字测评概述

汉字测评有两个方面的内容,一是汉字知识层面,即汉字的形体、读音、意义和用法;二是汉字的书写技能,包括汉字的书写规范、汉字的笔顺和笔画规范等。在汉语作为外语教学领域,汉字测评目的和作用在于通过提供相应诊断反馈信息,来提高学生的汉字应用和书写水平。

计算机辅助测评(Computer Assisted Assessment,CAA)是指将计算机和信息技术应用于测量和评价学习者的知识、技能和能力的过程,包括基于计算机的测试和计算机辅助评价两个部分(何克抗,许骏,2005)[1]。计算机辅助汉字测评是通过计算机技术、自然语言理解技术对被试者的汉字应用水平和书写能力进行自动化测试与评价,并提供相应的反馈信息。随着科技的发展,在计算机汉字处理领域,汉字输入(包括汉字编码输入,印刷体识别输入,手写体识别输入和整句输入)、汉字标准字符集和汉字激光照排等科技成果的涌现,为汉字应用水平和书写的测评和诊断奠定了基础。

计算机辅助汉字测评与传统的汉字测评相比存在以下优点:①评阅的速度。传统汉字测评的批阅需要耗费教师大量的精力和时间,而计算机自动阅卷是快而准确,节省了大量的人力物力。②反馈的时间。学习者在进行汉字练习或测试时,只要输入数据即能获得系统的反馈,即时知道正误和掌握情况。③反馈的质量。传统汉字测评的反馈质量依赖于教师的水平,而计算机辅助汉字测评系统内置反馈系统,每个学习者能获得同样标准的反馈。④过程的监控。人们意识到测评过程中的非项目因素影响着测评结果,计算机可以很好地跟踪整个测评过程,收集测评数据,如被试者测试的时间,做题的顺序和次数等,将这些因素纳入评价的依据,提高测评的效度。因此,计算机辅助汉字测评是提高汉字测评效率和质量的有效方法,下面从技术、标准和应用三个方面对计算机辅助汉字测评的现状进行梳理。

2 计算机辅助汉字测评的现状

2.1 计算机辅助汉字测评的关键技术——汉字识别与输入技术

汉字的识别是中文信息处理和汉语人机交互的基础,也是数字化汉字测评的基础。实现汉字测评的自动化必须实现对汉字的准确识别。

汉字识别可分为印刷体汉字识别和手写体汉字识别,汉字手写体识别又可分为联机手写体识别和脱机手写体识别。联机手写体识别指的是用户在数字化输入装置书写的同时,计算机即时处理笔顺、笔画信息判断用户输入的汉字,而脱机手写体识别是指识别已经书写好、成型的手写汉字。在20世纪90年代以来,印刷体汉字的识别的研究已经进入了应用阶段,市场上已经有许多实用度高、成熟的产品,如汉王笔、蒙恬第一笔和巨人中文手写系统等产品(金连文,1996)[2]。但对于数字化汉字测评领域来说,手写体汉字识别的研究更为重要。

手写体汉字识别分为联机和脱机汉字识别。就目前的研究来说,脱机手写体汉字识别(包括规范和不规范的汉字)的不同方法在试验中可达到95%以上的识别率,但真正的手写文档情况复杂多样,脱机手写体汉字识别技术仍处在实验时期,成熟的商业产品仍未推出市场(赵继印等,2010)。[3]而联机手写体汉字识别因为能获取书写时的笔顺、笔向、点的坐标和书写压力等动态信息,识别率要远大于脱机手写体汉字识别。联机手写体汉字识别的传统方法有三种:统计决策法、结构分析法和结构统计相结合的识别方法(丁晓,青2002)。[4]统计决策法是从汉字的整体形体来识别汉字,强调提取汉字的整体性特征;结构分析法则强调汉字结构的分解,通过将汉字分解为笔画、笔段或字段等部分来实现汉字的识别。目前联机手写体汉字识别的识别率已经达到98%左右,大陆与台湾先后推出多款产品,包括“汉王笔”、手写之星、台湾的“蒙恬中国笔”等。联机手写体识别技术应用范围十分广泛,除了传统的手写笔之外,在移动终端(包括智能手机、平板电脑、学习机等)有着良好的发展前景。在流行的汉字输入法和社交聊天软件中(如QQ、微信)中,均内置了手写输入模块。

可以说,联机手写体汉字识别技术和自然手写输入技术已经进入了成熟的阶段,为计算机辅助汉字测评提供了技术上的支持。

2.2 汉字测评标准的研究

上文提到,汉字测评有汉字知识层面和汉字书写技能两方面的内容,包括汉字的形体、读音、意义和用法与汉字的书写规范、汉字笔顺和笔画规范等。同样,汉字的测评也有相应的不同标准。

2.2.1 汉字知识测评标准

汉字是形、音、义的统一体,掌握汉字就需要掌握其形体、读音、意义和其具体的用法,汉语作为外语教学中的汉字教学并没有明确的教学和测评标准。在汉语母语教学中,国家有关部门组织制定了《汉字应用水平等级及测试大纲》[5],为“汉字应用水平”做了以下界定,“人在阅读、书面表达以及其他与汉字应用有关的活动中,掌握汉字形、音、义以及使用汉字的正确程度和准确程度”[6],明确了汉字应用水平测评的内容,力图建立了汉字知识测评的标准。该大纲是目前唯一一份由国家权威机构发布的汉字应用水平标准,虽然其测试对象一般是针对具有中等以上受教育程度的本国人群,但对于汉语作为外语教学的汉字测评具有重要的参考价值。

2.2.2 汉字书写技能标准

汉字书写是中国人的基本素养,随着计算机的普及,在生活工作中很多场合用电脑打字逐渐代替了手写汉字,不少人经常会出现“提笔忘字”的现象。在汉语作为外语教学领域,留学生的汉字书写情况不容乐观,不少留学生甚至有“书写恐惧症”,只能说不能写的情况普遍存在。但是截止到目前为止,汉字书写规范尚未有统一的标准,教育部有关部门正在制定《中小学生规范汉字书写等级和考核办法》,从汉字的书写规范、笔顺和笔画等方面来考查中小学生汉字的书写水平。但这对于目前汉语作为外语教学的现状来说,该考核标准较难直接运用到汉语的汉字书写测评上。

从汉字测评标准的研究现状上看,汉字测评问题已经引起了教育部和国家语言文字工作委员会的重视,并从国家标准的高度去进行规范,汉字教学与测评在汉语的地位是毋庸置疑的,但在汉语作为外语教学的领域中,汉字测评标准的制定仍有待于深入研究。

2.3 计算机辅助汉字测评的应用

2.3.1 汉字知识层面测评

对汉字应用水平的测评通常通过学习者对汉字的形、音、义三个要素的掌握情况来进行判定诊断。汉字应用水平测试(HZC)①汉字应用水平测试的部分测试内容也包括了汉字书写技能。考虑了汉字的字量、汉字属性(形、音、义)和汉字应用实践三者作为测评内容的优缺点,最后从使用者的角度出发,综合汉字形、音、义三要素,将学习者对汉字的认读、书写、辨误和选用能力作为汉字应用能力的体现,从而从汉字书写、字形辨误、字音认读、汉字选用和字义分辨五部分来考查学习者的汉字应用水平。

在汉语作为外语教学领域,汉字应用水平测试没有作为标准化的测试出现,更多的是汉字课教师的自编测验,对汉字测试题目的信度和效度也没进行过多的研究。在计算机辅助汉字应用水平测试的应用状况来看,目前做得比较多的工作是将传统的汉字测试题目转移到计算机上进行。笔者参与制作的《中文》[7]教材配套多媒体光盘设置了相关汉字练习模块其中包括读音练习、部件练习、组词练习和选字填空等练习模块。该系统提供了简单的测评功能,提供了正误反馈,这种即时的反馈能够解决缺乏有效师生交互的不足,让学生得到准确而又及时的信息,有利于学习者学习,但该系统也存在明显不足,反馈的信息量过小。学习者希望了解的不仅是自己的选择正确与否,而且更希望了解背后深层次的原因和进一步的学习策略的推荐和学习资源的推送。而目前的练习测评系统大部分没有做到这一点,这需要汉字教学领域的专家做进一步的研究。

2.3.2 汉字书写技能测评

汉字的书写规范一般包括笔顺、笔画和结构的规范。在笔画的规范方面,更多关注的是笔向,即书写笔画运笔的方向,在其他方面未多加强调,下文从汉字的笔顺规范性和结构规范性两方面进行评述。

2.3.2.1 笔顺规范性测评

笔顺是汉字笔画的书写顺序,笔顺的正确与否关系到汉字字形的好坏和汉字书写的速度。②国家语委和中华人民共和国新闻出版署在1997年发布的《现代汉语通用字笔顺规范》对7000多个汉字的笔顺进行了规范。

在传统的汉字笔顺测评中,学生对汉字的书写动态过程通过静态的方式呈现出来,或者教师会设计相关的笔顺题目来诊断学生的笔顺掌握情况。在认知的层面上来说,未成字或部件的部分对学生来说没有多大的意义,把整个动态过程分解开来成静态的呈现会打断学生的书写过程;另外,传统笔顺测评在一般的情况下,授课老师很难对每个学生提供即时反馈。

笔顺学习在汉字教学中占据很重要的地位。计算机识别汉字笔画输入的实现途径一般有两个,一种是汉字笔画编码输入,给每种汉字笔画进行计算机编码,然后设计成软键盘或简易键盘输入法(将键盘的键定义成笔画编码),通过鼠标或键盘输入笔画。王素坤,赵希武(2010)[8]采用的就是这种方法。这种方法简单易行,但是这种编码输入方法的练习效果远远比不上自然书写。第二种方法是联机手写体识别,这种汉字识别方法在上文已经提到,用户在数字化输入装置书写,计算机自动进行比对判定。第二种方法让用户自然书写,其效果要优于笔画编码输入,也是未来的笔顺测评应该应用的技术。

在现有的数字化汉字笔顺练习和测评系统中,反馈部分做得还不够完善,计算机一般只给出正误诊断信息,而没有进一步的信息或学习策略的反馈。余海涛(2010)[9]设计的汉字笔顺书写系统会通过话语或模拟表情对正确的学生进行奖励,对笔顺书写错误的学生进行鼓励,这样的正误反馈信息不能完全满足学生的学习需要。以泰国学生为例,泰文的书写顺序是从下到上,泰国学生书写汉字也常常如此,如果系统可以给学生提示汉字的笔顺规则是从上到下,那对学生学习的帮助会大于只告诉他笔顺出错。

2.3.2.2 结构规范性测评

汉字从外形上看,呈方块状,汉字的部件在汉字当中都有确切的位置,不能随意改变部件的大小和位置(左右、高低)。目前,国家尚未公布统一的汉字书写标准,汉字结构规范也没有统一的标准。计算机辅助汉字结构规范性测评的方法有“田”字格约束的通用书法评价方法,具体可参考Chin-Chuan Han等[10]的研究。另外,祁亨年[11]等在2008年提出了一种无大小约束的汉字书写结构评测方法,他们先从书写轨迹的四个边界点确定约束框,再根据匀称性、对称性和紧凑性三个规范性考查标准对被测的手写字和标准模板字进行测评,然后根据手写字与模板字指标差异的大小通过支持向量机(Support Vector Machine,简称SVM)分类评级最终确定手写字的规范等级。

汉字书写测评对汉字学习,特别对汉字书写有很好的辅助作用,学习者书写汉字的时候迫切希望知道自己所书写的汉字是否规范、美观,即时、准确的反馈对学习者的心理和学习效果有很大的促进作用,汉字书写测评系统有着良好的应用前景。不过书写测评系统尚未得到大规模的应用推广,目前很难见到有高质量的汉字书写测评系统供汉语学习者使用。

3 计算机辅助汉字测评的发展

从以上的现状可以看出,目前的计算机辅助汉字测评存在着很多不足:①汉字测评的研究基础薄弱。汉语作为外语教学的汉字教学与测评远滞后于词汇、语法等方面的研究[12]。从目前存在的汉字测评标准可以知道,二语教学领域中的汉字测评没有统一、权威的标准。即使在汉语作为母语教学中,汉字知识测评的标准建立时间不长,其科学性仍待验证;而汉字书写标准仍在制定当中,至今尚未对外公布。汉字知识的测评内容也没有统一的认识。汉字测评的研究制约了计算机辅助汉字测评的发展。②计算机辅助汉字测评的应用层次不高。计算机辅助汉字测评的应用主要集中在自动评阅上,如汉字应用水平(HZC)等级测试实现了计算机自动评阅,但计算辅助测评的反馈功能、自动纠错和过程监控功能却没有完全得以应用,在目前存在汉字书写或知识测评系统中反馈功能均不够完善。针对存在的不足,计算机辅助汉字测评应在以下几个方面加强:

3.1 引入“学习分析”技术,提高汉字测评的准确性和科学性

“学习分析”指的是利用数据发掘、解释、建模等技术搜集学生的学习数据来分析和评价学生的学习进度,查找存在的问题,并预测其未来的表现。通过“学习分析”技术可以更好地理解学生的需求,从而更好地为学生服务。“学习分析”发掘的数据可以为测评提供更加准确和科学的依据,弥补测评过于依赖题目的不足,同时测评所获取的数据可以为“学习分析”提供更多的信息,使全面评估学生成为可能。

3.2 加强汉字测评的过程性监控

汉字测评的过程性监控包括两个方面,一是测试过程中的监控。从目前汉字的测评系统来看,对过程的监控几乎为零,在测试过程中一些非题目的因素影响着测评结果,如被试者测试的时间,做题的先后,对答案的改动等,将这些数据纳入评价的依据,能有效地提高测评的效度;过程性监控的第二方面是对测试结果的保存和记录。汉字学习不是一蹴而就的,而是连续的发展体,一端是对汉字知识与书写的一概不知,另一端是对汉字的完全掌握,而中间一段就是汉字学习的习得过程。同样,汉字测评不应该是静止、终结的,汉字测评系统应该记录着学习者汉字测评的每一次结果,保存学习者的测试档案,为教师与学生展示一系列测评的动态过程。

3.3 提高汉字测评反馈的质量

从计算机辅助汉字测评的反馈质量的现状上看,目前汉字测评仅仅做到正误反馈,处于“弱反馈”阶段,测评尚未完全发挥其推动教与学的作用。因此,我们要从反馈内容和反馈的呈现方式两个方面提高反馈的质量。计算机辅助汉字测评的反馈内容要深挖题目与汉字知识、书写的联系,学生做错了题目或者书写不规范,计算机需要告诉学生之所以做错或者书写得不规范,是因为哪一部分的汉字知识的掌握有缺漏,哪里需要进一步的提高,这样才能帮助学生更好的学习。在反馈的呈现方式上,现在已经做到了利用声音或者图像等多媒体方式提示学生答题的正误情况,这一点比传统的汉字测评提高了不少,但我们应该调动多媒体技术的潜能,做到多维度的反馈。例如,输出图像、声音、图表等生动形象、有利于调动学生情绪的多媒体方式给学生,输出图表、结构图和相关数据分析等有利于教师把握学生学习情况的多媒体形式给教师等。

3.4 应用个性化推荐技术

当今教育理论和实践越来越强调个性化教育,鼓励差异化教学,因材施教。从用户的角度来看,不同的学习者有不同的情况,需要不同的学习材料,不同的学习方法和不同的学习内容,“千篇一律”的内容难以满足不同学习者的需求,时代呼唤个性化的教育。而实现个性化教育的前提条件在于了解学习者的学习水平和需求,而测评则是满足这一条件的关键。测试的结果应该与数字化汉字教学资源“链接”在一起,通过测评了解学习者存在的不足和障碍,通过个性化推荐技术,在海量的数字化汉字教学资源中找到与其匹配的学习资源和教学资源,给学习者推送适合其程度的学习资源和学习策略,给教师推荐合适的教学资源和教学策略,从而实现对海量数字化汉字资源的高效利用。

3.5 开发在云环境中支持多终端的计算机辅助汉字测评平台

在移动技术日益发展的情况下,移动设备,包括平板电脑、智能手机和学习机等的流行,移动学习成为众多汉语学习者的学习需求,仅能在计算机上运行的计算机辅助汉字测评系统已经无法满足学习者的学习需要。移动汉字测评系统能让学习者“随时”、“随地”、“随身”看到自己的汉字应用和书写水平,了解自己的不足和需要提高的地方,提高学习者学习汉字的效率,支持多平台的汉字测评系统具有良好的应用前景和市场需求,是计算机辅助汉字测评的发展方向。

最后,计算机辅助汉字测评也应该关注和深化汉字测评的本体研究。本体研究和技术应用是一对共生体,本体的研究为技术应用打好基础;技术应用则能更好地推广和服务于本体研究。我们需要从以下方面深化汉字测评的研究:一是建立汉语作为外语教学中汉字测评的标准。汉字测评,包括知识层面和书写层面的测评,都没有权威而又完善的标准。目前开展的汉字测评依据的是施测者的经验,带有较高的主观性,这大大制约了汉字教学和汉字测评,包括计算机辅助汉字测评的发展,而计算机辅助汉字测评与传统汉字测评又不尽相同,建立和制定符合计算机辅助汉字测评的标准和方法,是完善和发展计算机辅助汉字测评必备条件。二是深化汉字测评内容的研究。在汉语作为外语教学的领域里,汉字测评内容没有清晰的规定,测什么,怎么测没有权威的指导,随意性较大。但汉字学习在汉语学习的重要地位是毋庸置疑的,汉字测评对汉字学习的促进作用也是肯定的,完善和确认汉字测评的内容是促进计算机辅助汉字测评的当务之急。

[1]何克抗,许骏.计算机辅助测评(CAA)研究新进展—技能性非客观题的自动测评[J].开放教育研究,2005(2):78-83.

[2]金连文.手写体汉字识别的研究[D].华南理工大学,1996.

[3]赵继印,郑蕊蕊,吴宝春,李敏.脱机手写体汉字识别综述[J].电子学报,2010(2):405-414.

[4]丁晓青.汉字识别研究的回顾[J].电子学报,2002(9):1364-1368.

[5]国家语言文字工作委员会.汉字应用水平等级及测试大纲[M].广州:广东教育出版社.2006.

[6]张一清.汉字应用水平等级标准研制报告[J].语言文字应用,2004(1),56-62.

[7]贾益民,主编.中文[Z].广州:暨南大学出版社.1997-1999.

[8]王素坤,赵希武.计算机辅助汉字笔顺书写系统[J].内蒙古师范大学学报(自然科学汉文版),2010(4):428-431.

[9]余海涛.汉字笔顺书写学习系统的设计与实现[D].内蒙古师范大学硕士论文,2010.

[10]Chou CH,Wu CS,Han CC.An Interactive Grading and Learning System for Chinese Calligraphy[J].Machine Vision and Applications,2008(1):43-51.

[11]祁亨年,陈丰农,庄立,陈频.一种无大小约束的汉字书写结构评测方法[J].郑州大学学报(理学版),2008(3):59-62.

[12]李大遂.从汉语的两个特点谈必须切实重视汉字教学[J].北京大学学报,1998(3):128-132.

猜你喜欢
笔顺汉语书写
Unwritten 尚未书写
学汉语
用什么书写呢?
轻轻松松聊汉语 后海
笔顺游戏:用手指描画
离婚起诉书写好之后
这些笔顺,你都写对了吗?
课本内外
最易写错笔顺的字
追剧宅女教汉语