许明月,姜 杰,李 艺,仇宏斌
(南京师范大学 教育科学学院,江苏 南京 210097)
使用触摸屏、手写板等数字设备书写,不仅可以节约纸张,还能通过对采集到的数字信息进行处理,以实现书写质量评测或教学管理。近年来,计算机辅助汉字书写教学取得了较大进步[1-3],开发具有教具功能的汉字书写指导系统,实现汉字书写质量评价成为较多研究工作的重点。
当前的汉字评价系统大多是针对单字评价,如庄崇彪等[4]通过提取笔画与笔画间特征,与训练阶段储存的汉字特征模版进行匹配,来实现汉字书写正误与工整的判断。姜杰等[5]基于特征标记的结构计算方法,实现了硬笔汉字书写质量的智能测评,将评价结果与专家评价比较,结果表明该方法有一定效果。Sun等[6]从汉字平稳性、布白、笔画间距以及部件距离和重叠率四个方面描述汉字的工整。而篇章(多字多行)书写也是真实书写环境中的常见形式,篇章意义上的书写质量有独立的意义,同样有迫切的评价应用需求。笔者查阅国内外文献,虽有在技术细节或局部上的相关工作可以借鉴,但就针对“篇章评价”主题而言,仅找到国内王求真等的一篇论文似乎有这个意图。其中,对笔画关键点、书写大小、书写比例及书写位置等特征进行模糊化分析,可实质上还是对单个字进行的评价。不仅篇章评价的意义不明,且在精准程度上与实际需求相距甚远[7]。
就篇章评价而言,从评价原则上说,前人关于汉字书写中的布白及稳定性等认识,可以作为评价的美学依据。从技术角度而言,篇章书写的自由随意性大,存在粘连、重叠等情况,而这恰恰也是阻碍研究者对篇章精准分行割字的难点。分行割字作为篇章书写质量评价的首要工作,本研究在面向实际应用原则的基础上,集采众长针对性攻关。本文研究工作只针对汉字篇章书写中的篇章意义上的书写质量进行评价,旨在实现对有篇章书写质量训练需求的人群的篇章书写质量进行自动评价并提供指导。本文的技术切入路径是,借助触摸屏等以时序点集方式记录书写径迹的设备,对书写者的汉字书写径迹数据进行收集、计算并实现评价。考虑到实用性普遍性,不限制字体,即对手写正楷、行楷、行书甚至草书皆可进行评价,不再进行单字意义上的正确、工整的精准判断。因为就篇章意义上的质量评价而言,单字评价已非必要。作为阶段性研究工作进展,本研究形成了评价指标体系,实现了评价系统,得到了评价结果。有限测试表明,该评价系统可以初步满足汉字篇章书写质量自动评价的需求。
练习汉字篇章书写的人群通常是对汉字较为熟悉的成年人,这些人都有如何写出整齐美观的篇章作品的需求,其中一批特殊人群如教师或师范生,在当前或未来职业中需要用粉笔在黑板上进行书写,既需要进行单字硬笔汉字书写技能训练,也需要进行篇章意义上的训练。关于汉字篇章之美,有许多认识积累。一般认为,汉字书法以点线为表现元素,在充分运用对立统一、参差变化、均衡调和等美学原理的基础上,通过一定的“章法”来表达和增强书法美感与艺术魅力[8]。传为王羲之的《笔势论》中说,“分间布白,远近宜均,上下得所,自然平稳。”这里既讲到上下之间的相承接,左右的映带,也讲到行距之间空间的分布,一篇的上下得所,和谐统一[9]。傅山认为“一行有一行之天,一字有一字之天”[10],强调每行字轴线须布置在“行”的中轴线上,书写时须注意字与字间、行与行间的布白得当,以字为点,以行为线,使点线之间顾盼呼应。
图1 篇章书写样本
图1是取自大学生的一些典型篇章书写样本。图1(a)文本行向上倾斜较为严重,整体失衡。图1(b)第一行较为平直,但第二行从开头到末尾逐渐与第一行靠拢,间距越来越小。图1(c)第一二行间的间距与二三行之间的间距相差甚远,明显不均匀。图1(d)字与字之间的间距大小不一,且每行字的开头缩进参差不齐。
以此为例,本研究团队采用书法专家(教师)意见归纳与实际实现可能性相互印证的方法来确定评价指标体系。先后访谈专家共5人,并经过三轮关于技术实现可能性的方案修正,初步将篇章书写问题归结为如下六类: (1)行倾斜或弯曲;(2)两行的行间距不稳定;(3)多行间行间距不均匀;(4)字间距不均匀;(5)左侧不对齐;(6)字大小不均匀。
以字的大小为例来说明指标体系的确定过程。访谈专家过程中得知,字的大小不一致是常出现的问题,也会影响篇章的整体直观质量。但是从技术实现上来说,字的大小常因字的结构复杂程度而有所区别,如“一”和“繁”,两者的几何高度明显差距很大,且这种差距的存在是合理的,这种情况导致了对字的大小均匀性进行判断有很高的难度。考虑到研究工作的阶段性及实效性,本文给出的方案暂不考虑字的大小均匀问题,希望下一步找到比较恰当的思路时再予解决。本文研究暂将篇章书写质量评价特征取为行水平、行间距稳定性、行间距均匀性、字间距均匀性和左对齐五种,简单界定如下。
(1) 行水平: 一行字沿水平方向的稳定状态;
(2) 行间距稳定性: 两行字之间的间距稳定状态;
(3) 行间距均匀性: 行与行之间(三行及以上)的间距均匀程度;
(4) 字间距均匀性: 字与字之间的间距均匀程度;
(5) 左对齐: 每行字左侧边缘的对齐程度。
在对一段文本的特征进行描述定义之前,需要对这段文本进行分行、割字处理。考虑到关于实际情况的针对性,亦作为阶段性工作,本文讨论的汉字书写暂只针对一般横排惯例下的书写,即从左到右逐字书写,每个字中笔画的运笔方向符合国家规范,例如,从上到下、从左到右等,且允许有补笔行为。
(1) 行的识别
“行”是指符合日常书写习惯,沿水平方向排列的一组字。基于触摸屏类设备的联机书写中,可获取书写笔迹的时序点集信息,即笔尖接触屏幕时系统所作的记录,以离散的点的形式存在,每个点含有时间和空间信息。实际上,有许多研究工作中的“计算”思路对本研究提供了很好的启发和借鉴,从技术细节上来说,本研究实质上是在广泛调研国内外相关技术方法的基础上,集采众长会聚到特定应用点上的工作。既有工作虽无直接对“篇章评价”开展,但有基于时序点集书写信息进行行切割的尝试。如Ratzlaff等[11]利用笔迹的时间信息和对行间距的估值,自底向上地尝试将在线笔迹聚类为多行文字。但该方法无法提取不平行的文本行且过度依赖时间信息,也使得错误率直线上升,因此无实用价值。敖翔等[12]以视觉感知理论为基础,采取自底向上的策略建立笔画块的链接模型,搜索行排列结果。该方法可以提取出弯曲文本行,但要求书写笔迹符合常规书写方向,不允许补笔行为,亦与实际需求有差距。本文取集采众长并适当变化的办法来解决问题。在行判断上,即是通过判断每行字的初始笔画、当前笔画、前一笔画之间的位置关系来判断是否换行。用startStroke表示一行的初始笔画的点集合,startPoint坐标为(Min(XstartStroke),Min(YstartStroke));用curStroke表示当前笔画的点集合,curPoint坐标为(Min(XcurStroke),Min(YcurStroke));用preStroke表示前一笔画点集合,prePoint坐标为(Max(XpreStroke),Min(YpreStroke));H表示当前所有笔画的最高高度。
当这三个笔画满足如下条件之一:
条件一
curPoint.X≤startPoint.X ANDSP_length≤CP_length AND(Min(XpreStroke)-Max(XcurStroke))>H AND(Min(XpreStroke)-Max(XstartStroke))>H 条件二 startPoint.X ANDSC_length AND(Min(XpreStroke)-Max(XstartStroke))>H 则认为当前笔画换行,如图2所示。 图2 分行判断条件 通常书写习惯中,会出现由于书写失误而进行补笔的行为。例如,在已完成的一行中添加标点、笔画或字符,都会对上述判断结果产生干扰。因此,必须增加补笔判断。方法为: 若当前笔画的几何中心在当前行的文本行框中或在文本行框的延长框中,即认为没有换行,把当前笔画归为该行,如图3所示。 图3 补笔判断条件 汉字笔画间的关系类型众多,每个人的书写习惯又有不同,书写结果往往非常复杂,单单考虑如上分行判断和补笔判断,还是不能够完全准确分行。因此增加附加判断: 在以上行判断结果的基础上,对于满足如下条件的文本行进行合并。即文本行a和文本行b在Y轴方向是包含与被包含的关系,或者Y轴重叠率大于2/3,便认为实际上是同一行。如图4所示。 图4 文本行合并条件 最后的分行效果如图5所示。其中穿过每一分行框里接近字重心的一条线,在本文称为行轴线,根据行轴线可看出一行字的走势和水平程度,下文中会介绍行轴线的计算生成。 图5 分行结果 (2) 字的分割 “字”是指字符,包括汉字、符号等。根据人的理解习惯,应该是先字后行。但考虑到计算实现的方便性,在本方案中,先进行行的计算,再在行的基础上,对行中的字进行分割。字的分割计算过程如图6所示。首先,对分行结果每一行字的原始笔迹信息点集单独进行骨架复现,如此可以保证每行字在分割时不受行粘连影响。随后借鉴了周正等[13]的基于笔画连通域和字符投影的手写汉字分割算法,以笔画连通域为单元进行处理,避免了对汉字进行笔画的提取与分析,步骤简单且计算量小,适用于嵌入式环境,本文不再赘述细节。 图6 割字技术路线 图7 割字效果 汉字分割结果如图7所示,第二行的“开”与第三行的“雪”存在粘连,但通过骨架复现方法可以将其分开。在实验测试阶段,发现因书写随意性大、汉字结构复杂等,分割时容易产生过分、欠分等情况,在后续描述定义字间距均匀性特征时会对此状况采取一定的对策。 在识别出“行”与“字”之后,便可以对行水平、行间距稳定性、行间距均匀性、字间距均匀性和左对齐这五项特征进行计算意义上的严格描述了,整体如图8所示。 图8 特征说明 在诸特征的描述计算中,行轴线可以作为测量行水平、行间距稳定性、行间距均匀性的辅助工具线。行轴线的计算方法是,先对每行字的笔迹点集作均匀化处理,解决由于运笔快慢而造成的点集不匀问题。再由均匀点集拟合成多项式曲线,得到一条接近字重心的线,即为行轴线。考虑到实际书写中,每行字数会或多或少,而字数的多寡需要不同项数的函数进行拟合,方能得到最平滑且最准确的“行轴线”。又因为本方案中的行轴线的生成是叠进式的,即从最初一、二个字开始,就要不断计算行轴线以为随后的计算提供依据。因此,理论上本研究要求在当前行已输入不同个数的字时,采用不用项数的函数进行拟合。实际上,字数的计算又要待行分割和字分割完成后才能进行,于是陷入了逻辑困境。本方案中,采取了一种等效且简便的方式解决了这个问题,即在一定屏幕面积内,字的大小决定字数,而字数决定拟合项数。因此,采用行高与行长的线度来决定拟合多项式的项数,计量单位是屏幕像素,考虑到实际情况下不同PAD产品的屏幕像素情况并不相同,系统中增加像素情况和屏幕尺寸侦测并在此基础上合理取值即可。 (1) 行水平 (2) 行间距稳定性 行间距稳定性是指上下两行之间距离的稳定程度,检验书写者对行与行之间布白均匀的控制状况。如图8所示,求上下两行的行轴线在X轴方向的交集。将这两行字包含在该交集域中的几何中心作为采样点,对两行的行轴线进行逐字扫描。利用这两行的平均行间距作为衡量的标准,计算出行轴线之间的相对平均距离偏差,作为评价行间距稳定性的依据。计算方法为: 设行间距稳定性特征值为HP,如式(2)所示。 其中,Npi中每个字的几何中心满足如下条件: (3) 行间距均匀性 (4) 字间距均匀性 字间距均匀性是指多个字之间的间距均匀程度,检验书写者对字与字之间的距离控制状况。如图8所示,以相邻两个字的几何中心在X轴上的距离作为字间距,利用平均字间距作为衡量的标准,计算每相邻两字的相对平均字间距偏差,作为评价字间距均匀性的依据。计算方法为: 设字间距均匀性为WB,NW为W中的元素数量,W={w1,w2,…,wi}为i行字的集合,wi为第i行字的集合,L={l1,l2,…,lNW-i}为i行字间距的集合,ln为第n个字与第n+1个字的距离,如式(6)所示。 AND AND (5) 左对齐 其中,WH为平均字的线度,如式(8)所示。 指标评价的思路为大量收集特征指标值的数据。根据各项指标数据的分布范围,确定特征阈值,以百分制计算各项特征的分数。考虑到在现实的篇章书写评价中,一般意义上没有必要打0分。通过征求书法教师的意见,得到的建议是40分起评。因而,本系统主要打分分布在40~100之间,共60分取值幅度。亦可将百分制转换为5级评价,分别为优秀、良好、中等、较差和差,对应的分数范围根据经验建议如表1所示。 表1 评价等级与分数范围对应表 各项指标基于各自特征值进行计算,折算成分数的取值范围也是各自如上60分。从以上各项特征指标的计算思路介绍中可以看出,算得的特征值越低,书写质量越高。特征值越高,书写质量越低。因此,从特征值折算分数时,直接得到的是扣分分数。即在各指标评价中,当某项指标特征值即误差越逼近0时,该项指标下的得分便较高;反之,特征值越大,则该项得分就越低。如图9(a)所示,从第一行到第四行,由最初的倾斜到愈来愈水平,行水平特征值依次递减。单行水平的成绩递增,行水平特征得分取四行成绩的均值。图9(b)第一二行间的行间距稳定性特征值最大,这两行间的行间距稳定性成绩最低;第二三行的特征值较小,成绩较高,最终行间距稳定性的得分取这三个成绩的平均分。 图9 特征指标值 特征值以0为自然底线,对应该项指标为满分,还需要界定特征值的上边界,即对应60分全部扣掉的那个阈值。本研究是通过实验的方法得到特征阈值的,即安排多轮较极端情况的恶意书写,所得每项特征指标的最大值作为其阈值。考虑到实际应用中还可能出现超过该阈值的情况,本方案暂且采取的办法如下: 在0到阈值范围内的特征值,将60分平分给这个范围,超出此范围的在40分底分上再扣分,直到把分数扣至0为止。设特征指标分数为ST,指标值为Tm,指标临界点为PT,评价方法如式(9)所示。 本研究中,作为阶段性工作,希望系统尽快完成并投入实验之中并通过实验所得,反复叠代推进系统优化。为推快落地速度,针对篇章作品综合成绩的生成,本研究采用了较少专家参与的专家赋权法确定以上五项指标的分配权重。让3位书法专家根据经验,以1—5递增的重要程度对五个指标在篇章整体书写质量中的重要性进行打分,打分结果如表2 所示。以3位专家的平均值四舍五入取整作为综合指标评价的权重系数。 设综合指标评价为S综,综合评价结果如式(10)所示,再根据表1划定综合评价等级。 表2 综合评价权重比 测试所用硬件平台为三星10.1寸触摸屏平板,用于模拟纸笔书写;软件是团队基于Android操作系统开发,包含上述评价功能的APP。图10是部分篇章书写评价的测试效果实例。 按照第二节中的方法对图10中的篇章构建书写特征集,得到表3各项特征指标值。 表3 测试篇章特征指标值表 根据前述评价方法对篇章整体书写效果进行评价,表4为图10篇章书写质量的系统评分和专家打分比较,其中专家评分取三位专家打分的平均分。表4表明本系统的评分和专家评分结果基本吻合,特别是图10(d)的打分结果非常接近,效果符合预期。 图10 实验效果图 表4 测试篇章书写评价表 汉字篇章书写是常见的书写形式,也是联机汉字评价领域亟需解决的问题。本文依据章法原则和与专家访谈,总结归纳出行水平、行间距稳定性等5种特征,实现了基于联机的篇章书写特征提取与质量评价。经初步测试表明,本文提出的篇章特征计算评价方法具有一定的有效性、普适性,可以对用户书写的篇章整体效果使用统一标准进行客观分析及实时评价,能够实现指导书写者进行汉字篇章书写练习的目的。2.2 特征描述参数定义及计算
3 评价实现
3.1 指标评价
3.2 综合评价
4 测试效果
5 结束语
——识记“己”“已”“巳”