毛笔书法临帖的计算机评价

2014-03-17 05:53:21邓学雄李京陶
图学学报 2014年6期
关键词:临帖碑帖点画

邓学雄, 李京陶, 李 牧

(华南理工大学设计学院,广东 广州 510006)

毛笔书法临帖的计算机评价

邓学雄, 李京陶, 李 牧

(华南理工大学设计学院,广东 广州 510006)

针对书法初学者学习的特点,基于计算机辅助技术,根据适用于初学者的书法水平评价标准,提出相似度的算法。将初学者的临帖作品通过扫描或拍照后输入计算机,利用计算机图像处理技术进行临帖作品预处理。通过图像骨架、不变矩、灰度投影等方法,对临帖字体的结体特征、点画形态和章法布局的特征进行描述。对临帖字体与原碑帖字体进行相似度计算,实现对书法初学者临帖作品综合评价的辅学系统。

计算机应用;书法教育;毛笔书法;临帖;计算机评价

中国的各种古代艺术门类中,最具标志性,最能集中地、典型地、鲜明地、持续而广泛地表现民族精神和时代精神的艺术,非书法莫属[1]。我国教育部下发的《中小学书法教育指导纲要》文件为书法教育实现提供了有力保障,但当代书法教育在普及过程中仍存在诸多问题如:缺少书法学习氛围、师资力量薄弱,教学资源匮乏以及学生对书法艺术缺乏兴趣等,使得书法教育的发展举步维艰。

参照中国书画等级考试标准(书法类)[2]可知,书法学习的初级阶段,是以模仿能力为主要考核标准的。而书法学习的模仿能力是由学习者的临帖字体与原碑帖字体的相似度决定。其中,“碑”源于古代碑石上的字为书法名家所书,字迹可供后人取法,后人将碑石上的字用薄纸、焦墨捶拓下来再经装裱;而“帖”原是指书法家的墨迹真笔,“碑帖”合为一辞,用来泛指供学习书法取法的范本。“临帖”是指书法练习者将字帖置于案前,观察字的形态、结构、笔划,领会其精神,并下笔仿写。

本研究的目的是实现计算机辅助评价临帖字体与原碑帖字体相似度,给书法初学者提供练习效果的评价,指引其下一步的学习。目前,在汉字笔画特征提取和轮廓回复方面的研究,马小虎等[3]、He和Yan[4]、陈睿等[5]、王建平等[6]已实现提取汉字笔画特征,赵琪等[7]在轮廓恢复方面亦作了深入研究,并已取得成效。此外,使用汉字图像的弹性网络特征[8]、Gaber特征[9]、和梯度特征[10]以及Kato等[11]使用方向元素特征这些方法进行汉字识别均能达到较好的汉字识别效果。这些研究成果对于本研究中的书法字特征提取有着重要的参考作用,为进一步提出书法字相似度算法打下坚实的基础。

结合书法学习步骤和各阶段要求,本研究选取用于评价书法初学者临帖效果的标准,利用计算图形学、数字图像处理技术,从结体特征、点画形态、章法布局三方面,通过深入探讨书法字特征提取与相似度算法,判断临帖作品的“形似”程度,构建一个书法辅助教学平台,完成评价临帖作品的繁琐任务,减少书法教师的工作量之余,还能暂时弥补部分书法教师在专业能力上的欠缺。此外,本系统的界面遵循娱乐化规则设计,目的寓教学于娱乐,激起青少年学习书法艺术的热情,进而推动书法教育的蓬勃发展。

1 书法字图像的预处理

书法练习者的临帖字体与原碑(原帖)字体是通过扫描或拍照后以图像格式文件输入计算机的。首先要对输入的字体图像进行预处理,如进行二值化[12]、去噪处理等。然后将字体的二值图像进行剪切、缩放,得到像素大小相同的正方形图像。图 1所示为原碑字体的预处理过程。至于原帖和临帖字体是白底(或灰底)黑字,预处理时不需要第三步的“反色”。

图1 原碑字体的预处理

(1) 图像二值化、去噪:将输入到计算机临帖字体和原碑帖字体进行二值化处理,即图像分割。对字体与背景进行识别,本研究采用迭代法进行图像二值化处理。同时,对二值图像进行区域面积的计算,删除面积特小的区域,以去除图像中的斑点、划痕等噪声。

(2) 图像裁剪缩放:将去噪处理后的图像通过剪切、缩放,使原碑(原帖)字体和临帖字体的二值化图像大小相同(如像素为 128×128),以便于下一步特征提取和相似度计算。

2 特征提取与相似度算法

参考书法临帖的要求和书法初级考试标准[2],对书法初学者临帖作品质量的综合评价主要从结体特征、点画形态和章法布局三方面进行。深入探讨特征提取与相似度算法,获取评价的依据。

2.1 结体特征

2.1.1 书法字骨架提取

图像的中轴部分亦即图像骨架,最能够反映出图像的结构特征,本研究提出计算书法字图像骨架的相似度的算法,对临帖字体与原碑帖字体在结体特征方面进行相似度的评价。

提取图像骨架,需对二值图像进行细化处理,将二值图像的骨架提取出来,同时尽可能保持图像细小部分的连通性,进而达到突出形状特征和减少冗余信息的目的[6]。本研究采用数学形态学细化法[13]提取书法字骨架。

细化算法中,为保证细化后图像的连通性,如图2(e)所示,可以借助中心像素点的八邻域情况来判断如何确定一个像素点是否应该被删除。

设置一个5×5邻域模板S,如图2(c)。模板各点为S[i, j](0≤i≤4,0≤j≤4),中心点为S[2, 2],如图2(b)。将模板S各位置上的点赋值,黑点为1,白点为0,模板S的中心像素点需要同时满足以下4个条件[14],即当中心像素点不为内部点、孤立点、线端点和边界连通点这4种中的任何一种情况时,才能被删除:

(1) 2≤N(S[2,2])≤6;

(2) T(S[2,2])=1;

(3) S[1,2]×S[2,1]×S[2,3]=0同时T(S[1,2])≠1;

(4) S[1,2]×S[2,1]×S[3,2]=0同时T(S[2,1])≠1。

根据以上原理,书法单字二值图像的骨架提取过程如下:

① 书法单字图像裁剪时,预留出宽度为2像素的白边,循环处理图像中的所有像素。

② 若当前像素点为白色,则重复执行①。

③ 若当前像素点为黑色,则定义一个模板S,设模板S中心与当前像素点重合。如图2(a)所示为一个书法字的二值图像,其上方(小正方形)区域的放大图如图2(b)所示。以该区域第一个黑点为中心设置5×5共25个像素的区域,如图2(c);得到5×5的结构元素模板S,如图2(d)。

④ 模板S覆盖的位置,像素为黑点,则在模板S对应的结构元素置为1,像素为白点置0。

⑤ 通过对中心像素点8邻域(如图2(e))和16邻域(如图2(f))的判断,如果模板S同时满足 4个条件,则删除中心像素点,将其填充为白色。图2(c)的中心像素点没有同时满足4个条件,则不能删除。

⑥ 循环①~⑤,直到处理完图像中所有像素点。

⑦ 将⑥中得到的结果作为下一轮扫描的对象,循环①~⑥,直到没有需要删除的像素点。

图3(a)为第一轮细化的结果,大部分边界点被删除,目标区域缩小了一圈。图3(b)~(d)分别为第二、三、四轮细化的结果,黑色区域不断从外部向内部腐蚀。图3(e)为多轮细化的最终结果,区域的宽度信息已经除去,仅剩宽度为 1像素的骨架细线。此方法提取书法字骨架提取结果如表 1所示,基本实现书法字的结构特征表达,所提取结果用于下一步的骨架相似度计算。

图2 5×5结构元素

表1 书法字骨架提取结果

2.1.2 骨架相似度计算

如图4(a)为经提取的临帖字体骨架(浅色)和原碑帖字体骨架(深色),先求出两者的差异度,然后根据差异度判断两者在结体特征方面的相似度。差异度是指临帖字体骨架上某个像素点与原碑帖字体骨架中对应的像素点之间的距离[13]。

(1) 本研究是采用人工设定适当区域(如图4(a)的矩形),在临帖字体骨架上取任意点m(x1, y1)(如图4(b)),则m与原碑帖字体骨架上任意点n(x2, y2)之间的距离为:

(2) 计算 m点与这个区域内另一个骨架上各点的距离,取与m点距离最小的n′点,定义dmn′为m点到另一个骨架的距离dmin,如图4(c)所示。

(3) 用临帖字体骨架每个像素点与原碑帖字体骨架对应点之间的距离之和表示两字体骨架的差异度:

式中的 i和 j分别为书法字骨架图像的宽度和高度。

因差异度和相似度成反比,故距离之和的倒数能够反映出两个骨架的相似度λ:

其中,sum是临帖字体骨架上像素点总数。

表2为临帖字体与原碑帖字体骨架的比较实验,其中将骨架相似度λ换算为百分制的分数S1。当S1越高表示骨架相似度越接近,得到的评价就越好。

2.2点画形态

图4 书法字骨架差异计算示意图

表2 书法字体结体特征相似度计算结果

点画形态的相似度是描述笔画的形状特征,描述的方法应不受形状区域平移、旋转的影响。Hu[15]提出的利用7个几何不变矩来描述图像的形状特性,这种方法可以有效排除点画中的结构信息,适用于描述点画形状。

本研究使用“套索”的工具,通过交互方式分别选取临帖字体和原碑帖字体的对应笔画(如图 5“容”字中的撇),然后将所选的笔画分别进行不变矩计算。当两者对应的矩相差越小,则临帖笔画和原碑帖笔画的相似度就越高。

实验结果如表3所示,将不变矩平均误差值的倒数设为M,并换算成百分制的分数S2。当S2越高表示点画形态的相似度就越接近,评价就越好。

图5 不变矩计算

表3 字体点画形态相似度计算结果

2.3 章法布局

将临帖字体和碑帖字体进行图像二值化后,处理成白底黑字的书法字图像。再将该图像向竖直方向(图6(a))和水平方向(图6(b))进行投影,在直方图中得到的空白区域长度分别为行距和字距离。根据临帖和碑帖行距和字距的对比,作为章法布局的相似度。

实验结果如表4所示,μ1、μ2分别是行距和字距的相似度,S3为换算成百分制的分数,当S3越高表示章法布局相似度越接近,评价就越好。

图6 书法字图像投影图

表4 书法字章法布局相似度计算结果

3 计算机评价书法临帖的实现

本研究采用Visual Studio 2010作为系统集成开发环境,使用C#语言进行系统编程。当输入原碑帖和临帖作品图像(如扫描件或照片),经过图像预处理后,即可进行章法布局、单字结体特征和点画形态的评价,如图7(a)~(c)所示。评价系统综合这三方面相似度算法结果,得出临帖书法作品的平均分、平均等级以及综合评语,如图 7(d)所示。书法练习者可根据评价结果,较为全面地了解自己的学习状况,为进一步练习提供参考。

图7 书法临帖的计算机评价

4 结 束 语

本研究是针对书法初学者早期对临帖“形似”要求较高的特点,以及依据《中国书法等级考试标准》的基本内容而展开的。借助计算机图像识别技术,对临帖字体和原碑帖字体的相似程度作出判别和评价。在字体结构、笔画形态和章法布局三方面提出了相似度的算法,实现了对书法初学者临帖效果进行评价的计算机辅学系统。近年来,随着国学热,以及教育部出台的《关于中小学开展书法教育的意见》与《中小学书法教育指导纲要》等,有些高校还开设了书法专业,书法教育受到重视,书法爱好者不断增多。本研究结合传统文化和现代科技,在计算机辅助书法学习方面开展了初步的尝试。当然,还有众多技术问题有待于进一步地研究和完善。此外,书法学习是一个非常复杂的思想过程,它包含着非常丰富的文化内涵。如果把书法字体仅限于在“形”的相似显然是远远不够的,还需要探讨书法字体的很多属性。

[1] 汤大民. 中国书法简史[M]. 南京: 南京师范大学出版社, 2012: 1-10.

[2] 吴慧平. 中国书画等级考试攻略[M]. 合肥: 安徽美术出版社, 2009: 1.

[3] 马小虎, 潘志庚, 张福炎. 基于笔画描述的样条汉字库以及应用[J]. 计算机学报, 1996, 19(3): 81-88.

[4] He Rong, Yan Hong. Stroke extraction as pre-processing step to improve thinning results of Chinese characters [J]. Pattern Recognition Letters, 2000, 21(8): 817-825.

[5] 陈 睿, 唐 雁, 邱玉辉. 基于笔画段分割和组合的汉字笔画提取模型[J]. 计算机科学, 2003, 30(10): 74-77.

[6] 王建平, 钱自拓, 王金玲. 基于数学形态学的图像汉字笔画细化和提取[J]. 合肥工业大学学报, 2005, 28(11): 1431-1435.

[7] 赵 琪, 薛环振, 张显俊. 基于统计模型的书法笔画轮廓恢复[J]. 计算机应用研究, 2010, 27(10): 3977-3978.

[8] 刘 伟, 朱宁波, 何浩智. 基于弹性网格模糊特征的手写体汉字识别方法[J]. 中文信息学报, 2007, 21(3): 117-121.

[9] Ge Yong, Huo Qiang, Feng Zhidan. Offline recognition of handwritten Chinese characters using Gabor features, CDHMM modeling and MCE training [C]//Proceeding of IEEE International Conference on Acoustics, Speech and Signal Processing 2002, 2002: 1053-1056.

[10] Liu Chenglin. High Accuracy handwritten Chinese character recognition using quadratic classifiers with discriminative feature extraction [C]//Proceedings of 18th International Conference on Pattern Recognition, 2006: 942-945.

[11] Kato N, Suzuki M, Omachi S, Aso H, Nemoto Y. A Handwritten character recognition system using directional element feature and asymmetric mahalannobis distance [J]. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1999, 21(3): 258-262.

[12] 朱 虹. 数字图像处理基础与应用[M]. 北京: 清华大学出版社, 2013: 1-79.

[13] 俞 凯. 计算机书法若干关键技术研究[D]. 杭州: 浙江大学计算机科学与技术学院, 2010.

[14] 联 骏. 图像编程精髓[M]. 北京: 电子工业出版社, 2006: 6-7.

[15] Hu Mingkuei. Visual pattern recognition by moment invariants [J]. IEEE Transactions on Information Theory, 1962, 8(1): 179-187.

Computer Evaluation of Imitation in Chinese Calligraphy

Deng Xuexiong, Li Jingtao, Li Mu
(School of Design, South China University of Technology, Guangzhou Guangdong 510006, China)

For the characteristics of calligraphy learning beginners, on the base of computer aided technologies, according to the evaluation standard of calligraphy towards beginners, algorithms of calligraphy similarity are proposed. Calligraphy imitations are fed into computer by scanning or taking pictures and preprocessed by utilizing computer image processing technology. By means of making Image skeleton, invariant moment and gray projection algorithm, feature extractions of imitation fonts is made, from the aspect of structure feature, stipple form and writing rules, respectively. Similarity calculation of imitation fonts and original fonts is also completed, and the auxiliary learning system that provides comprehensive assessment of calligraphy imitations for beginners is realized.

computer application; calligraphy education; brush calligraphy; imitation; computer evaluation

TP 391

A

2095-302X(2014)06-0899-06

2014-02-27;定稿日期:2014-05-05

邓学雄(1957-),男,广东三水人,教授,硕士。主要研究方向为计算机图形学、CAD、工程图学、计算机艺术等。E-mail:dengxuexiong@263.net

猜你喜欢
临帖碑帖点画
写好点画
“练成优美点画,方能把字写好”——唐代书法家孙过庭之《书谱》今译(一)
丹青少年(2017年1期)2018-01-31 02:28:30
碑帖硬临
中国篆刻(2017年7期)2017-09-05 10:01:25
浅谈我对硬笔书法临帖与出帖的理解
中国篆刻(2017年7期)2017-09-05 10:01:10
碑帖硬临
中国篆刻(2017年8期)2017-09-05 09:44:11
临帖创作解说词
艺品(2017年2期)2017-07-21 14:24:58
七绝·春雪
阳光(2017年7期)2017-07-18 18:37:04
碑帖硬临
中国篆刻(2017年5期)2017-07-18 11:09:31
碑帖硬临
中国篆刻(2017年2期)2017-05-17 06:20:29
“练成优美点画,方能把字写好”——唐代书法家孙过庭之《书谱》今译(二)
丹青少年(2017年2期)2017-02-26 09:11:00