杨玉婷 康厚良
摘 要:东巴文字作为人类早期的一种向象形文字、标音文字过渡的图画文字形式,既具有图画文字以图表意特点,又具有现代文字使用简单线条表达含义的特点。东巴文字本身的复杂性使其相关研究一直较少且连贯性不强。从东巴文字的构字要素入手,通过分析东巴文字的组成要素、结构特征及造字习惯,给出适用于东巴象形文字的预处理及基于网格分解的分类识别算法。该算法思路简单、复杂度低、易于实现,能够快速实现不同类型东巴文字的检索和识别,具有较好的缩放和平移不变性,从而为东巴文字的造字研究提供强有力的技术支持,也为研究其它象形文字的检索和识别技术提供重要参考。
关键词:网格分解;分类识别算法;东巴象形文字
DOI:10. 11907/rjdk. 181810 开放科学(资源服务)标识码(OSID):
中图分类号:TP317.4 文献标识码:A 文章编号:1672-7800(2019)009-0196-03
Dongba Hieroglyphic Classification Algorithm Based on Grid Resolution
YANG Yu-ting1, KANG Hou-liang2
(1. School of Computer Engineering, Suzhou Vocational University;
2. Sports Department, Suzhou Vocational University, Suzhou 215000, China)
Abstract: Dongba hieroglyph is a kind of very primitive picture hieroglyphs; it not only has a characteristic of pictograph to express meaning by using pictures, but also has a feature of modern word to express the meaning with simple strokes. Because of the complexity of the Dongba hieroglyph itself, the related research on has been limited. In the paper, we start with the structural elements of Dongba hieroglyphs. By analyzing the constituent elements, structural features and writing habits, we give a preprocessing and classification algorithm for Dongba hieroglyphs. The algorithm is simple, low in complexity and easy to implement. It can quickly retrieve and recognize different types of Dongba hieroglyph, and has better scale and translation invariance. The algorithm provides strong technical support for the study of glyphic formation in Dongba hieroglyph and also gives an important reference for the research on the retrieval and recognition of other pictographs.
Key Words: grid resolution; classification algorithm; Dongba hieroglyph
0 引言
東巴文是一种十分原始的图画象形文字,纳西语称“森究鲁究”,直译为“留在木石上的印迹”[1-2]。2003年,使用东巴文撰写的东巴古籍被联合国教科文组织列入世界记忆遗产名录[3]。
东巴文字识别研究较少且连贯性不强[4-11],绝大多数研究都是基于已有算法的实现,很少从东巴字本身的形态特征入手。本文从东巴文字的构字要素入手,通过分析东巴文字的组成要素、结构特征及造字习惯,给出东巴象形文字预处理及基于网格分解的分类识别算法。
1 东巴文字特征分析及预处理
从构字结构要素分析,东巴文字可分为单素字和复素字[12-13]。单素字指能够直接显示音义的独立文字,复素字指由两个或两个以上字素构成的文字,通过多个字素共同表示音义[14-15]。另外,在单素字中,可进一步分为轮廓型和结构型单素字,如表1所示。
1.1 东巴文字细化
东巴法师书写东巴文一般使用竹笔。竹笔属于硬笔的一种,使得东巴字的笔画线条粗细基本一致[16]。因此,对东巴文字的线条细化可有效去除文字中潜在的干扰,使字符特征更加显著,细化效果如图1所示。显然,细化处理不会对文字本身的结构、形态产生太大影响,完整保留了文字本身的线条特征。
1.2 复素字分割
为表达更加丰富、复杂的含义,复素字一般采用若干具有独立含义的字素,或者在单字素的基础上增加缀加元素(包括缀加点、线或字块)的方式 [17]。但是,这些辅助字素或缀加元素会对东巴文字的分类识别算法产生影响,因此在预处理阶段,使用8-邻域标记算法[18-20]去除复素字中的缀加元素,特别是复素字中的缀加点元素,保留复素字中的一个或多个独立成份。在减少缀加点对文字本身干扰的同时,使分类检索算法不但能用于具有相似形态的单素字,也能兼顾包含相似单素字的复素字。
处理步骤如下:首先细化复素字,突出字符笔划特征,然后去除文字中的离散缀加点,减少缀加点元素对字符识别的干扰,最后使用8-领域标记算法实现对复素字各组成元素的分割,操作步骤如图2所示。
2 基于网格分解的分类算法
适当的网格分解(Adaptive grid resolution,AGR)[21]指使用正方形网格覆盖整个形状。根据形状绑定矩形大小,将形状分解为大小相同的网格,计算对应网格中形状像素点差值,并将差值的总和作为两个形状的相似性距离,如图3所示。
由网格分解可知,对于具有相似形态特征的东巴文字,文字笔画在网格中的分布情况也是相似的。因此,基于网格分解的东巴文字相似性计算方法如下:
若待比较东巴文字为[G1]和[G2],[G1]的绑定矩形长í宽为[L1×W1],[G2]绑定矩形的长í宽为[L2×W2],为保证相似性算法的缩放不变性,计算东巴文字绑定矩形的归一化长和宽,其中,归一化绑定矩形的宽度为100,则:
若使用[m×n]的粗网格分解字符的归一化绑定矩形,且每一个网格中所包含的像素点为[Areai (i∈{1,2,3,?,][m×n})],则两个东巴文字的相似性距离为:
3 实验
人形字作为东巴象形文字的重要组成部分,反映了纳西先民生产、生活的各个方面,因此将其作为结构型单素字的度量模板,检索结果如图4所示,以“人”型作为检索模板时,返回的前100个字符的检索正确率为94%。其中,错误检索结果为5个,但是错误结果在形态上与人形字仍具有较多相似性,这从另一侧面说明纳西先民在造字初期,是先从自身出发,使用人的站立方式表示其它物体的站立或直立的。
对于轮廓型单素字,以
4 结语
本文通过分析东巴象形文字的图画特性,结合文字的结构特征和组合特性,给出了适用于东巴文字的预处理及基于网格分解的相似性度量算法。该算法思路简单、实现快捷、算法复杂度很低,通过对字符绑定矩形的提取和归一化处理,使该算法具有良好的缩放不变性和平移不变性,使用两种完全不同结构的东巴单素字进行测试也得到了较高的检索准确率,为东巴文字的造字研究提供了强有力的技术支持,也为研究其它象形文字的检索和识别技术提供了重要参考。
参考文献:
[1] 和力民. 试论东巴文化的传承[J]. 云南社会科学, 2004 (1): 83-87.
[2] 和金光. 纳西族东巴文化研究发展趋势[J]. 云南民族大学学报:哲学社会科学版, 2007, 24(1): 81-84.
[3] 戈阿干. 东巴文化揽胜[J]. 民族艺术研究,1999 (2): 71-80.
[4] GUO H, ZHAO J Z, DA M J, et al. Naxi pictographs edge detection using lifting wavelet transform[J]. Journal of Convergence Information Technology, 2010, 5(5): 203-210.
[5]GUO H, ZHAO J Y. Research on feature extraction for character recognition of Naxi pictograph[J]. Journal of Computers, 2011, 6(5): 947-954.
[6] GUO H, YIN J H, ZHAO J Y. Feature dimension reduction of Naxi pictograph recognition based on LDA[J]. International Journal of Computer Science, 2012, 9(1): 90-96.
[7] GUO H, ZHAO J Y. Segmentation method for Naxi pictograph character recognition[J].Journal of Convergence Information Technology, 2010, 5(6):87-98.
[8] LI X, GUO H, ZHENG Z K, et al. The Design and Realization of Naxi Pictograph Character Recognition Preprocessing System[C]. Proceedings of CSEEE 2011, PartII, 2011:54-59.
[9] 杨萌, 徐小力, 吴国新,等. 东巴象形文字识别方法[J]. 北京信息科技大学学报, 2014, 29(3): 72-76.
[10] 王海燕, 王紅军, 徐小力. 基于支持向量机的纳西东巴象形文字符识别[J]. 云南大学学报:自然科学版, 2016, 38(5): 730-736.
[11] DA M J, ZHAO J Y, SUO G J, et al. Online handwritten Naxi pictograph digits recognition system using coarse grid[J]. CSEEEP artI, CCIS, 2011(158): 390-396.
[12] 方国瑜, 和志武. 纳西象形文字谱[M]. 昆明: 云南人民出版社, 2005.
[13] 李霖灿. 纳西族象形标音文字字典[M]. 昆明: 云南民族出版社, 2001.
[14] 郑飞洲. 纳西东巴文字字素研究[M]. 北京: 民族出版社, 2005: 1-230.
[15] 和丽锋. 纳西东巴文字字形构造及其国际标准[D]. 上海:上海师范大学, 2016.
[16] 郑飞洲, 纳西东巴文字字素研究[D].上海:华东师范大学, 2003.
[17] 王元鹿. 汉古文字与纳西东巴文字研究[M]. 上海: 华东师范大学出版社, 1998.
[18] ONISHI J, ONO T. Contour pattern recognition through auditory labels of freeman chain codes for people with visual impairments[J]. Proceeding of IEEE International Conference on Systems, 2011, 32(14): 1088-1093.
[19] 陈士金, 汤漾平. 基于链码的轮廓跟踪技术在二值图像中的应用[J]. 华中理工大学学报, 1998,12(26): 26-28
[20] 董春利, 董育宁, 王莉. 活动轮廓模型目标跟踪算法综述[J]. 计算机工程与应用, 2008, 44(34): 208-212
[21] YANG M, KPALMA K, RONSINA J. Survey of shape feature extraction techniques[J]. Pattern Recognition Techniques, Technology and Applications, 2007(11): 1-39.
(责任编辑:杜能钢)