张长青,王爱民
(安阳师范学院 计算机与信息工程学院,河南 安阳 455002)
甲骨文是我国目前所发现的、世界上最早的、有体系的、最完整的文字,对于研究古文字的发展、演变具有非常重要的价值,是研究上古历史,尤其是商代历史不可替代的第一手材料[1]。在甲骨文的研究工作中,缀合甲骨碎片是一项重要和关键的准备步骤。由于甲骨质脆,又经历了漫长的岁月,所以在出土时多已裂成碎片。要对甲骨文进行详细的研究,就必须将这些碎片缀合起来,才能更好地了解卜辞的文例、位置和语法规律,更全面地研究卜辞的内容。据最近的统计,甲骨出土的数量已多达十五万片,今后的新发现还不可预料。完全考手工整理和缀合甲骨碎片,工作量巨大,而且也会对甲骨碎片造成一定的破坏。随着计算机科学技术的发展,已经找到了新的途径,用计算机辅助缀合碎片,是整理和研究甲骨的一种先进技术。1973年,国外首先开始用电子计算机作缀合甲骨的尝试;1974年,国内也有人从事这方面的研究。目前尚未出现基于甲骨文拓片的计算机辅助缀合方面的文献。使用边界进行甲骨碎片的缀合,本质上是形状的匹配,文献[2]使用空间金字塔特征来描述形状,文献[3]提出了一种Relaxation-methods技术来进行形状匹配,文献[4]提出了一种全自动稳健的图像拼接融合算法,此算法采用Harris角检测算子进行特征点提取,使提取的精度达到了亚像素级。甲骨文拓片不同于实物图像,其边界具有不完整性,尤其是二值化的拓片图像上,文字部分和甲骨碎片上的自然凹陷都会形成图像上的白色区域。导致文字区域与自然凹陷无法区分。因此需要首先对边界进行修复,文献[5]提出了一种基于采样插值的图像边界修复方法。基于上述问题和研究基础,提出了一种新的甲骨文拓片计算机辅助缀合方法。
进行甲骨文拓片缀合,需要对拓片先进行图像的预处理。预处理的目的是提取拓片的轮廓。预处理过程如图1所示。
图1 拓片图像预处理Fig.1 Preprocessing of shells rubbing image
甲骨拓片不同于实物,其拓片轮廓与真实轮廓有一定的差异。根据拓片的特征,甲骨上文字和一些非文字凹陷部分显示为白色,碎片其他部分显示为黑色。同时拓片图像背景为白色,导致拓片边界上的白色(文字或者凹陷部分)与背景相连接,从而难以区分甲骨的真实边界,而且有的拓片会成为多个独立的区域,这与甲骨实物是不相符的。如图2,原始的拓片图像的轮廓并非真实甲骨轮廓,要得到近似真实的甲骨轮廓就必须对图像进行相应的处理,文献[5]、[6]均提出了相应的图像修补方法。而将缺失的边界补全是所要解决的首要问题。边界的增补可以采用以下两种方法:
1)手工处理。即预先通过人的主观判断,手工将边界上的缺口补全,如图2中的(b)即为(a)图补全后的图像;
2)边界采样,多边形逼近。在边界上进行间隔采样,获取一系列边界点,并将其连接,形成多边形,近似为拓片轮廓。
图2 拓片图像边界增补Fig.2 Boundary supplement of shells rubbing image
获得拓片轮廓后,根据轮廓特征进行匹配。文献[7]中进行碎纸拼接时将边界进行旋转,计算复杂度较高。考虑到甲骨拓片生成数字化图像时,根据文字等信息,拓片已经基本正立放置,因此,仅需旋转较小的角度即可。定义旋转的范围为[+10°,-10°],每次旋转的角度 step=1°。
在试缀合的过程中,主要通过多次相对位置的平移,并计算每次平移后的匹配长度和边界之间的面积,然后计算其匹配程度,计算方法在2.2中有详细描述。
边界缀合本质上是形状或边界相似性的度量,考虑到边界的匹配程度主要受两个方面影响,匹配边界长度和缝隙面积。边界长度越大匹配度越大;缝隙面积越小匹配度越大。因此,文中定义如式(1)的相似度:
相似度确定后,需要确定两拓片的匹配度,从而筛选符合条件的拓片。
如图3,拓片A的右边界和拓片B的左边界进行匹配。相对位置确定后,将匹配边界对分为多个匹配段,分别计算每个匹配段的匹配度。显然,编号为1,2的匹配段形成的面积较小,具有较高的匹配度,而编号为5,6的匹配段间隙面积较大,其匹配度较低,可以考虑忽略不计。
图3 拓片A和B右-左边对匹配图Fig.3 Matching of the right edge of rubbing A and the left edge of rubbing B
因为甲骨拓片图像方向基本为正向,不失一般性,可忽略其旋转操作。选取边界上最高、最低、最左、最右4个点,并以此4点为顶点,将轮廓划分为上下左右4条边界(边界可重叠)。对于两拓片TA和TB,将会进行 4种匹配尝试,即(TA-left,TB-right),(TA-right,TB-left),(TA-top,TB-bottom)和(TA-bottom,TB-top)。 以(TA-right,TB-left)为例,初始时,边界 TA-right与边界 TB-left需要进行位置初始化,TA-right位置不变,TB-left向下平移, 使TB-left中具有最大纵坐标的点与TA-right中具有最小纵坐标的点具有相同的位置。每次将TB-left在纵轴方向上平移COMP_LEN,并计算此时的匹配度。每次平移的长度COMP_LEN的选择直接影响匹配的准确性和匹配效率。若MOVE_LEN取值过大,则可能导致跳过可以较好缀合位置,影响最终缀合效果;若COMP_LEN取值过小,则匹配计算次数过多,影响匹配效率。
边界的匹配度受两个主要因素影响,匹配长度和间隙面积。因此,定义式(2)的匹配度计算方法:
其中,s和l分别为归一化处理后的匹配度和匹配长度。从式(2)可看出,边界相似度的计算,综合考虑了匹配长度和间隙面积,通过权重因子α调整两个因素所占作用的比重。
对于两拓片图像,在完成图像的预处理后,即完成提取拓片轮廓后,按以下步骤计算其匹配度。
1)提取待缀合的两拓片的匹配边对;
2)初始化匹配边对位置,初始化匹配长度L=0,面积A=0;
3)在每个匹配位置上,对于每SEC_LEN长度,根据式(2)计算形成的面积:
其中 g(x)和 f(x)分别为边界曲线函数;
4) 根据式(1)计算每段匹配度 Si,若 Si≥Sihres,则 L=L+Li,A=A+Ai;
5)根据式(4)计算当前位置的相似度Kpos_i=L/A;
6)选择所有相似度中最大相似度Kmax作为当前匹配边对的最大相似度;
算法流程图如图4所示。每一对待缀合甲骨拓片图像存在4组匹配边对,选取4组中具有最大匹配度的一组作为待缀合拓片匹配结果。
选取黄天树缀合集中的4组甲骨拓片进行实验。每组拓片已经人工判定确定其真实缀合情况。如图5(a)~(c)中的两拓片为上下缀合,5(d)中的两拓片为左右缀合。
图4 匹配度计算流程Fig.4 Calculation procedure ofmatching degree
实验证明当COMP_LEN=60时,可以取得较好的效果。同时参数 α=0.5,SEC_LEN=30。
图5 缀合实验图Fig.5 Image set ofmatching experiment
对每组图片在无旋转的情况下进行缀合实验,每组图片可能的缀合情况分为4种情况,缀合数据如表1所示。可以看出对于第一组拓片,正确缀合位置为上下缀合,其匹配度最高,且明显高于其它方向上的匹配度。同样,第2、3组拓片在正确缀合方向上匹配度也最高,与实际情况匹配。第4组图片,左右和右左两个方向上的匹配度相当,正确的缀合方向略小于另外一个可缀合方向,这是因为另外一个方向上的缀合边界较长,而且都趋于平滑,也获得了较好的匹配度。
表1 边对匹配度Tab.1 Thematch degree of two edges in Fig.5
甲骨拓片缀合仅根据边界进行缀合不足以具有较高的精确度和准确度,应同时考虑甲骨拓片的其他特征,如文字特征,通过融合多种特征,进一步提高缀合的精度和准确度。
提出了一种计算机辅助甲骨拓片缀合方法,通过对甲骨拓片边界的提取及边界分段比较,计算两拓片的最佳匹配度并获得最佳匹配位置。然而,拓片图像不同于实物图像,文字和甲骨碎片上的自然凹陷及背景都会形成图像上的白色区域,造成边界缺失或失真,因此进行了边界增补。下一步将考虑融入甲骨拓片的文字等特征,同时考虑综合其他形状匹配方法[8],以进一步提高缀合效率和准确度。
[1]王爱民,刘国英,葛文英,等.甲骨文计算机辅助缀合系统设计[J].计算机工程与应用,2010,46(21):59-62.
WANG Ai-min,LIU Guo-ying,GE Wen-ying,et al.System designation for computer aided rejoining of bones/tortoise shellswith inscriptions based on contourmatching[J].Computer Engineering and Applications,2010,46(21):59-62.
[2]Bosch A,Zisserman A,Munoz X.Representing shape with a spatial pyramid kernel[M].In CIVR,2007.
[3]Davis L S.Shape matching using relaxation techniques[J].TPAMI,1979(1):60-72.
[4]赵向阳,杜利民.一种全自动稳健的图像拼接融合算法[J].中国图象图形学报,2004(4):417-422.
ZHAOXiang-yang,DU Li-min.An automatic and robust image mosaic algorithm[J].Journal of Image and Graphics,2004(4):417-422.
[5]顾建平,韩华,彭思龙.基于水平线插值的图像修复算法[J].计算机工程,2006(9):7-9.
GU Jian-ping,HAN Hua,PENG Si-long.Digital image impainting using level line interpolation[J].Computer Engineering,2006(9):7-9.
[6]王瑞,刘红喜,郝德芳,等.一种具有边界保持特性的图像修补方法[J].计算机工程与应用,2010,46(29):170-172.
WANGRui,LIUHong-xi,HAODe-fang,etal.Image inpainting method with boundary keeping[J].Computer Engineering and Applications,2010,46(29):170-172.
[7]贾海燕,朱良家,周宗谭,等.一种碎纸自动拼接中的形状匹配方法[J].计算机仿真,2006,23(11):180-183.
JIA Hai-yan,ZHU Liang-jia,ZHOU Zong-tan,et al.A shape matching method for automatic reassembly of paper fragments[J].Computer Simulation,2006,23(11):180-183.
[8]刘宏申,秦锋.确定轮廓形状匹配中形状描述函数的方法[J].华中科技大学学报,2005,33(4):13-16.
LIU Hong-shen,QIN Feng.Method of determining the function of description of shape in shapematching[J].Journal of Huazhong University of Science and Technology,2005,33(4):13-16.