张 展,杨玉起
(1.安阳师范学院 甲骨文信息处理教育部重点实验室,河南 安阳 455000;2.中国科学院自动化研究所 模式识别国家重点实验室,北京 100190)
甲骨学专家根据甲骨学知识提出的人工缀合甲骨方式有多种,如郑慧生提出缀合八法:1.裂纹的吻合;2.文字;3.文辞内容;4.兆序;5.对贞二辞,即同文卜辞;6.部位,即甲骨所处的生理位置是否正确;7.字体;8.背面,甲骨的背面灼烧痕迹是否吻合一致。八种方法不能孤立看待,以一方为连,对勘其他方法,全无抵牾,才能拼接(1)林雅婷:《甲骨缀合研究》,(台北)国立政治大学,2004年。。而黄天树提出了四法:1.据字体判断;2.据残字判断;3.据碴口判断;4.据同文判断(2)黄天树:《殷墟王卜辞的分类与断代》,科学出版社,2007年。。人工缀合的方式需要记忆大量的甲骨文信息,存在专业要求高、工作量大的问题。于是,甲骨学专家提出使用计算机缀合甲骨碎片的设想。
前人研究的计算机拼接甲骨碎片技术,可总结为数字编码法(3)Hung-hsiang Chou, Opstad Dg. Computer Matching of Oracle Bone Fragments:A Preliminary Report on a New Research Method. Archaeology, 1973, 26(3): 176-181。童恩正、张陞楷、陈景春:《关于使用电子计算机缀合商代卜甲碎片的初步报告》,《四川大学学报(自然科学版)》 1975年第2期,第57-65页。、边角匹配法(4)林圭侦:《资讯科学在安阳出土甲骨拼合上的应用》,(台北)清华大学人类学研究所硕士论文,2006年。Liu Yong-ge, Wang Tian-lin, Wang Ji-ping. The Application of the Technique of 2D Fragments Stitching Based on Outline Feature in Rejoining Oracle Bones, 2010, MCAA2010, p964-968.和角序列特征匹配法等(5)王爱民、刘国英、葛文英等:《 甲骨文计算机辅助缀合系统设计》,《计算机工程与应用》2010年第21期,第59-62页。张长青、王爱民:《一种计算机辅助甲骨文拓片缀合方法》,《电子设计工程》2012年第17期,第1-3页。。但并没有形成有效的甲骨碎片图像拼接软件和系统,实际的甲骨碎片拼接成果,也没有应用于甲骨碎片图像拼接中。在2019年甲骨文发现120周年纪念大会上,安阳师范学院甲骨文信息处理教育部重点实验室的团队,综述了历年来计算机缀合甲骨碎片图像技术(6)张展、刘永革、郭安、刘成林:《计算机拼接甲骨图像技术综述》,《纪念甲骨文发现120周年国际学术研讨会论文集》,中国安阳,2019年,第692-697页。张展、高峰、 刘成林: 《计算机拼接甲骨碎片图像技术简论》,《殷都学刊》2020年第3期,第72-75页。,并讲述了该实验室研发的计算机拼接甲骨碎片图像技术,且在同年12月(如图1),使用计算机辅助缀合了第1组甲骨碎片并得到实物验证。并由林宏明老师协助发表在先秦史研究室网站(7)张展:《计算机辅助缀合甲骨第1则》,http://www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。,标志着计算机缀合甲骨碎片图像技术有所突破。随着人工智能技术的高度发展和甲骨学的需求,计算机拼接甲骨碎片图像技术将会更加成熟,并应用于陶瓷、竹简、碑刻、纸币、发票等物体碎片的图像拼接。本文主要探讨计算机辅助拼接甲骨碎片图像技术的问题、技巧、特点和重要性。
针对计算机缀合甲骨技术给计算机视觉和甲骨学领域带来的争论,本节将讨论计算机拼接甲骨碎片图像技术所带来的问题,总结为以下几个方面:
1.如何对待计算机拼接甲骨的技术
计算机拼接甲骨碎片图像的技术是辅助甲骨缀合的工具,目前还不能完全地替代甲骨学专家某些特定的工作。比如,计算机缀合甲骨碎片后还需要专家验证或者实物验证缀合成果的正确性,所以甲骨学专家的验证工作仍旧不可替代。然而“先进的生产工具代表先进的生产力”,计算机辅助拼接甲骨碎片的软件无疑是先进的拼接工具,建议有辩证地接纳并学会应用工具。
2.如何看待计算机错误拼接甲骨问题
计算机辅助拼接甲骨碎片软件是先进的工具,但是拼接结果也会出现错误组合。计算机拼接甲骨程序是预先设定的、机械程序的和局限敏感的,对计算机辅助拼接甲骨碎片出错的问题需要甲骨专家的理解包容。如何结合甲骨学专家拼接甲骨的经验,综合甲骨文文例、甲骨碎片边缘等各种信息综合判断、验证拼接组合是否正确,是避免拼接结果出错的关键。另外,计算机拼接甲骨碎片成果发表前需要验证拼接正确性,可采用专家验证和实物验证的机制防止出错,验证结果正确后决定是否发表。对于出书刊印计算机拼接甲骨,需要做详细说明。
3.计算机智能拼接甲骨碎片技术问题
当前的计算机拼接甲骨碎片方法,采用了先进的人工智能技术,实现了甲骨学专家使用计算机辅助拼接甲骨碎片的设想。但如图1计算机首次拼接的甲骨碎片图像当前的计算机辅助拼接甲骨缀合技术并不能达到专家设想的“百分之百的计算机工作”“缀合百分之百的正确”和“获得大批量的缀合成果”等要求。只能采用或研发更先进的方法或技术,提高计算机拼接甲骨的正确率和效率,所以目前该项技术只能称之为计算机辅助拼接甲骨碎片技术或者人工智能驱动的甲骨碎片缀合技术(8)张展:《计算机辅助缀合甲骨第1则》,http://www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。Zhang Chongsheng, Zong Ruixing, Cao Shuang, Men Yi, Mo bofeng. AI-Powered Oracle Bone Inscriptions Recognition and Fragments Rejoining, Proceedings of 29th International Joint Conference on Artificial Intelligence, Yokohama, Japan, 2020, 5309-5311。莫伯峰、张展:《计算机辅助缀合研讨一则——谈“日有即”》,https://mp. weixin.qq.com/s/V6xTu0tbUS77cSVQXq1CWA,2021年4月30日。张展:《计算机辅助缀合甲骨第31-32则》,http: //www. xianqin.org/blog/a -rchives/12626.html,2020年6月16日。。
1.甲骨碎片拼接的技巧
(1)采纳专家拼接甲骨的经验
专家的经验一般是根据断口、文例等,比如郑慧生先生提出8法,白玉峥先生提出5法,黄天树先生提出的4法等,在计算机辅助拼接甲骨碎片方面仍然适用,可以根据这些方法编写程序,使计算机采集甲骨碎片图像边缘等信息,并搜索匹配的甲骨信息,然后保存结果。另外,尽量选择出土于同一个坑、拼接可能性大的甲骨碎片数据集运行程序,这样可以增加正确拼接的概率。
(2)自身学习和经验积累
以旅顺博物馆所藏甲骨为例说明:建立已拼接甲骨数据或者图像集,即可避免拼接了已拼接的甲骨,又可在建立拼接数据集的同时积累甲骨拼接的经验,还可以用已拼接数据集检验程序的有效性稳定性;将甲骨著录的图像以统一的标准剪切成单个甲骨碎片图像,以统一甲骨碎片图像的比例空间,使获取甲骨边缘信息更加准确有效;出土后断裂甲骨碎片的断口是新的、无泥土的,往往可以找到匹配的甲骨碎片;如果甲骨碎片中有残字可以拼接,一般都能拼接正确。
(3)验证方法的多样化
一般可以采用多种方法相互验证拼接组合的正确性。如甲骨碎片正反面图像拼接验证,甲骨碎片拓片图像拼接验证和摹本图像拼接验证,结合甲骨学的残字、文例、兆序、钻凿、纹理等信息进行拼接正确性验证,多种方法“全无抵牾,方可以缀合,孤立应用,难免不出错误”;也可参考甲骨学专家的意见,判断拼接组合是否正确;最后,若是无法根据信息判断,则进行甲骨碎片实物拼接验证,这是最直接有效的方法。
2.计算机拼接甲骨的特点
(1)计算机拼接甲骨碎片图像边缘没有规律可循。甲骨一般在钻凿、卜兆、齿纹处容易断裂,但是断痕的边缘并无规律,计算机可以找到这种没有规律的边缘信息进行匹配。
(2)拼接甲骨文语句则有规律。甲骨文语句拼接,可根据残字、上下文衔接、同文卜辞和正反对贞等方法进行软件设计,这种方法是根据已有甲骨文语句寻找可拼接语句,是有规律的。可以根据这种规律让计算机寻找甲骨碎片图像边缘。
(3)综合各种信息拼接甲骨。可以将甲骨碎片正反面的彩色图像、拓片图像和摹本图像,以及甲骨文语句字体和分类分期等信息进行特征融合,开发计算机程序,使其综合各种信息自动地搜索甲骨融合数据库,找到可拼接的甲骨碎片。
4. 计算机拼接甲骨对细微信息敏感。对于人工拼接甲骨,可能忽略甲骨碎片上的某些细微信息。而利用计算机视觉技术可以将甲骨碎片图像进行放大、旋转、平移等处理,自然语言处理技术也可以对甲骨文语法字词进行建模,用于搜索人工容易忽略的甲骨信息,对甲骨碎片缀合有重要的参考意义。
1.计算机拼接甲骨的重要性
(1)发现新的文例或文例组合
由于甲骨脆弱易碎,加以钻凿燋灼,又经历三千多年的岁月,所以在出土时多已裂成碎片,只有尽可能地将这些碎片拼接在一起,才能更好的了解其文例,更全面的研究新的文例或文例组合。专家依靠固有的甲骨文文例和甲骨碎片纹理的拼接经验,往往不容易发现可拼接信息和新文例。
(2)拼接无字的甲骨碎片
在甲骨拼接过程中,会存在很多无字甲骨的碎片,人工拼接要耗费大量的时间和精力,而通过计算机,依据甲骨碎片的图像纹理特征,可以有效的辅助甲骨专家对其进行拼接与研究,提高拼接正确率。
(3)拼接甲骨专家所忽略的细微信息
有些细微之处是甲骨专家注意不到的,容易被忽略,计算机拼接过程可以很好地改善这方面的不足,加快修复甲骨碎片文物,加大缀合力度。
2.重要拼接成果
本文作者使用计算机辅助拼接技术,已经成功缀合了属于新发现、可缀合、被专家认可的甲骨碎片30余组,现给出4组具有重要内容和研究价值的缀合成果。
第1组 北珍435+北珍438
如图2,原文:
释文:
图2 有关日食信息的缀合
第2 组 旅藏1316+旅藏443
如图3,原文:
释文:
图3 罕见辞例的缀合
第3组 旅藏1457 +旅藏1577
如图4王系卜辞与卜雨同时出现,原文:
(4) 贞其雨?
(5) 贞不雨? 二
释文:
(1)甲子日占卜,□贞问,王举行宾祭,不会有灾咎吧?
(2)贞问,不会有灾咎吧?
(3)甲子日占卜,贞问,王向太阳举行宾祭,不会有灾咎吧?
(4)贞问,下雨吗?
(5)贞问,不下雨吗?
第4组 俄藏99 +[俄藏15+俄藏16]
如图5缀合出现王的命令卜辞,原文:
释文:
随着计算机技术发展日臻成熟,计算机技术辅助甲骨碎片拼接也成为研究甲骨文不可避免的发展趋势。计算机自动地拼接甲骨碎片图像,将有效地推进甲骨文研究的进程,扩大甲骨碎片图像的整体视野,增加甲骨文语句的连续性、完整性以及可读性,辅助专家修复甲骨碎片文物、考释甲骨著录的字词含义和研究甲骨文记载的商朝历史,同时增进甲骨文优秀传统文化的传承发扬和挖掘利用。
附图:
第3组:
图4 王系卜辞与卜雨同时出现
第4组:
图5 王命卜辞