基于颜色特征提取的四川古壁画分类识别研究

2022-06-17 01:11李雅梅
关键词:特征向量正确率特征提取

李雅梅

重庆大学 艺术学院,重庆 401331

四川古壁画具有十分重要的研究价值,它是我国艺术宝库中的珍贵遗产,是中华民族优秀传统文化的重要组成部分.目前为止,计算机模式识别技术在艺术领域的应用研究还相当匮乏,绝大部分的图像仍然是依靠人工的方式在进行辨识,这样不仅消耗大量的时间,正确率也并不高,不利于我国传统优秀文化艺术的传播、推广和普及[1].四川壁画多留存于数百年的古佛寺之中,壁画采用传统工笔重彩画技法绘制[2],设色浓重饱和,给人以强烈的视觉震撼力,在壁画图像所呈现的形状、色彩和纹理特征当中色彩最具有辨识力[3].鉴于上述原因,本研究针对四川最具代表性的壁画进行分类识别,最后经多次实验证明壁画自动识别的有效性.

特征提取与分类识别在美术领域的研究:王静[4]提出了一种中国画图像的特征提取方法,分别提取了中国画的颜色特征和纹理特征,尽可能地保留国画原始图像中所包含的重要信息.为了解决特征提取过程中信息缺失的问题提出一种新的分块方式,并结合灰度共生矩阵算法对该算法进行实验,验证了研究的有效性.郭高鹏[5]选择花鸟、山水、鞍马、竹子和人物画为研究对象,提出了基于颜色特征和纹理特征的中国画识别方法,首先利用灰度共生矩阵法和颜色矩提取国画图像的纹理和颜色特征,然后将其组成国画图像的复合特征,将复合特征作为RELM的输入而国画类别作为RELM的输出,研究结果证明该算法提高了国画识别的精度.刘赏等人[6]提出了一种中国画的画家识别算法,该算法建立在中国画笔墨特征提取的基础上,中国画研究中墨线的形状和墨色的布局是画家对技法研究的重要环节,将这些特征提取出来作为支持向量机的输入再进行画作的分类.该算法在平均查全率和查准率上具有一定的优势,可为中国画的传承和鉴赏提供数字化的工具.童茵[7]提出了一种基于深度网络的中国画皴法风格迁移模型,对中国画的构图进行识别,在中国画构图所覆盖的绘制区域内,对中国画的皴法和不同的皴法风格进行了对比,使新生成的纹理具有皴擦所产生的特殊肌理效果,通过实验由模型转换的图像可以较好地保留绘画技法.通过文献检索,近年来美术领域相对于其他学科领域,特征提取与分类识别方面的研究成果较少[8-10].为了加快我国传统美术研究的数字化进程,本研究提出基于颜色特征提取的四川古壁画分类识别方法,通过多次实验建立四川古壁画的自动识别系统.

四川古壁画分类识别系统应包括4个方面的内容:① 图像数据获取.研究首先采用计算机可以运算的符号来表示对象,通过量化用矩阵或向量表示二维的壁画数字图像,以使计算机能够对四川古壁画图像进行分类;② 图像预处理.去除四川地区古壁画图像中的噪声,增强古壁画图像中有用的数据信息,对由设备输入而造成古壁画图像质量减弱的现象进行重新修复;③ 特征提取与选择.在四川古壁画图像分类识别研究中,根据古壁画拍摄的具体情况将壁画颜色特征进行归类,在每个类别的图像中选取一个特征点以代表该类图像的最主要特征;④ 分类器设计和分类决策.采用统计学的方法,把特征空间中古壁画图像所映射的点归入到某一个特定的类别当中,然后确定古壁画图像的分类判决规则,并按照这种规则对壁画图像进行分类识别,直到将图像识别的错误率降至最低.据此,本研究建立了四川古壁画分类识别系统结构模型(图1),其中特征提取和特征选择两个模块是整个识别系统的关键,提取什么样的特征和如何选择特征,直接关系到最后分类识别的结果.

图1 四川古壁画分类识别系统结构模型

1 四川古壁画图像的颜色特征

为了获得最佳的颜色特征提取和选择效果,本研究对四川古壁画中最具特色的广元剑阁觉苑寺壁画、广汉龙居寺壁画、新津观音寺壁画、新繁龙藏寺壁画和蓬溪宝梵寺壁画的颜色特征、分布情况、颜料使用以及壁画保存现状等进行详解.

1)新津观音寺壁画(图2).主要颜色特征分布:主壁画以“黑、金、红”三色为主,背景全部为深色.辅以石绿、石青、珍珠粉等颜料绘制,色彩浓重富丽鲜艳夺目.背壁以“红、绿、金”色为主,背景为黑色,辅以少量白色和赭石色.颜料使用情况:壁画主要采用朱砂、朱磦、墨色、金箔等材料制作而成,其次以石绿、雄丹、石青、珍珠粉等颜料绘制.壁画中红色颜料的品种主要有朱砂、铅丹、黄丹、代赭石等.颜色保存现状:壁画色彩保存非常完好,但是由于年代久远,壁画中由于吸附了部分粉尘导致红色颜料中略带“灰”的色彩倾向,使颜料对比度降低而产生出一种灰雅之感.

图2 新津观音寺壁画:普贤菩萨

2)新繁龙藏寺壁画(图3).主要颜色特征分布:主壁画基调以“红、绿”二色为主,辅以黑、白、金色,颜色整体较为灰暗.背屏以“红、金”二色等为主,辅以适量的蓝色.藻井以“黑、白、红、浅绿”为主,辅以金色,色彩浓重饱满.颜料使用情况:壁画主要采用朱砂、石绿等绘画材料,并辅以石墨、朱磦、赭石、黄丹、贝壳粉等颜料而成.另有银朱、红丹、黄丹、飞铅、粉朱、土红等.颜色保存现状:壁画色彩保存情况欠佳,主壁画由于墙体坍塌,灰尘过多,色彩灰暗,剥落严重.顶部的藻井和背屏壁画由于被遮挡,颜色较为鲜亮.

图3 新繁龙藏寺壁画:善财童子

3)剑阁觉苑寺壁画(图4).主要颜色特征分布:壁画整体色调厚重深沉,深褐色的背景上用“金”色进行装饰,贴金处有金碧辉煌之感,绘制以“白、黑”两色为主色,其次“红”色使用较多.画面上黑、白、红、金四色对比强烈,充满运动感.背壁以“红、黑、金”三色为主,辅以少量的白色和褐色,色调趋向于黄土.颜料使用情况:壁画主要采用珍珠粉、朱 砂、石绿、黑色、灰色、赭石、土黄等绘画材料,壁画上装饰品、建筑、房顶、器物等大面积采用沥粉贴金技法.颜色保存现状:壁画色彩整体保存较为完好.顶部靠近房檐处有少量受潮的斑点,中间有一些贯穿上下的水痕,部分画面有剥落.

图4 剑阁觉苑寺壁画:同举金棺

4)蓬溪宝梵寺壁画(图5).主要颜色特征分布:壁画以“红、绿、蓝、金、白”等多色绘制,色彩浓重饱满,绚丽明艳,对比强烈.宝梵寺壁画用色的重要特点是红、绿两色使用最多,辅以黑白灰和少量青色搭配.画面贴金面积较大,视觉效果华美富丽.颜料使用情况:红色系颜料使用了朱砂、朱磦、朱丹、粉朱、银朱、土红等.绿色系颜料使用石绿、灰绿、墨绿、翠绿等.颜色保存现状:壁画色彩保存情 况整体较好,尤其是中间主绘内容色彩鲜艳,对比强烈.壁画底部靠近墙角低端的地方有明显剥落.

图5 蓬溪宝梵寺壁画:罗汉聆经

5)广汉龙居寺壁画(图6).主要颜色特征分布:壁画以“绿、黑、红、金”色为主,背景为白色.其中壁画顶部以红色、金色、色彩为主,壁画靠近中心的部分绿色或棕黑色使用的频率较高,白色背景上以绿色或棕黑色为主,辅以少量的红色和金色.颜料使用情况:壁画主要采用石绿、石墨、朱砂等绘画材料,并辅以少量黄丹、赭石和石青色,除装饰品以外,建筑房顶采用贴金技法表现.颜色保存现状:壁画色彩损毁严重,曾经被整体涂刷成白墙,后来经人工剥出壁画,整体上十分斑驳,部分画面内容已无法辨识.

图6 广汉龙居寺壁画:护法诸天

四川古壁画大部分保存完好,颜色特征鲜明,这为特征提取提供了有利的前提条件.在四川古壁画图像的形状、颜色和纹理诸多特征中,颜色特征无疑比其他两大特征都要更加稳定和可靠,它对图像的旋转、倒置、缩放等都具有不变性,甚至对图像的各种变形均不敏感,表现出相当强的鲁棒性.本研究在对四川古壁画图像进行现场调查、色卡制作以及颜料使用状况分析以及绘制的基础上,进行颜色特征提取.

2 基于颜色特征提取的分类识别方法

研究采用的实验数据来源于自建的四川古壁画图像数据库,本数据库共收集高清图像数千幅.研究首先提取图像的RGB值作为特征来进行聚类,然后将RGB颜色空间转换到HSV颜色空间提取图像的特征向量,再将K-Means算法和最邻近算法进行比较从中选取最优的算法.为了进一步提高识别的精度,实验尝试手动去噪和将HSV颜色空间量化到300级的方法,但是由于效果不明显最终放弃此方法.在多次实验之后发现,几类壁画图像中仍有部分类别的图像识别正确率不高,其主要原因在于:① 同类壁画图像中包含有整体照片、局部照片和特写照片,这几类图像由于拍摄的范围和角度不同,色彩上存在较大的差异;② 古壁画的绘制通常会分为上段、中段和下段,由于每一段表现的内容不同,色彩存在一定的差异;③ 由于图片拍摄时均采用自然光线(而非灯光拍摄),寺庙中靠近中间位置的壁画受光较好颜色鲜亮,位于顶部和底部的壁画由于受光较差图片偏暗.鉴于此,在每个大类的图片中仅分出两个类别,并不能涵盖该类图像的主要特征.因此在多次实验后,本研究对分类效果不高的广元剑阁觉苑寺壁画和新津观音寺壁画再细分为3个类别,而其他地区的壁画则分两个类别来进行测试.通过每类图像特征点逐步增加的方式来进行测试,取得了较好的识别效果.最后确定四川古壁画图像识别系统研究采用的算法、特征提取方法和分类识别方案.算法步骤:首先在每一类里面使用K-Means算法进行聚类,并提取该类中2~3个特征向量;其次使用最邻近算法,计算每幅图像与特征向量的相似度并进行分类;再次将特征向量与类进行对应,将图像类别整理成5类;最后计算分类的正确率.

统计得到的实验结果看出:① 将RGB颜色空间转换到HSV颜色空间,有利于壁画图像别的分类;② K-Means算法和最邻近算法相比,最邻近算法优于K-Means算法;③ 手动去噪的方法在一定程度上有利于分类器准确率的提高;④ 对于量化级的提高,即增加HSV颜色特征向量的分量对分类器的正确率提高并不明显;⑤ 一个类提取两个特征向量的方法对分类的准确率有明显的提高;⑥ 一个类提取多个特征向量的方法对分类的准确率有极大的提升,实验结果开始接近预期的目标.

3 四川古壁画识别系统研究

四川古壁画自动识别系统应实现8个功能:① 将图像的颜色信息进行转换,把四川古壁画的RGB颜色空间转化到HSV颜色空间,然后非等间隔量化古壁画图像的HSV颜色空间;② 归一化处理由古壁画图像统计所得到的颜色特征向量;③ 通过对上面步骤循环得到图像库中各图像特征向量;④ 对于每个类使用K-Means算法提取一个或多个类代表点;⑤ 对于每个数据点,计算数据点的特征向量与每个代表点特征向量的相似度,并根据特征点所在的类对数据点进行归类;⑧ 对于每个点根据其原有的分类和程序分类,计算分类器的正确率.其流程见图7.

图7 四川地区古壁画系统识别流程

3.1 类代表点提取

1)K-Means算法聚类.由于四川古壁画中每一类图像的颜色特征都不够统一,所以对于同一类图像的颜色特征采用多个颜色特征向量来代表.使用K-Means算法进行聚类,将聚类后的簇点作为类的代表点,因此K-Means算法中k值的选择对于分类效果具有很大的影响.

2)每个类手动提取多个特征向量.针对四川五类古壁画图像不同的色彩表现风格,经过多方面的综合比较与分析,分量的选择如下:广元剑阁觉苑寺主壁“佛传故事画”根据图片拍摄受光情况的不同各提取3个特征数,背壁的“护法礼佛壁画”图提取1个特征数;广汉龙居寺的主壁画和背壁画各提取1个特征数;新津观音寺壁画“十二圆觉菩萨”分别从顶部、底部、中部和贴金部位各提取1个特征数,背壁的“香山全堂”的上部和下部各提取1个特征数;新繁龙藏寺主壁画和藻井壁画各提取1个特征数;蓬溪宝梵寺壁画“十八罗汉”中,根据罗汉着衣色调的差异各提取3个特征数.实验中每类图像提取了多个颜色特征,该取值能够反映出四川古壁画图像最为本质的特征,参数的选择对分类识别的准确率具有至关重要性的作用.

3.2 相似度计算

本研究采用直方图相交法进行特征向量的相似度计算.基本方法是提取待识别古壁画图像的颜色直方图,计算四川古壁画图像数据库中颜色直方图之间的距离,距离较近的就被归入同一个类别.

3.3 分类

图像分类是四川古壁画识别研究的核心部分,内容包括特征描述与分类器设计两个主要方面.由于图像特征的客观描述直接关系到图像分类的准确率,因此,确定既能够准确表达同类图像之间的相似性,又能够区分不同类图像之间差异性的特征至关重要.对于四川古壁画图像而言,颜色信息对于整幅图像可辨识度最高,研究只需在同一类别的壁画中选择出几个最具代表性的色彩特征即可.研究采用最邻近算法对壁画图像进行分类,根据数据点与特征点的相似度计算,将其归入到最为邻近的类别当中去,进而实现壁画图像的自动分类.

3.4 正确率计算

四川古壁画识别研究是在已知每个点的正确分类和分类器的分类之后,计算出分类器的正确率.分类准确率计算包括:计算正确的分类、计算错误的分类和计算正确识别率的百分比.

3.5 界面显示分类结果

为了方便用户查看系统分类的结果,本研究设计了一个古壁画分类系统显示界面,显示参数值、分类情况和分类的正确率,当我们设定好参数k值以后识别系统就会随机生成实验结果.

实验统计结果显示:当参数k值取值为最佳时,在识别系统随机生成的10次实验结果中,剑阁觉苑寺壁画最高识别率89%,最低识别率86%,平均识别正确率87%.广汉龙居寺壁画最高识别率91%,最低识别率90%,平均识别正确率90%.新津观音寺壁画最高识别率91%,最低识别率87%,平均识别正确率90%.新繁龙藏寺壁画最高识别率89%,最低识别率87%,平均识别正确率89%.蓬溪宝梵寺壁画最高识别率89%,最低识别率86%,平均识别正确率88%.四川古代佛寺壁画系统识别的平均准确率达到89%,总体上取得了较好的分类识别效果.

4 结语

四川古壁画分类识别系统研究中,由于5类壁画图像中每个类别的颜色特征都不统一,因此本研究采用选择多个特征向量来代表该类图像颜色特征的方法.在整个识别系统研究中k值的选择对分类识别准确率的提高具有决定性的作用,k值过大会出现对数据的过度拟合,过小则会导致分类识别的准确率不高,因此,存在一个最优k值确定的问题.四川古壁画识别系统中最优k值的确定,主要根据实验数据颜色空间的分布情况来决定,最后通过计算系统随机生成的多次识别结果的平均值来验证是否最优k值.针对四川的古壁画图像,实验结果表明识别系统达到了令人满意的分类效果(图8).基于颜色特征提取的四川古壁画分类识别研究是计算机模式识别技术在美术学科研究领域的一种探索与尝试,识别系统的实现可为全国壁画图像的自动识别研究提供参考.

图8 四川古壁画颜色特征提取与分类识别研究创新之处

猜你喜欢
特征向量正确率特征提取
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
个性化护理干预对提高住院患者留取痰标本正确率的影响
克罗内克积的特征向量
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
微动目标雷达特征提取、成像与识别研究进展
三个高阶微分方程的解法研究
基于两种LSTM结构的文本情感分析
生意