吴旭东 叶虹 黄毅能
摘要:本文首先提出鉴别古陶瓷的一些常见方法,分析了数据处理方法用于古陶瓷鉴定现状,然后提出了运用深度学习中的卷积神经网络算法鉴别古陶瓷,基于传统的目测法对明清古陶瓷底款进行鉴别的不足,提出了运用卷积神经网络算法对明清古陶瓷底款进行分类和模式识别,取得了良好的效果,为人工智能在古陶瓷鉴别领域的应用开辟了新的思路。
关键词:卷积神经网络;古陶瓷鉴定
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)32-0208-02
在古陶瓷的鉴定过程中,产品的断源、断代的鉴别一直是最重要也是技术难度最高的事情。自古以来才有的主要方法是“目测法”,此法主要依靠鉴定人依靠长期积累下来的经验来判断,以陶瓷的外部特征为主(如外形、纹饰、胎釉、款式等)来识别。由于受鉴别者主观判别因素影响较大,针对同一器皿,不同的人有不同的说法,可谓“智者见智,仁者见仁”。此时一种科学、规范的鉴定方法显得尤为重要了,通过古陶瓷的原材料,不同地域的原材料表现的不同化学和矿物质特征来判别是非常重要的。
近年来,随着信息技术的飞速发展,科学的数据处理分析和算法在各行各业都得到了普及。越来越多的数据处理方法在古陶瓷断源断代的研究领域中开始了应用,其中较为传统的是SVM支持向量机分类法和多元统计分析法在当今使用较为普及。而神经网络算法采用的是自动学习并且无须明确单位数学表达式的特点,在古陶瓷的研究和鉴别当中也逐渐发展起来,发展前景非常广阔。
因此,本文试图通过对青花瓷的鉴别分析,利用深度学习中的卷积神经网络算法运用于古陶瓷鉴别中,采用人工智能较流行的软件tensorflow,谷歌公司的神经网络算法,建立相应的数学模型,通过卷积神经网络算法对明清古陶瓷进行分类与模式识别,为古陶瓷的研究提供科学依据和参考价值。
1 卷积神经网络简介
1.1 边界检测示例
如果我们有一张黑白的图片,人眼看的话可以很清楚地看到人,想让计算机去搞清楚这张照片上具体有哪些物体,可以做的事情是检测图像的垂直边缘和水平边缘。
垂直边缘指图片的竖直栏杆比较清楚、明显,另外是水平的边缘指栏杆的扶把手比较清晰,把图片直观的理解转化为矩阵。假设我们有个灰度图片(黑白图片),大小为6*6像素,6*6*1的矩阵表示(如果是彩色照片,彩色有RGB三个通道,图片便会是6*6*3的矩阵)。为了检测图片的垂直边缘,可以构建一个3*3的矩阵,称为过滤器/卷积核(filer/kernel)。3*3的过滤器/卷积核对6*6图片进行卷积运算。让过滤器在图像上逐步滑动,对整个图像进行卷积计算得到一个4*4的图像/矩阵。这种卷积计算可以得到图像的边缘,6*6*1的矩阵,0表示图像暗色区域,10位图像比较亮的区域,同样用一个3*3过滤器,对图像进行卷积,卷积运算得到的图像中间亮,两边暗,亮色区域就对应图像边缘。
1.2 卷积与过滤器
常见的过滤器包括:垂直过滤器、水平过滤器、Sobel过滤器和Scharr过滤器。卷积神经网络中把过滤器当成需要学习的参数,卷积神经网络训练的目标就是去理解过滤器的参数。
Padding:假设输入的原始图像大小为n*n,过滤器大小为f*f,则输出图像大小则为(n-f+1)*(n-f+1)。这样做卷积运算的缺点有两个,一个是卷积图像的大小会不断缩小;另一个是丢掉了很多图像边缘的信息。为了解决以上问题我们就引入扩充(padding)操作,在进行卷积操作前,沿着图像边缘用0进行图像填充。对于3*3的过滤器,填充宽度为1时,能够保证输出图像和输入图像一样大。
Padding的包括Valid与Same两种模式:Valid:No padding,不进行padding操作。输入图像n*n,过滤器f*f,输出图像大小为;(n-f+1)/(n-f+1);Same:进行padding操作,输出图像和输入图像大小一致。卷积步长(strides)一般是指过滤器在图像上滑动的距离,一般为1或者2。之前的例子中,卷积步长都是1。与前面不同,我们假设卷积步长为2。
带有padding和stride进行图像卷积运算,运算后的图像大小:彩色图像(RGB)的卷积;过滤器就变为3*3*3,最后的3对应为通道数channels/深度depth。原始图片:大小为6*6,但是由于有R/G/B三种;所以图片总大小时6*6*3。
1.3 几种CNN算法
在以卷积神经网络为基础的经典算法包括Lenet、Alexnet、Googlenet 、VGG、深度残差网络和SqueezeNet模型,其中AlexNet是2012年ImageNet项目的大规模视觉识别挑战(ILSVRC)中的胜出者。AlexNet解决了图像分类的问题,输入是1000个不同类型图像(如猫、狗等)中的一个图像,输出是1000个数字的矢量。输出向量的第i个元素即为输入图像属于第i类图像的概率。因此,输出向量的所有元素之和为1。轻量化网络:SqueezeNet,以更少的参数实现AlexNet相同的精度。
2 卷积神经网络运用于古陶瓷智能鉴定
2.1 卷积神经网络运用于明清古陶瓷底款鉴定
CNN模型中最关键实现的部分是卷积模块,还包括激活、池化、全连接、Dropout等。本研究借助Tensorflow工具可以快速建立序列逐层的模型结构。
本文在数据集中提供的部分底款文字包括(主要训练验证“大”“明”“清”“康”“熙”“宣”“德”“年”“制”,汉字共九个底款),不需要区分字体。
程序过程如下:古陶瓷训练集合:2145张图片,数据集类别9类。验证集:528张图片,数据集类别9类。选择方案如下:训练样本1900张;验证样本500张;训练次数30次;批尺寸24。最终训练结果:训练集准确率87.36%,验证集准确率95.82%。通过提高训练次数与批尺寸的参数值,增加了训练的时间,同时也提高了准确率。
2.2 基于青花、粉彩、斗彩底款文字釉色分析
训练集:1679张图片,数据集类别3类。验证集:292张图片,数据集类别3类。参数初始值:训练样本1600张图片;验证样本290张图片;训练次数30次;批尺寸24。训练集中,对斗彩、青花、粉彩进行分类,对明清青花瓷底款的训练模型采用CNN原生模型,其中粉彩数据集的两个卷积特征图如图4所示。
2.3 真假特征
组合真假德、年等字明显特征,来鉴别底款文字的真假。年字特征:“年”字第四笔左斜。德字特征:一般情况下中间的一“横”会省略不写。特征十分明显,采用原生CNN算法模型,能够很好地区分釉色和真假字的鉴别。
3 结论
本文借鉴古陶瓷鉴定中比较经典的目测底款文字的方法,利用深度学习中的CNN卷积神经网络算法成功地将明、清陶瓷进行分类和训练并最终识别。实验中采用的AlexNet与SqueezeNet两种算法,均取得了不错的效果。实验表明利用卷积神经网络对明清古陶瓷底款的鉴定取得了一定的成效;虽然目前只是个初步探索阶段,但对于古陶瓷的科技鉴定来说却有这深远的影响,把古陶瓷鉴定与最近兴起的人工智能AI领域紧密地联系在一起,为当今鱼目混珠的古陶瓷鉴定的市场提供一定的科学支持。从国内外未来的发展趋势来看,人工智能将会大量应用于人类社会的各个领域,可以肯定的是古陶瓷鉴别或鉴赏这一古老的学科领域必然会出现一大批人工智能的研究成果,这样本文对于卷积神经网络应用于这一古老的学科领域具有积极的现实意义。
参考文献:
[1] 吴隽,罗宏杰,李家治.中国古陶瓷的断源断代[J].硅酸盐学报,2007,35(81):39-42.
[2] 秦讳晗,柳炳祥,彭文.一种基于粗糙集神經网络的陶瓷原料分类方法[J].陶瓷学报,2010 ,23(4):136-139.
[3] 王强.基于CNN的字符识别方法研究[D].天津师范大学,2014.
[4] 艾玉庭.景德镇青花瓷的发色及鉴别[J].中国陶瓷,2005,41(6):58-63.
【通联编辑:闻翔军】