摘 要:早期从西亚和埃及地区传入玻璃珠型饰品,而我国对古代玻璃的学习从此拉开序幕,对古代玻璃制品进行成分分析并鉴别其所处时代与来源地的工作就显得尤为重要。首先,分析玻璃制品纹理、颜色等特性与其风化的相关性,建立预测风化前成分的模型;其次,借助K-mean聚类分析将高钾玻璃分为三个亚类,将铅钡玻璃分为四个亚类,并对划分区间的合理性和敏感性进行分析;最后,采用灰色关联分析法对不同类别的玻璃样品进行化学成分关联分析,并针对其关联系数分析其化学背景及其合理性。
关键词:玻璃制品;卡方检验分析;聚类分析;灰色关联分析
中图分类号:TP39 文献标识码:A 文章编号:2096-4706(2023)14-0088-07
A Mathematical Model for Component Analysis and Identification of Ancient Glass Products
WANG Zidong
(College of Physics, Chongqing University, Chongqing 401331, China)
Abstract: In the early days, glass bead shaped ornaments were introduced from West Asia and Egypt, and China's study of ancient glass began from then on. It is particularly important to analyze the composition of ancient glass products and identify their era and source. Firstly, analyze the correlation between the texture, color, and other characteristics of glass products and their weathering, and establish a model to predict the pre weathering components; secondly, using K-means clustering analysis, high potassium glass is divided into three subcategories, and lead barium glass is divided into four subcategories, and the rationality and sensitivity of the interval division are analyzed; finally, the grey correlation analysis method is used to perform chemical composition correlation analysis on different types of glass samples, and the chemical background and rationality are analyzed based on their correlation coefficients.
Keywords: glass product; Chi-square test analysis; cluster analysis; grey relational analysis
0 引 言
自絲绸之路[1]通行之后,玻璃制品大量传入我国。早期从西亚和埃及地区传入珠型饰品,而我国对古代玻璃的学习从此拉开序幕,古代玻璃与早期传入的玻璃制品外观相似,但化学成分却有所不同。所以,对古代玻璃制品[2]进行成分分析并鉴别其所处时代和来源地的工作就显得尤为重要。
1 玻璃制品特性与其风化的相关性分析
1.1 数据的可视化分析
对玻璃制品纹理、颜色等特性数据进行可视化处理,对比各种颜色、纹理和玻璃类型与风化与否的相对关系,如图1所示。
1.2 卡方检验分析
接下来,对这些定类数据进行卡方检验分析[3],原假设为:风化与三类数据并不产生关联。只有当原假设的P≤0.05时,拒绝原假设,显示其与风化有显著性的关联。
观察表1中卡方检验的分析结果,可以得到只有玻璃类型与风化具有显著性的相关性,颜色和纹理均未显现出与风化的显著相关性。
2 风化前后的统计规律与预测还原
2.1 数据预处理
首先对玻璃制品化学成分含量数据做初步的处理(本文数据来源为2022年全国大学生数学建模赛题),筛选出其中的化学含量总和值不在85%~105%之间的数据并对其进行删除。观察表2,筛选出高钾玻璃、铅钡玻璃、风化玻璃和未风化玻璃4类玻璃,统计出各项化学含量值的均值和方差。
2.2 风化后化学成分的预测还原
根据计算得到的均值和方差做出风化前后的箱型图(误差线图),对比找出变化明显的化学含量,且这种变化不可能是由正态数据的涨落造成的。产生较大误差的箱型图如图2所示。
观察误差线图并挑选出相应的风化前后变化显著的元素含量,只需对其进行风化前的还原工作即可。对高钾玻璃来说,在此可以挑选出硅、钾、钙、铝四种主要变化的元素;对铅钡玻璃来说,在此可以挑选出硅、铅、磷、钙四种主要变化的元素。而根据初步化学知识可知,酸性环境下硅酸钙和硅酸铝会发生反应造成流失,这样的选择是符合一定的常识和化学知识的。
然后将每个玻璃类型每个化合物含量风化的数据和未风化的数据进行大小排序,并进行一一对应,得到一系列的x、y值,最后对其进行线性函数的拟合,得到风化—未风化曲线,而其中各风化的y值会对应一个还原到未风化的x值,求解关于拟合函数一系列方程的x值,就能得到还原后的未风化值。
而观察高钾玻璃四个主要变化化学量对应的点,则可以发现,其满足二次函数的变化模式,如式(1)所示:
(1)
其中,β1、β2、β3是未知参数,称为回归系数或回归参数;T表示未风化的数值,是可以测量和可控的变量,称为回归因子或预测变量;ɑ0表示响应变量。若n次观测值为Ti,i=1,2,…,n,则这n个值可以表示如下:
(2)
然后通过Matlab,运用最小二乘法算出最小二乘值和最小三个回归系数的拟合值,如图3(a)(b)(c)(d)(对应元素依次为硅、铝、钾、钙)所示。
并且得到这四条函数曲线的参数,如表3所示。
因为要检验其准确度,对其进行R2检验、误差分析,得到表4。
各类检验、误差分析等,都可以显示出拟合优度相当不错,表明曲线所表示的变化和风化前后变化几乎一致,即通过此曲线预测出的未风化值可以接受并使用。而通过这四条曲线可以得到预测结果,如表5所示。
其中预测风化前的效果相当好,合格率高达100%。
对于铅钡玻璃,也通过相同的方式进行函数的拟合和求解,由于拟合优度的需求,部分元素拟合成三次线性多项式表示其风化状况变化,如图4(a)(b)(c)(d)(对应元素依次为硅、铅、磷、钙)所示。
并且得到这四条函数曲线的参数,如表6所示。
之后检验其准确度,对其进行R2检验、误差分析,得到表7。
各类检验、误差分析等,都可以显示出拟合优度相当不错,表明曲线所表示的变化和风化前后变化几乎一致,即通过此曲线预测出的未风化值可以接受并使用。而通过这四条曲线可以得到预测结果,如表8所示。
其中预测风化前的效果很好,对于总含量在85%~105%范围的限制条件下,仅有1项预测数据不符合要求,合格率高达96.2%。但是有三个严重风化点,这些严重的风化点与一般的风化点相比,特定元素的含量尤其高,两个严重风化点的二氧化硫含量高达14%,一个严重风化点的磷含量超过10%,其二氧化硅和各元素的含量明显下降,故而如若将这些明显增加的量还原成普通风化的情况,则上述方法依旧适用,且效果良好。
3 玻璃亚类的划分
3.1 聚类模型的选择与建立
先进一步观察各项数据,对比高钾玻璃和铅钡玻璃在未风化前的化学成分差异性,对比中找到差异性较大的化学成分数据,可以发现高钾玻璃的钾含量普遍高于铅钡玻璃,铅钡玻璃中铅元素和钡元素的含量远高于高钾玻璃中二者的含量。通常,满足这两个条件即可分辨出高钾玻璃和铅钡玻璃。
而对于两种玻璃的亚类划分[4],若只是通过未风化的数据来观测亚类划分,则显得数据量太小。本文将原本风化点还原成的未风化数据纳入亚类划分之中,以此进行亚类划分的数据填充。
如果通过人工手动执行亚类划分,则会因为各人主观差异而产生较大的偏差,而且14种不同成分如若手动划分区间,则会费时又费力,最后还会因为各人主观原因而导致最终效果不够理想。故而本文采取K-mean聚类分析,通过输入超参数k种簇类进行亚类的划分,其模型算法流程图如图5所示。
然而,14维数据对于亚类划分并非都起作用,也有很大一部分因素是由于后天的微小元素交换(微弱的风化作用)而产生的,与亚类划分无关,故而选择氧化钙和氧化铝含量差别作为两者亚类划分的主要元素。
经过初步的分析和筛选,最后通过SPSS使用K均值聚类方法[5]将高钾玻璃分为3个亚类:中等钙铝、低钙低铝、高钙高铝,而铅钡玻璃则分为4个亚类:低钙低铝、中铝低钙、中钙高铝、高钙中铝。其结果的分类可视化如图6、图7所示。
可以看出,在可视化的分类上,其在每种亚类划分上还是相当显著的,分别可划分为如表9、表10所示的区间。
3.2 分类结果的合理性与敏感性分析
3.2.1 合理性分析
根据模型给出的区间划分,进一步分析各个划分的数据点,发现均包含在区间之内,划分的完成度是100%,从结果上讲是十分合理的。
从亚类划分的结果来看,明显将其划分为所规定的类数(铅钡玻璃的低钙低鋁和低钙中铝类除外),所以说此亚类划分是十分合理的。
3.2.2 敏感性分析
从数据的敏感性来说,若一个随机数据进行了5%的调整,基本上有且仅有边界值会使亚类划分改变,故而对于与本模型所使用数据相似的原始数据的变化没有敏感性,如此对于亚类划分也是比较合理的。
4 化学成分之间的关联性分析
鉴于样本数据量较少,且考虑到灰色关联分析用于确定各因素对其所在系统的影响程度,故采用灰色关联分析[6]来处理该问题。
首先选择数据量较大的化学成分作为母序列,通过观察数据可知,对于高钾玻璃,选择氧化钙、氧化铝和二氧化硅作为母序列分析与其余化学成分之间的关联程度。所含化学量数据均为百分比含量占比,故而没有单位可以直接进行处理。
定义序列:
x = (x (1), x (2), x (3), …, x (n)) (3)
映射成:
f (x (k)) = y (k),k = 1, 2, …, n (4)
均值化:
(5)
计算灰色关联度:
注意:ρ表示控制区分度的一个系数,ρ取值为0到1,ρ越小,区分度越大,一般取值0.5较为合适。
计算关联度:
(7)
选取高钾玻璃中的氧化钙为母序列,其余化学成分为特征序列,用SPSS软件计算得出关联度排名,如表11所示。
从这些关联度排名表中可以发现,高钾玻璃中钙和铝的相互关联程度均为较高水平,而通过基础的化学反应——氢氧化钙、铝和水的反应可以得到铝酸钙。
CaO + H2O=Ca(OH)2
Ca(OH)2 + 2AI + 2H2O=Ca[Al(OH)4]2 + H2-
这说明在高钾玻璃烧制的时候,有可能使用了含有石灰石和铝矾土之类的化学用品,最后产生了如上所述方程式的副反应,导致内部存在铝酸钙之类的钙铝化合物,从而提升了高钾玻璃内部的相互关联程度。
而在铅钡玻璃中,钙和镁的关联程度又较高。根据基础的化学知识可知,镁和钙广泛存在于硬水之中,形式为氢氧化镁和氢氧化钙。关联程度较高有可能来源于炼制过程,部分反应或烧制过程中使用了硬水等未提纯的水质,导致掺杂了氧化镁和氧化钙,或者是在烧制中使用了白云石CaMg(CO3)2等矿物,导致掺杂了钙镁元素[7]。
而铅钡玻璃、高钾玻璃的共同特点是硅和其内铅钡(钾)的关联程度较高,可能是由于硅熔点过高,古代人民使用助熔剂草木灰和铅矿石使其熔点降低。
5 模型的评价
5.1 模型的优点
由于针对具体问题分别选用合适的模型建模,所以模型具有以下优点:
1)每种模型的适配度都很好,如线性拟合和聚类分析的合理性和敏感性都很好。
2)考虑风化前后化学成分差异较大会造成对类别的判断错误,所以先将风化后的数据还原为未风化前的样子,之后再进行类别判断,所得出的结果也更加准确。
5.2 模型的缺点
由于专业化学知识的不足,模型也存在以下不足:
1)由于数据量较少,未风化到风化应该存在过渡区域,本文模型只是单独化为风化与未风化。
2)没有完全解释化学成分关联背后的化学知识。
6 结 论
本文通过对玻璃化学成分的分析得出以下结论:
1)通过对玻璃制品纹理、颜色等特性与其风化的相关性分析可以得出,只有玻璃类型与风化之间存在显著相关性,颜色和纹理与风化之间不存在显著相关性。
2)对风化前后变化较大的化学成分含量进行线性拟合,从而可以较为准确地预测出文物未风化前的化学成分。同时可以看出,高钾玻璃风化后硅含量升高,而铝、钾和钙的含量均降低。铅钡玻璃风化后硅含量降低,而铅、磷和钙的含量均升高。两种玻璃的其余化学成分变化则不大。
3)对于高钾玻璃和铅钡玻璃亚类的划分,采用K-means算法根据其钙铝含量的高低进行划分,得出较为合理的划分结果。
4)对于玻璃化学成分关联度的分析,可以得出钙和铝的关联度较高,硅和钾的关联度较高。
参考文献:
[1] 陈姝聿,侯志力.浅析古代丝绸之路和中国古代玻璃 [J].中国民族博览,2019(5):87-88.
[2] 刘淑娜.中國古代北方游牧民族玻璃器研究 [D].呼和浩特:内蒙古师范大学,2022.
[3] 赵晨飞.基于谱特征分析和卡方检验的特征选择方法研究 [D].天津:天津师范大学,2019.
[4] 邓晋福,刘翠,狄永军,等.英云闪长岩-奥长花岗岩-花岗闪长岩(TTG)岩石构造组合及其亚类划分 [J].地学前缘,2018,25(6):42-50.
[5] 何选森,何帆,徐丽,等.K-Means算法最优聚类数量的确定 [J].电子科技大学学报,2022,51(6):904-912.
[6] 张文新.灰色关联分析及应用实例 [J].军民两用技术与产品,2017(18):203.
[7] 李盈理.10至12世纪中国出土玻璃器研究 [D].大连:辽宁师范大学,2021.
作者简介:王子东(2001—),男,汉族,山西大同人,本科在读,研究方向:电子科学与技术。