徐美蝶,宋华玲,麦智强,祖恩东
(1.昆明理工大学 材料科学与工程学院,云南 昆明 650093;2.梧州学院 宝石及艺术设计学院,广西 梧州 543003;3.黄埔海关技术中心,广东 广州 510700)
软玉又称“和田玉”,其主要矿物成分为透闪石、阳起石。软玉在中国有上千年的开采历史,最负盛名的产地是新疆,而新疆软玉资源枯竭现状与市场对软玉需求加大的矛盾日益凸显。近年来,陆续发现的软玉矿床极大缓解了这一矛盾,目前出产软玉的地区有中国新疆、青海、贵州罗甸、江苏溧阳、广西、台湾及俄罗斯、韩国、加拿大等,而现行国家珠宝玉石标准命名(GB/T 16553-2017)将透闪石-阳起石类矿物集合体统称为“和田玉”,“和田玉”不再是产地的代表而成为了软玉的代名词。“和田玉”在市场上有“产地溢价”的说法,部分商家为了利益谎报软玉产地信息,这给软玉市场带来一定程度的混乱,同时损害了消费者利益。因此,对软玉产地加以科学准确地区分具有重要现实意义。
宝石学研究表明,不同产地的宝玉石由于其成矿环境的不同导致化学成分和结构存在细微差异,可通过测试分析微量成分的种类与含量对其产地进行识别[1-2]。但有的产地因为成矿环境和地域上的相近,仅靠化学成分或结构上的微小差别并不能有效区分软玉产地,因而有部分学者通过分析不同产地软玉的光谱学、微量成分等数据,并结合化学计量学、模式识别算法、太赫兹光谱技术等判别软玉产地。钟友萍等[3]采用LA-ICP-MS 等测试方法,对不同产地软玉进行稀土元素组成测试,利用方差分析等统计方法对国内软玉产地判别进行探索。江翠等[4]采用常规宝石学测试和现代谱学仪器,对比研究广西大化和贵州罗甸软玉的光谱学特征和化学成分,研究结果表明,利用稀土元素特征值的差异,结合产地示踪树状图,可区分两个产地的软玉。陈全莉等[5]对新疆和辽宁岫岩软玉进行X 粉晶衍射分析,研究结果发现不同种类软玉的衍射峰形及强度可在一定程度反映软玉的质地。赵虹霞等[6]利用拉曼光谱技术结合质子激发X 射线荧光(PIXE)和X 射线衍射对不同出土古代玉器进行透闪石型软玉的矿相标定,说明拉曼光谱在玉器结构测试和材质鉴定中具有可行性。王亚军等[7]采用激光诱导击穿光谱(LIBS)技术结合偏最小二乘判别分析(PLS-DA)研究白色软玉产地。谷岸等[8]尝试利用近红外光谱结合化学计量学判别分析手段鉴定白色软玉产地,结果表明,此方法可用于软玉文物的产地鉴定。徐荟迪等[9]利用拉曼光谱结合马氏距离和随机森林判别方法可对软玉进行产地鉴别。杨婷婷等[10]利用太赫兹光谱技术对白色软玉产地进行研究,结果表明不同产地软玉太赫兹特征吸收峰的存在形式不同。
本文在前人研究基础上,以中国罗甸、青海、新疆及韩国青玉为主要研究对象,从无损检测鉴定的角度出发,尝试借助傅里叶变换红外光谱仪收集青玉样本的近红外光谱数据,结合多种化学计量学方法,包括系统聚类分析、主成分分析、Fisher 判别分析、人工神经网络分析,通过建立鉴别模型而区分青玉产地,旨在探究一种具有高准确率对青玉产地无损鉴别的方法,为矿物产地鉴定提供一种新思路,同时填补利用化学计量学方法鉴别青玉产地的空白。此外,近红外光谱技术是一种操作便捷、效率高效的分析方法,是宝玉石无损鉴定的重要手段,结合化学计量学分析方法有效鉴别青玉产地,可行性较高,具有广阔的市场应用前景。
傅里叶变换红外光谱仪:德国布鲁克(Bruker)TENSOR27。测试条件:扫描范围4000~8000cm-1,扫描次数16次,分辨率4 cm-1,频率2.2 HZ,探测器类型DTGS。
实验样品为中国罗甸、青海、新疆及韩国青玉,罗甸、青海青玉样品为实地采购,新疆、韩国青玉来源于市场,共计样本49块,样本基本信息如表1所示。
Table 1 Basic information of samples表1 样本基本信息
将样品表面粗抛光采用近红外反射法测量、采集样本数据;使用Origin 8.5 软件作图、基线校正、多峰拟合获取峰面积(选4900~7300 cm-1波段的峰进行拟合);结合统计软件SPSS 25.0对数据进行统计分析。
各产地青玉的近红外光谱如图1 所示。近红外光谱应用于矿物主要反映矿物中水分子、羟基等相关的吸收,本文着重分析不同产地青玉近红外4900~7300cm-1波段光谱,目的在于提取青玉中吸附水、羟基与金属阳离子结合的吸收峰数据,便于分析比较。5100 cm-1附近归属于水分子振动,7040 cm-1为OH 的一级倍频吸收峰,7182、7150、7118、7080 cm-1为金属阳离子M 与-OH 结合而生产的吸收,该位置的吸收与软玉矿物组成结构中M1、M3位置上的阳离子发生类质同象替代相关[11],该组吸收分别归属于(Mg2+、Mg2+、Mg2+)OH、(Mg2+、Mg2+、Fe2+)OH、(Mg2+、Fe2+、Fe2+)OH、(Fe2+、Fe2+、Fe2+)OH 伸缩振动的一级倍频,6831 cm-1附近的吸收带为水分子振动的二级倍频与合频。
Fig.1 Near infrared spectra of cyan nephrite from different origins图1 不同产地青玉的近红外光谱
罗甸软玉样品(DQ 谱带)在目标波段中的吸收相对较强,5100、6831 cm-1位置与吸附水相关的吸收峰强于青海、新疆、韩国等地的青玉,推测为罗甸青玉矿物晶粒间隙中吸附水振动所致,且吸附水含量相对较高。罗甸玉成矿并非是富含成矿物质的主岩浆直接作用的结果,而与岩浆后期汽水热液与其原岩持续的交代反应直接相关[12],这恰好解释了罗甸玉矿物中含量丰富的吸附水来源。近红外光谱可作为罗甸青玉产地定性分析的有效手段,由其矿物成因推测此鉴别方法同样适用于罗甸其他颜色软玉,可作为罗甸软玉产地鉴别的一种手段。青海、新疆、韩国青玉的近红外光谱较为相似,可定性分析软玉矿物,但不足以表征其产地信息。
本文利用Origin 8.5 软件处理样品近红外光谱的原始数据得到5000±、5128±、5230 ±、6831 ±、7038、7053、7076、7099、7118、7150、7182 cm-1(±5)11 个位置的峰面积(5100 位置附近的吸收宽带分峰拟合为5000±、5128±、5230 ± 3 个峰),利用SPSS 25.0 软件中的不同程序对各样品的谱峰面积数据进行统计,为青玉产地鉴别提供更为客观的依据。
2.2.1 基于系统聚类分析法建立青玉产地鉴别模型
系统聚类是通过合并相近程度最高的两簇成一个新簇,不断重复此过程直到所有个体都归为一个簇的方法[13]。本实验聚类分析法的类间距离,方法选用组间连接法,定义样品间距离选用欧式距离,结果如图2所示。
Fig.2 Systematic cluster analysis of cyan nephrite from different origins图2 不同产地青玉系统聚类分析
并类距离为2 时可有效分离出新疆青玉,距离为12时,分离出罗甸青玉,当并类为7 时,韩国青玉大部分样品聚为一类,个别样品的分类出现误差;青海青玉在距离为2时聚成两类,为3 时与新疆青玉并为一类,此方法无法分离青海青玉样品。
2.2.2 基于PCA—非参数检验法建立青玉产地鉴别模型
主成分分析是利用降维思想,在损失很少信息的前提下将多个指标转化为几个综合指标的多元统计方法[14],通常将转化后的综合指标称为主成分。非参数检验则主要解决样本间是否有相同分布的问题。主成分分析选择4个主成分因子,特征根>0.5,为了更好地解释变量,将提取的因子载荷矩阵实施方差最大化正交旋转,结果如表2所示。
Table 2 Total variance explained by each component表2 各成分解释总方差
累积方差贡献率为92.519%,理论上能客观反映样品原始数据的主要信息。各主成分因子得分分别记为PC1、PC2、PC3、PC4,结合非参数K 个独立样本检验(选用Kruskal-Wallis H 方法效果最佳)对主成分进行分析,结果表明PC1、PC2、PC3 间具有极显著差异(p<0.01),利用PC1、PC2、PC3 数据生成二维散点图(以PC1 为X 轴、PC2 为Y 轴的图像效果最佳,见图3),以便直观反映各产地青玉分布情况。
Fig.3 2D scatterplots of PCA图3 主成分分析法——二维散点图
由图3 可知,各产地青玉的散点分布有相对明显的区别,罗甸青玉主要分布的趋势线独立且明显,为y=1.14+0.57×x(相关系数R2为0.928);韩国青玉主要在罗甸青玉区域上方偏右的位置,密集分布;新疆青玉分布的趋势线y=-2.6+2.41×x(R2=0.959),青海青玉趋势线y=-1.86+2.15×x(R2=0.737),青海青玉与新疆青玉的趋势线相对接近,产地区分的临界点不显著,该方法能够鉴别本实验样本产地,推测可用于实际批量检测中,但因为实验样品不充分,该方法存在误差隐患。
2.2.3 基于人工神经网络建立青玉产地鉴别模型
为了得到更理想的结果,本研究使用人工神经网络建模对数据进行处理。人工神经网络模型是一种使用类似神经突触连接的构造以完成数据处理的数学模型,具有学习和自我适应能力,能够通过预先给定的输入输出数据,自我分析两者间的映射关系,并根据这些关系,针对验证集得出对应的输出结果[15-16]。对于人工神经网络与Fisher判别,为了方便建模,设置分类1、2、3、4 分别代表DQ、IX、HY、JN。
本文选用的建模方法为多层感知器,选择10 个隐藏层,隐藏层激活函数为双曲正切函数,其他参数默认设置。选取产自中国新疆、青海、贵州罗甸及韩国的49 个青色软玉样品作为样品集,训练集与验证集数目相对于各产地的样品,分别设置为样品集的70%与30%,从样品集中随机抽取32 个样品作为训练集,用于建立人工网络判别模型,剩余17 个样品作为验证集,用于检验识别模型预测效果。判别模式预测结果如表3 所示,对训练集与验证集的判别率均为100%,可以得出人工神经网络能有效区分青玉产地。
Table 3 Prediction of training and verification set by Fisher discriminant model表3 用Fisher判别模型预测训练集与验证集
2.2.4 基于Fisher判别法建立青玉产地鉴别模型
Fisher 判别分析的原理是根据训练集中筛选出能提供较多信息的变量并寻找最优判别函数,根据函数判别未知类别(检验样本)的数据信息并分配到已知类别中[15,17],判别分析具有回判的能力,能对已分类样品信息进行回判,指出其准确率。本实验基于Fisher 判别法建立的线性函数分别为式(1)—式(4),将各变量分别代入计算F(DQ)、F(IX)、F(HY)、F(JN)(实际表示各样品的具体空间位置),判断各样品空间位置与质心位置的距离,距离最小者则判别为该类样品,故而分类。回判即对已判好的样品重新计算分类,判别结果如图4 所示,训练集与验证集的判别准确率均为100%,该模型能有效对青玉产地进行定性分析。
Fig.4 Fisher discriminant function graph图4 Fisher(典则)判别函数图
目前,主要从化学成分及结构上,结合中红外光谱和拉曼光谱等对不同产地软玉进行鉴别,但部分软玉的特征因为成矿环境相似,导致它们的成分结构、谱学特征并没有很大差别,同时由于取样会损坏样本、成分分析复杂等问题限制,难以广泛应用于海关中对某些高值产品快速有效的产地溯源,需寻找能够快速有效对不同产地软玉鉴别的新方法。
采用近红外光谱技术测试分析中国罗甸、青海、新疆及韩国4 个产地青玉的近红外光谱,选择 4900~7300 cm-1波段的吸收峰进行多峰拟合获取峰面积数据,结合系统聚类分析、主成分分析、人工神经网络分析、Fisher 判别分析等化学计量学手段建立青玉产地定性鉴别模型,结果表明:
(1)罗甸青玉近红外光谱5100cm-1、6831cm-1位置与吸附水分子有关的吸收宽带,明显区别于其他产地青玉,近红外光谱可作为罗甸软玉产地鉴别的有效手段。
(2)人工神经网络、Fisher 判别分析方法对青玉产地定性分析,判别准确率达100%,均能快速、有效地识别青玉产地,这两种方法均能为青玉产地无损鉴别提供新的思路。
基于处理后的近红外光谱数据,结合人工神经网络、Fisher 判别分析方法建立青玉产地鉴别模型,人工神经网络是通过反复训练学习进行鉴别的算法,具有准确率高、多层感知进行误差判别等优点,但其预测准确度可能会因为样品数量的不足而降低,此方法可以有效实现青玉的产地鉴别,说明用于产地鉴别具有可行性,可为不同产地多种宝玉石的无损检测、快速鉴别提供一种新的思路。此外,建立大量多种产地品种软玉的近红外光谱数据库和判别模型具有广阔的应用前景和巨大的市场价值。