邢彦军 高若阳 张玲 陶芬 刘一 邓彪
1(上海理工大学 上海 200093)
2(中国科学院上海应用物理研究所 上海 201800)
3(中国科学院上海高等研究院 上海同步辐射光源 上海 201204)
4(中国科学院大学 北京 100049)
基于同步辐射的全场透射显微镜(Transmission X-ray Microscope,TXM)是一种可无损研究物质内部结构且具有纳米分辨的成像技术[1-3],在纳米材料、地球科学和新能源等领域得到广泛的应用[4-5]。透射X射线显微镜工作原理与光学显微镜类似:X射线束聚焦在样品上,透射的X射线被用作物镜的菲涅耳波带片放大,探测器接收经放大后的图像。随着高亮度、高性能同步辐射光源的发展,基于同步辐射的TXM成像技术获得了快速的发展,结合X射线谱学技术,可以实现样品中感兴趣的化学元素的元素分布和价态分布的成像研究[6]。
X射线吸收精细结构(X-ray Absorption Fine Structure,XAFS)是一种基于同步辐射X射线源发展的光谱分析方法,XAFS在近十几年来迅速发展,已经成为材料科学研究中不可或缺的表征手段,在材料科学[7-8]、环境科学[9]和能源领域[10]等广泛应用。XAFS分为X射线吸收近边结构(X-ray Absorption Near Edge Structural,XANES)和扩展X射线吸收精细结构(Extended X-ray Absorption Fine Structure,EXAFS)。现在XANES谱图的解析主要集中在边前峰上,XANES的边前峰可以给出配位结构信息,而吸收边对应的吸收阈值可反映元素的氧化态。因此,通过分析X射线近边吸收谱的能量位置、吸收峰的形状和强度等特征,可以实现有关化学元素和价态的分析[11-13]。
基于同步辐射的全场纳米谱学成像(TXMXANES)是将TXM与XANES方法有机结合的成像方法,利用特定元素对X射线能量的不同响应特性,获得样品内部对应元素的化学价态分布信息。TXM-XANES所获取的数据结构可以看作一系列具有空间分辨的X射线吸收谱,也可以被当作是一系列具有能量分辨的X射线图像。全场纳米谱学成像与CT技术的结合,可以获得样品中特定元素的三维价态空间分布信息[14-17]。上海光源纳米三维成像线站(BL18B)已建立TXM-XANES方法并对用户开放[18],该技术已逐渐成为能源材料、纳米材料研究的重要实验方法。
纳米三维成像线站(BL18B)是上海光源线站工程建设内容之一,能量范围为5~14 keV。主要实验方法包括TXM、纳米CT和全场纳米谱学成像。纳米三维成像光束线采用柱面准直镜、双晶单色器和超环面聚焦镜设计方案。实验站采用自主研制的TXM系统,实验线站整体布局如图1(a)所示,主要设备包括单毛细管椭球聚焦镜(Monocapillary Condenser)、针孔(Pinhole)、样品台(Sample Stage)、波带片(Zone Plate,ZPs)、成像探测器等,实验站照片如图1(b)所示。2021年上海光源BL18B线站完成带光调试与性能测试,实现了优于20 nm分辨率的TXM成像,2022年该线站已正式对用户开放使用。
图1 上海光源纳米三维成像实验站BL18B示意图(a)和现场照片(b)Fig.1 Schematic of SSRF BL18B end station (a) and field photograph (b)
全场纳米谱学成像结合了TXM和XANES两种实验方法,能够获得样品中特定元素的化学价态分布信息,我们基于上海光源BL18B光束线站建立了TXM-XANES方法。常规TXM-XANES数据采集和处理流程如图2(a、b)所示,首先调节单色器,针对特定元素的吸收边设置起始能量点E0,通过调节样品、波带片及探测器的相对位置采集一幅E0下的TXM图片,随即将样品移出视场,采集一幅E0下的样品背景图片;然后改变光束线能量为E0+ΔE,计算波带片移动距离并将波带片移至相应位置,采集E0+ΔE下的TXM图片,随即将样品移出视场,采集一幅E0+ΔE下的样品背景图片;重复上述操作,在特定元素吸收边前边后分别采集一系列不同能量点的TXM图像和样品背景图像。TXM-XANES数据处理时,不同能量下的系列投影图像扣除背景图像,提取该系列投影图像上指定区域的灰度信息,获得具有空间分辨的XANES数据。通过数据拟合和图像处理,最后可以获得样品纳米分辨的化学分布信息。
图2 常规TXM-XANES方法图示 (a) 数据采集流程图,(b) TXM-XANES数据处理流程示意图Fig.2 Illustration of conventional TXM-XANES method
常规TXM-XANES数据采集方法需要采集每个能量点下的图像和背景图像,采集时间长、数据量大,纳米尺度下,由于机械结构的不稳定和样品的移动会对TXM-XANES分析产生一定的影响。
本文提出一种基于机器学习、多项式回归与线性插值运算模型生成背景图像序列的方法,基于已知数据,利用多项式回归和线性插值技术建立图像灰度值、像素点、能量等相关特征之间复杂线性关系的预测模型,实现了仅通过两张谱学背景图像完成背景图像序列预测建模。相对于常规的TXMXANES数据采集方法,该方法具备数据量少、采集时间短等优势,可显著提升TXM-XANES效率。
回归分析(Regressive Analysis,RA)是机器学习中的一种监督学习方法,是一种用于时间序列建模、预测的机器学习技术,主要功能是建模和分析变量之间的关系[19]。多项式回归是一种处理非线性数据的回归模型。多项式函数是一种由常数与自变量X经过有限次乘法与加法运算得到的函数,可以通过变量转换为多元线性回归问题来解决。多项式回归的关键在于为数据添加了原有特征多项式的组合形式的新特征,通过采用这种方法解决非线性问题。多项式回归技术被广泛应用于图像去噪、平滑以及图像序列像素值预测等任务中,多项式回归能够通过拟合像素值与其他相关特征(如位置、颜色等)之间的复杂线性关系,从而实现像素值的预测。
图像插值算法是视频编码中的关键技术[20],能够在图像帧间预测中起到重要作用,用来生成预测帧的像素值,从而减少视频数据的存储和传输量。双线性插值是线性插值在二维时空的推广[21],双线性插值的算法原理是在水平、垂直两个方向上共做了三次线性插值,定义了一个双曲抛物面与4个已知点拟合,具体操作为在x方向上进行两次线性插值计算,然后在y方向上进行一次线性插值计算。
f(x,y)为二元函数,已知f(x0,y0)、f(x0,y1)、f(x1,y0)、f(x1,y1) 4点灰度值,首先在x方向上进行两次线性插值,得到:
再在y方向上进行两次线性插值,得到:
综合起来,就是双线性插值的结果:
在式(4)中,将待求像素点的灰度值f(x,y)通过周围4点的像素值在x、y方向上通过加权方式计算。图像插值算法相当于一种图像低通滤波器,但由于TXM-XANES背景图像数据通常具备少量高频信息,故双线性插值算法可提升灰度值预测速度。
为实现只采集首尾两张背景图像实现TXMXANES序列背景预测,基于上海光源纳米三维成像线站采集的TXM-XANES图像数据建立了训练集和测试集,训练集用于建立多项式回归模型,测试集用于评估和优化模型。
算法模型流程如图3(a)所示,总体模型结构设计见图3(b)。具体步骤如下:
图3 (a) 算法模型流程,(b) 总体模型结构设计示意图Fig.3 (a) Workflow of algorithm model process, (b) Diagram of overall model structure design
1) 首先裁剪训练集和测试集图像至相同尺寸,将图像序列分为首尾和中间两部分,分别作为训练数据和测试数据的输入和输出。
2) 针对每个图像序列中像素点,提取其在图像序列中的首尾位置灰度值作为输入特征,将图像序列中间灰度值作为输出特征。
3) 针对图像中每个像素点,利用多项式回归算法拟合输入特征和输出特征之间关系建立多项式回归模型,选择合适的多项式阶数在拟合过程中平衡模型的复杂度和对数据的拟合能力,使用最小二乘法最小化拟合误差来评估多项式系数。最后将测试集数据的输入特征和输出特征,输入已拟合完成的多项式中进行微调和优化。
4) 基于训练好的多项式回归模型D,根据首尾图像的灰度值和位置信息,逐像素点进行图像灰度值预测,引入插值算法提升灰度值预测速度。
改进的TXM-XANES数据采集流程如下,首先调节单色器,针对特定元素的吸收边设置起始能量点E0,将样品移出视场并采集一幅E0下的样品背景图片,通过调节样品、波带片及探测器的相对位置采集一幅E0下的TXM图片;然后改变光束线能量为E0+ΔE,计算波带片移动距离并将波带片移至相应位置,采集E0+ΔE下的TXM图片;重复上述操作,在特定元素吸收边前后采集一系列不同能量点的TXM图像;最后将样品移出视场并采集一幅Eend下的样品背景图片。
改进TXM-XANES数据流程处理时,首先将首尾能量下的背景图像输入多项式回归模型中,预测样品在不同能量下的一系列背景图像;不同能量下的系列投影图像扣除背景图像,提取该系列投影图像上指定区域的灰度信息;后续处理与常规TXMXANES数据处理流程一样,最后得到样品的化学分布信息。
采用标样和电池材料作为实验样品。标样为Ni和NiO两种粉末(上海麦克林生化科技股份有限公司提供,规格型号为:N814638-1g、N814702-2g)。两种电池材料样品为分别为高镍三元正极材料LiNi0.8Co0.1Mn0.1O2(NCM811)原始颗粒和经放电循环后的颗粒(由广东科路得新能源科技有限公司提供)。
基于上海光源纳米三维成像实验站,利用TXM-XANES方法对4种样品进行TXM-XANES实验表征。TXM-XANES数据采集时,能量扫描范围为8 200~8 595 eV,分成5个能量段采集,单幅曝光时间为5 s。在8 200~8 250 eV、8 455~8 595 eV能量段以10 eV为步长分别采集6、15个数据点;在8 250~8 315 eV、8 365~8 455 eV能量段以5 eV为步长分别采集14、19个数据点;在8 315~8 365 eV能量段以1 eV为步长采集51个数据点,共105个能量点。常规TXM-XANES方法分别采集每个能量下样品的投影和背景两幅图像,共计210幅图像;改进的TXM-XANES方法只采集首尾能量下的两幅背景图像和每个能量下样品的投影图像,共计107幅图像,然后利用多项式回归插值模型生成背景序列。最后利用斯坦福光源的TXM-wizard软件[22]对两种方法获得的全场纳米谱学成像数据进行处理。
采用峰值信噪比(Peak Signal Noise Ratio,PSNR)和结构相似性指数(Structure Similarity Index Measure,SSIM)评价改进的TXM-XANES方法得到的图像。一般认为PSNR指标越高,图像质量越好,当PSNR介于30~40 dB之间表示图像质量良好、细节清晰、失真较小;当PSNR高于40 dB时说明图像质量极好、几乎无失真[23]。PSNR具体计算公式如下:
式中:MAXI是表示图像中最大像素值;MSE是原始图像与处理图像之间均方误差。
SSIM用于衡量原始图像与重建图像之间结构相似程度,通过比较两幅图像的亮度、对比度和结构上的相似性来计算得到一个0~1之间的数值,其值越接近1表示两张图片结构相似度越高[24]。SSIM具体计算公式如下:
式中:x和y分别表示对比的图片;μx和μy分别表示x和y的均值;μ2x和μ2y分别表示x和y的方差;σxy为x和y的协方差;C1和C2是自定义的常数。
训练数据集源于上海光源纳米三维成像线站(BL18B)采集的不同能量下的背景数据,图像采集能量范围为8.2~8.6 keV,背景图像尺寸为428×352像素,单次曝光时间为5 s,共计840张背景数据。基于上述840张训练数据集,本研究分别进行100次、500次、1 000次和2 000次训练研究,经过500次训练后重构背景图像精确且稳定,经过1 000次训练后,开始出现过拟合情况,高于1 000次训练后的重构背景图像精确率因过拟合而持续下降。训练1 000次共耗时11.25 h。本次实验的计算机硬件环境:中央处理器(Central Processing Unit,CPU)型号Intel Xeon W-2245,内存256 GB,显卡为NVIDIA Quaro5000,16 GB显存,编译环境为Python 3.8。
针对4种样品分别采用常规和改进的TXMXANES方法,获取了8套TXM-XANES数据,实验结果如图4~7所示,分别为样品TXM投影图、二维能量分布图和样品整体(区域1)、随机点(区域2)及局部(区域3)提取的XANES谱。
图4 Ni粉标样TXM-XANES实验结果(a) TXM投影图,(b) 常规TXM-XANES方法获得二维能量分布图,(c) 改进TXM-XANES方法获得二维能量分布图,(d) 区域①XANES谱,(e) 随机点②XANES谱,(f) 区域③XANES谱Fig.4 Experimental results of TXM-XANES for Ni standard powder sample(a) TXM projection, (b) 2D energy distribution map obtained by conventional TXM-XANES, (c) 2D energy distribution map obtained by improved TXM-XANES, XANES spectra of region ① (d), random points ② (e), and region ③ (f)
图5 NiO粉标样品的TXM-XANES实验结果(a) TXM投影图,(b) 常规TXM-XANES方法获得二维能量分布图,(c) 改进TXM-XANES方法获得二维能量分布图,(d) 区域①XANES谱,(e) 随机点②XANES谱,(f) 区域③XANES谱Fig.5 Experimental results of TXM-XANES for NiO standard powder sample(a) TXM projection, (b) 2D energy distribution map obtained by conventional TXM-XANES, (c) 2D energy distribution map obtained by improved TXM-XANES, XANES spectra of region ① (d), random points ② (e), and region ③ (f)
图6 原始NCM811样品TXM-XANES实验结果 (a) TXM投影图,(b) 常规TXM-XANES方法获得二维能量分布图,(c) 改进TXM-XANES方法获得二维能量分布图,(d) 区域①XANES谱,(e) 随机点②XANES谱,(f) 区域③XANES谱Fig.6 Experimental results of TXM-XANES for pristine NCM811 particle sample(a) TXM projection, (b) 2D energy distribution map obtained by conventional TXM-XANES, (c) 2D energy distribution map obtained by improved TXM-XANES, XANES spectra of region ① (d), random points ② (e), and region ③ (f)
图7 循环后NCM811样品TXM-XANES实验结果(a) TXM投影图,(b) 常规TXM-XANES方法获得二维能量分布图,(c) 改进TXM-XANES方法获得二维能量分布图,(d) 区域①XANES谱,(e) 随机点②XANES谱,(f) 区域③XANES谱Fig.7 Experimental results of TXM-XANES for cycled NCM811 particle sample(a) TXM projection, (b) 2D energy distribution map obtained by conventional TXM-XANES, (c) 2D energy distribution map obtained by improved TXM-XANES, XANES spectra of region ① (d), random points ② (e), and region ③ (f)
实验结果表明,改进的TXM-XANES方法得到二维能量分布图与常规TXM-XANES方法得到的结果吻合度很高,同时,两种方法提取的样品相同部位的XANES谱基本一致。
随机抽取通过背景建模得到的5幅背景图像,基于实际采集的背景图像计算SSIM和PSNR值,结果如表1所示。5张图像的SSIM值分布在0.979~0.986之间、PSNR分布在30~44之间。采集图像时存在采集条件和传输过程的不可控性,故在部分图像数据中存在微弱失真,但大部分试验结果的PSNR高于40 dB。结果表明根据本文提出的模型可以较为精确地预测全场纳米谱学成像背景图像。
表1 背景图像预测评价指标值Table 1 Background-image prediction of evaluation index values
表2为采用改进的TXM-XANES方法得到的二维能量分布图像的SSIM和PSNR值,SSIM值分布在0.982~0.985之间,PSNR值均在41以上。结果表明改进的TXM-XANES方法得到的二维能量分布图像与常规方法得到的图像基本一致。
表2 改进TXM-XANES方法二维能量分布图评价指标数据Table 2 Improvement in evaluation index data of two-dimensional energy distribution diagram using TXM-XANES method
图8为改进的TXM-XANES方法得到的Ni/NiO标样及NCM811颗粒整体的XANES,通过对比吸收谱曲线可以实现对样品中Ni元素的价态进行定性分析,结合二维能量分布图像可以得到样品中Ni元素化学态的空间分布,对推动材料科学等相关领域的研究具有重要的价值和意义。
图8 Ni、NiO标样(a)和NCM811颗粒(b)两种方法获得的吸收谱线对比图Fig.8 Comparison of spectra obtained by XANES method for Ni/NiO standard sample (a) and NCM811 particles (b)
很多应用场景对TXM-XANES成像的实时性要求较高,同时图像预测的速度是衡量方法适用性的重要指标。本次实验常规TXM-XANES采集数据时间为24 min,改进TXM-XANES数据采集时间为10 min,实验效率提升了64%。原始数据为像素尺寸为428×352的图像序列,基于CPU的背景建模时间为5 s。图像建模预测时间可线下进行,对TXM-XANES实验数据采集影响不大。
TXM-XANES是一种先进的谱学成像技术,可获得样品化学态在纳米尺度上的空间分布信息。基于上海光源(Shanghai Synchrotron Radiation Facility,SSRF)纳米三维成像线站(BL18B),将高分辨率、穿透性强的硬X射线TXM成像方法与X射线吸收近边结构(XANES)方法结合,实现了TXMXANES成像。针对目前存在的数据采集时间长,实验效率低的问题,本文通过采用机器学习建立像素值与位置、颜色等相关特征之间复杂线性关系的模型,利用两张TXM-XANES背景图像进行全序列背景预测,实现了整个背景图像序列的快速预测。通过Ni/NiO标样和NCM811电池颗粒的TXMXANES实验,验证了该方法的可行性。实验结果表明,相对于常规的TXM-XANES数据采集模式,该方法具有数据量少、采集时间短等优势,可显著提升TXM-XANES方法的实验效率。
作者贡献声明邢彦军负责实验的设计、实验数据的收集、文章的起草和最终版本的修订;高若阳负责数据的整理、文章最终版本的修订;张玲负责文章最终版本的修订、项目的监督和管理;陶芬负责实验的设计、数据的整理;刘一负责最终版本的修订;邓彪负责研究的提出及设计、项目的监督和管理、最终版本的修订。