张子缓 刘凤娇,2 郑凤英 骆嘉燚 黄昭景 梁洁玲郑静茵 黄倩燕 李顺兴*,2
1(闽南师范大学化学化工与环境学院, 漳州 363000)2(现代分离分析科学与技术福建省重点实验室, 污染监测与控制福建省高校重点实验室, 漳州 363000)
生物硫醇包括半胱氨酸(Cys)、同型半胱氨酸(Hcy)和谷胱甘肽(GSH)等,在人体生理和病理过程中起着重要作用,其含量水平反映了人体内循环稳态。尿液中Cys 含量与癌症以及结石性胱氨酸尿有关[1],Cys 浓度过高有罹患肝胱氨酸尿病风险[2];尿液中Hcy 含量超出一定范围则可能与肾脏和血管疾病相关[3];GSH 稳态的变化与神经退行性疾病、衰老、HIV 感染、囊性纤维化和癌症相关联,Hcy 参与很多生理过程[4-5]。因此,检测这些生物硫醇对于日常居家健康监测和疾病预诊具有重要意义。
目前,尿液中生物硫醇的测定方法包括高效液相色谱法[6]、荧光分光光度法[3,7-14]、电化学方法[1,15]、免疫法[16-17]和纸基微流控比色法[18]等。高效液相色谱法和荧光分光光度法需昂贵大型仪器,操作和携带不便,检测时间长;电化学方法检出限低,但不稳定;免疫法价格昂贵、操作检测复杂,不适合非专业人使用;纸基微流控比色法不稳定,测试误差大。传统比色法通常使用人眼识别和欧式距离(Euclidean distance,ED)法检测,易受人为因素影响和环境噪声干扰,待测样品的颜色特征易产生波动,即使同一样品的图像,不同位置色差也会很大,特别是边缘和中心色块均匀性不一致,这归因于不同人操作及样品渗透速度的差异性,材料不均匀性不可避免地导致光散射差异,引起测量结果变异。因此,亟需一种适合居家使用的成本低、检测快、易操作、精度好和准确率高的与生物硫醇相关的疾病预检方法。
采用静电纺丝技术制作的纳米纤维膜已被用于制作如智能垫子、催化支架、过滤膜、能量存储/传统组件、电气器件和生物医学支架等,在基于比色法的分析检测中取得了良好的效果[19]。机器学习的模型得益于全样本图像表征和强大的特征提取能力,可基于此优化比色传感器的检测精度和灵敏度,已经成功应用于溶解铁形态分析及生物利用性评价[20]和食品中的亚硝酸盐浓度的测定[21]等,用户使用时结合开发的智能手机APP,采用手机拍照,按照APP 页面提示操作即可获取测试结果[22]。Ortenzi 等[23]通过人工智能(卷积神经网络(Convolutional neural networks,CNN))算法,使用RGB 图像分析对奶牛粪便的主要特征如pH 值、颜色和一致性进行了分类和评估。
新型硫醇显色剂Zincon-Zn2+络合物对巯基有特异性响应,其络合平衡常数(K=1.01×107)远小于巯基-Zn2+络合物(K=4.10×1011)。当存在硫醇时,Zincon-Zn2+会发生Zn2+的解离与络合反应,因此可根据试纸颜色变化来定量分析尿液中的生物硫醇含量[24-25]。本研究以聚丙烯腈(Polyacrylonitrile,PAN)、薄层层析硅胶(Silica gel,SG)和聚乙烯吡咯烷酮(Polyvinyl pyrrolidone,PVP)为载体,采用静电纺丝技术将显色剂均匀嵌进纳米纤维膜中,采用比色法检测生物硫醇,并与CNN 结合,构建了生物硫醇全分析系统,具有准确率高、检出限低、使用期限长和简易便携等特点,可用于疾病的无创预诊。
LN-01C 静电纺丝仪(绿纳科技有限责任公司);Zeiss Sigma 300 扫描电子显微镜(德国卡尔蔡司公司);IJ-6B 磁力搅拌器(金坛市新航仪器厂);UV-5800PC 紫外-可见分光光度计(上海元析仪器有限公司);BS 124S 电子天平(北京赛多利斯仪器系统有限公司);带平面标准光源(定制)。
PAN(分子量150000,美国Sigma-Aldrich 公司);Zincon 试剂(麦克林生化科技股份有限公司);N,N-二甲基甲酰胺(D M F, 9 9.5%)、P V P(分子量1 3 0 0 0 0)、S G(9 9%)、二水合醋酸锌(C4H6O4Zn·2H2O,99%)、蛋氨酸(Met,99%)、丙氨酸(Ala,99%)、色氨酸(Trp,99%)、高半胱氨酸(Hcy,99%)、精氨酸(Arg,98%)、酪氨酸(Tyr,99%)、异亮氨酸(Ile,99%)、尿素(Ure,99%)、缬氨酸(Val,99%)、苯丙氨酸(Phe,99%)、丝氨酸(Ser,99%)、甘氨酸(Gly,99%)、L-半胱氨酸(Cys,95%)、苏氨酸(Thr,99%)、组氨酸(His,99%)、亮氨酸(Leu,99%)、赖氨酸(Lys,99%)、脯氨酸(Pro,99%)和谷胱甘肽(GSH,98%)(阿拉丁生化科技有限公司)。所用试剂均为分析纯;实验用水为超纯水(18.2 MΩ·cm)。
1.2.1 静电纺丝法制备生物硫醇比色试纸
生物硫醇比色试纸的制备过程如图1A 所示。称取20 mg Zincon 试剂和8.0 mg 二水合醋酸锌溶解于6.0 mL DMF 中,加入0.40 g PAN、0.10 g PVP 和0.15 g SG,常温(25 ℃)下搅拌8.0 h, 移入10 mL 注射器中。设置静电纺丝仪注射泵速度、滚筒转速、正负极电压和注射器流速分别为1.5 mL/h、60 r/min、17 kV和1.7 mL/h, 在环境湿度低于60%和25 ℃的条件下进行静电纺丝。4 h 后得到均匀的高分子纳米纤维膜,经真空烘箱烘干3 h,即得到生物硫醇比色可视化试纸(PAN-Zincon-Zn2+),将其裁剪成1.0 cm×1.0 cm的正方形。
图1 (A)静电纺丝法制备PAN-Zincon-Zn2+比色试纸示意图;(B)PAN-Zincon-Zn2+比色试纸检测机理图Fig.1 (A) Schematic illustration of preparation of PAN-Zincon-Zn2+ colorimetric paper by electrospinning method; (B) Schematic of detection mechanism of PAN-Zincon-Zn2+ colorimetric test paper
如图1B 所示,Zincon 指示剂和生物硫醇的巯基存在对Zn2+的竞争性结合。当生物硫醇不存在时,Zn2+可形成Zincon-Zn2+配合物,试纸呈蓝色;当生物硫醇存在时,其巯基与Zincon-Zn2+解离出来的Zn2+络合,试纸颜色由蓝色逐渐变为紫红色。
1.2.2 人工尿液的配制
分别称取17.3 g Ure、14.1 g NaCl、2.80 g KCl、0.600 g CaCl2·2H2O、0.430 g MgSO4·4H2O 和0.500 g NH4OH,溶于1.0 L 超纯水中,加入0.62 mL HCl,制得人工尿液(pH = 7.0±0.1)。
1.2.3 数据集的制备
以Cys 为代表,分别以超纯水、人工尿液和健康人尿液为溶剂,Cys 为溶质,配制浓度分别为0、0.5、1.0、2.0、5.0、10、20 和30 mmol/L 的溶液。
分别取上述制备的不同浓度溶液10 μL 滴在试纸(见1.2.1 节)中心,10 s 后,采用平面标准光源(R=10,G=10,B=10),试纸距摄像头10 cm 处,利用机器视觉连续捕捉每个浓度的图像,其中,超纯水溶液样品图片2100 张,人工尿液样本图片700 张,健康人尿液样本图片1400 张。将这4200 张图片混在一起,相同浓度的打上标签(例如1.0 mmol/L 的图片标签为1.0),按浓度进行样本分类,形成全浓度数据集。
1.2.4 生物硫醇智能比色检测系统的构建
如图2 中①所示,本研究应用的机器学习模型是基于CNN 算法,通过卷积和池化运算,提取PANZincon-Zn2+的特征。
图2 基于卷积神经网络(CNN)模型比色分析系统的生物硫醇快速定量检测示意图Fig.2 Schematic diagram of rapid and quantitative detection of biomercaptan by convolutional neural networks(CNN) model-based colorimetric analysis system
如图2 中②所示,将数据集(见1.2.3 节)按8∶2 分成训练集与验证集(训练集3360 张,验证集840 张),通过调节后台代码参数训练出合适的机器学习模型,用PyQt5 完成界面,后台点击上传图片按钮,即对图像浓度进行预测,后台返回生物硫醇浓度。
如图2 中③所示,采用github 开源Tensorflow 2.3 框架搭建CNN 和轻量化卷积神经网络(Mobilenet)两种模型,对数据集进行分类,据图片样本分类正确率对代码模型和参数进行适当调整,训练出精确度符合实际要求的模型,通过上传真实样本检测模型的正确率和损失函数。这两种模型由卷积层、最大池化层和全连接层组成,分别用于图像特征提取、降维(减少计算数据量)和分类。以划分好的测试集输入模型进行训练,训练后的模型可从比色试纸中提取显色特征,根据图像特征将其归为某一浓度,从而进行定量分析。采用安卓技术开发APP,用智能手机捕捉图像上传,封装好的机器学习模型处理并给出测量浓度。
1.2.5 试纸的亲水性测试
采用接触角计测量水接触角(Water contact angle,WCA)。测量前,将纳米纤维垫切成20 mm×40 mm大小,粘贴在载玻片上。将载玻片水平放置,将5 μL 超纯水滴在膜表面,在10 s 内测量薄膜表面与水滴之间的接触角并拍照。对每个纳米纤维薄膜样品进行3 次重复实验。WCA 可以准确地反映纳米纤维薄膜的表面疏水性,WCA >90°的表面视为疏水表面。
PAN 作为比色试纸基底,不溶于水,以纤维丝方式层层堆积包裹、保护内部的显色剂Zincon-Zn2+,可以延长PAN-Zincon-Zn2+比色试纸保质期。PVP 稳定无毒,含强极性基团内酰胺,具有吸水性,还有增溶、分散和吸附效应。将水溶性高分子聚合物PVP 加入到静电纺丝液中,可使比色试纸具有亲水性,受试样品更易渗进试纸,显色反应更容易、更快[23];但由于反应迅速,显色不均匀,都发生在试纸边缘。加入不溶于有机溶剂的SG,通过剧烈搅拌(>1400 r/min)使之均匀分散在纺丝液中,SG 表面有大量羟基,具有亲水性,这样制作出来的比色试纸显色均匀。如图3A 所示,显色剂均匀包裹在比色试纸中每一条纳米纤维丝中,而且比色试纸具有“鸟巢状”的结构,增加了比表面积。如图3B 所示,随机选取50 根纳米纤维丝测量直径,70%纳米纤维丝的直径在300~350 nm 之间。对比色试纸的亲水性能进行探究发现,只加入PAN,动态接触角大于120°,试纸疏水性好,从液滴开始接触并完全润湿试纸时间约为16 s(见电子版文后支持信息)。当加入SG 和PVP 后,液滴接触试纸时间0、3 和4 s,动态接触角分别为α=121°(图3C)、β= 61.2°(图3D)和θ= 29.9°(图3E),完全润湿需要8 s, 测试时间比只加PAN 减少1/2,可见加入PVP 和SG 提高了试纸的亲水性。
图3 (A、B)PAN-Zincon-Zn2+比色试纸不同放大倍数的扫描电镜(SEM)图像,图B 中插图为粒径分布图;PAN-Zincon-Zn2+比色试纸在滴加超纯水(C)0、(D)3 和(E)4 s 时的水接触角(WCA)Fig.3 (A,B)Scanning electron microscopy(SEM)images of PAN-Zincon-Zn2+colorimetric paper with different magnifications,inset in Fig.3B is diagram of size distribution;Water contact angles(WLA)of PAN-Zincon-Zn2+colorimetric test paper after dropping ultrapure water for (C) 0, (D) 3 and (E) 4 s, respectively
取1.2.3 节配制的不同浓度的Cys 溶液各10 μL, 由低浓度到高浓度顺序滴加在PAN-Zincon-Zn2+试纸中心,10 s 后得到一个标准比色卡,随Cys 浓度由低到高,试纸呈现由蓝色、紫红色到酱红色变化顺序。将比色卡图像导入Photoshop 进行分析,读取试纸的B 值(B-valve),发现随着Cys 浓度升高,B 值呈现下降趋势(0~10 mmol/L), 随后趋于稳定(10~30 mmol/L)(图4A),Cys 浓度在0~10 mmol/L 范围内与B 值呈线性负相关(图4B)。这是传统的ED 法,线性范围为0.5~10 mmol/L。在Cys 浓度超过10 mmol/L时,肉眼已不能辨别出PAN-Zincon-Zn2+试纸颜色的细微变化。
图4 (A)欧氏距离(ED)法中不同浓度Cys 对应的B-value;(B)ED 法中Cys 浓度与B-value 的线性拟合结果;(C)Zincon、Cys 与Zn2+络合反应吸收光谱图,插图为对应的光学照片; (D)基于CNN 模型的智能比色检测标准曲线图; (E)常见氨基酸(Cys、Hcy 和GSH: 1.00 mmol/L; 其它氨基酸2.00 mmol/L)干扰性实验图Fig.4 (A) B-values of different concentrations of Cys in Euclidean distance (ED) method; (B) Linear fitting of Cys concentration and B-value in ED method; (C) Absorption spectra of Zincon and Cys complexing with Zn2+,inset is corresponding optical images;(D) Standard calibration curve of intelligent colorimetric detection based on CNN model; (E) Interferences of common amino acids (Cys, Hcy, GSH: 1.00 mmol/L; other amino acids:2.00 mmol/L)
本研究探究了在水溶液中主要存在的3 种物质Zincon、Zn2+、Cys 及其络合物的整个体系的紫外-可见吸收光谱变化,如图4C 曲线a 所示(由15.0 mmol/L Zincon 与7.5 mmol/L Zn2+络合为Zincon-Zn2+,取0.5 mL 加入到3.0 mL 超纯水中),Zincon-Zn2+呈蓝色,最大吸收波长为638 nm;如图4C 曲线b 所示(将曲线a 中的超纯水换为等体积的3.0 mmol/L Cys),Cys-Zn2+与Zincon-Zn2+共同存在,是红色和蓝色的混合色;如图4C 曲线c 所示(0.5 mL 15.0 mmol/L Zincon 加入3.0 mL 超纯水),只有Zincon 存在时,溶液呈现橙红色,最大吸收峰波长为462 nm;如图4C 曲线d 所示(0.5 mL 7.5 mmol/L Zn2+与2.5 mL 3.0 mmol/L Cys络合),Cys-Zn2+无色透明。鉴于Zincon-Zn2+对400~750 nm 光均有吸收,与比色测定Cys 后置换出的Zincon 存在明显的光谱干扰,常用的紫外-可见分光光度法无法准确定量分析Cys。
综上可知,ED 法无法辨别相似图像细微的区别,紫外-可见分光光度法受整个体系复杂反应的影响,两种方法都不能精确定量分析Cys。本研究开发了基于CNN 算法的模型,如图4D 所示,通过卷积计算提取图像特征,池化去掉噪声,采用有监督的方法把样本和标签输入模型,得到一个真实样本和预测样本标签的标准曲线,即CNN 模型预测的Cys 浓度与其真实的浓度呈正相关。基于CNN 模型测定Cys 浓度的检出限为0.01 mmol/L, 线性范围由ED 法的0.5~10 mmol/L 扩展到了0.01~30 mmol/L。
为了评估方案的可行性,本研究选取了尿液中可能存在的氨基酸进行抗干扰实验,如图4E 所示,不含巯基的氨基酸对测定结果无显著影响,即PAN-Zincon-Zn2+比色试纸对含巯基氨基酸的测定具有选择性。
将训练集和验证集分别采用CNN 和Mobilenet 两种模型,经加载数据集、加载模型、保存模型和测试模型提取图片特征,训练200 次以测试效果。如图5A 和5B 所示,CNN 模型训练65 次时,训练集和验证集的准确率已达到1,损失函数随训练次数增加和模型正确率同步收敛,当正确率达到1 时,损失函数值收敛到0.1,说明模型学习能力好。Mobilenet 模型在训练55 次时,正确率达到1,此时损失函数值收敛到0.1,显示训练集效果好(图5C)。采用验证集验证Mobilenet 模型的准确率,根据结果去调节模型参数,增强模型泛化能力和鲁棒性,由图5D 可得,当训练次数少于55 次,损失函数在0.5 处收敛,验证集正确率在55%~65%之间波动,说明损失函数出现梯度爆炸现象。即使将训练集模型中的学习率降低,增大训练轮数,验证集正确率可上升到75%,损失函数也只能降到0.2,因此Mobilenet 模型训练存在过拟合问题,对图像样本学习效果较差,优化不到理想效果。因此,CNN 模型可以根据图像更准确预测样本浓度。
图5 (A)CNN 训练精度、损失值与训练次数拟合曲线;(B)CNN 验证精度、损失值与训练次数的拟合曲线;(C)轻量化卷积神经网络(Mobilenet)训练精度、损失值与训练次数的拟合曲线;(D)Mobilenet验证精度、损失值与训练次数的拟合曲线Fig.5 (A) Fitting curve of training accuracy, loss value and training times by CNN; (B) Fitting curve of verification accuracy,loss value and training times by CNN;(C)Fitting curve of training accuracy and loss value with training times by Mobilenet;(D)Fitting curves of accuracy and loss value with training times by Mobilenet
制备2.0 mL Cys 浓度分别为0、0.5、1.0、2.0、5.0、10、20 和30 mmol/L 的人工尿液,每个浓度测定10 次,各制作10 张图片,对模型准确率进行测试。抽取每个浓度图片各1 张进行测试,模型对输入样本的评价与真实标签对比后进行打分,将最接近真实标签的概率判定为最可能的值,判断结果概率最大的作为预测标签返回给用户。CNN 模型预测上述浓度真实概率分别为0.81、0.80、0.70、0.82、0.90、0.65、1.00 和0.91,判断为其它非真实标签的概率均小于0.35,模型返回用户数据是概率最大的对应浓度,所以这些待测样本的准确率为1(图6A)。将剩下72 张样本图片输入模型进行验证,70 张预测正确,2 张预测错误,即样本预测正确概率为97.5%。采用相同测试集和方法对Mobilenet 模型的准确率进行评估,随机抽取每个浓度图片各1 张进行测试,Mobilenet 模型输出预测的真实概率分别为0.50、0.60、0.70、1.00、0.60、0.20、0.90 和0.75,真实样本为0 mmol/L 的标签判断为0 mmol/L 或0.5 mmol/L 的概率都为0.50,模型会给用户返回2 个预测值。真实样本为10 mmol/L 的判断正确概率为0.20,判断错误概率为0.80,此时返回用户的浓度是30 mmol/L,模型将标签为10 mmol/L 的样本判断错误(图6B)。剩下72 张样本图片输入模型进行验证,58 张正确,14 张错误,Mobilenet 模型预测正确概率为80%。经过1000 张样本验证,CNN 模型正确率稳定在98%,Mobilenet 模型正确率平均约75%,且不稳定,而传统ED法准确率为85%(图6C)。综上,建立的CNN 模型稳定性和准确率更好。
图6 (A)CNN 模型真实值和预测值的热图;(B)Mobilenet 模型真实值和预测值的热图;(C)ED 法、CNN 模型法和Mobilenet 模型法正确率对比图Fig.6 (A)Heat map of true and predicted values with CNN model;(B)Heat maps of real and predicted values with Mobilenet model; (C) Accuracy comparison among ED method, CNN model and Mobilenet model
为验证基于CNN 的智能可视化检测平台对尿液中生物硫醇检测的准确性,取健康人的尿液(取自课题组志愿者)10.0 mL,用0.22 μm 滤膜过滤,以Cys 为生物硫醇代表物质,进行加标回收实验,结果见表1。?回收率在98.4%~114.0%之间,相对标准偏差(RSD)为1.6%~3.0%,表明基于CNN 的方法用于实际尿液中生物硫醇的检测具有良好的实用性。
表1 基于CNN模型的人尿液中生物硫醇检测结果Table 1 Detection results of biomercaptan in human urine based on CNN model
本研究基于竞争性、选择性和快速络合反应前后吸光性能的显著差异,设计了新型生物硫醇显色剂Zincon-Zn2+,以PNA、SG 和PVP 为保护载体,采用静电纺丝技术,构建了稳定性、重现性、选择性和抗干扰性能优良的比色传感器。将CNN 模型与比色试纸结合,借助机器学习突出的全样本图像表征和强大的特征提取能力,以B 值为测量参数,有效解决了Zincon-Zn2+与Zincon 严重的光谱干扰问题,可以快速测量尿液中生物硫醇的浓度。结果表明,采用CNN 模型准确率可达98%以上,检出限为0.1 mmol/L;将训练好的卷积云网络模型封装,通过与手机APP 结合,提高了使用便捷性。