雷靳灿, 侯长军, 霍丹群
(重庆大学 生物工程学院,重庆 400030)
肺癌是最常见的肺原发性恶性肿瘤,在全球范围内表现出高发病率和高死亡率,每年夺去上百万人的生命[1],资料显示,这个数据还在不断增加[2~4]。由于多数肺癌早期无明显症状,而出现咳嗽、痰血等症状时被检出来已是中晚期,使得在5年生存率不到15 %[5],因此,对肺癌高危人群的筛查就显得很有必要。然而,目前临床上对肺癌早期的检测手段主要依赖于X线,CT,MRI,PET等影像学手段。这些方法虽然无创,但价格昂贵,且对人体有一定危害,早期检出率也并不理想,不适合广泛用于肺癌筛查[6]。
Pauling L等人在1971年提出了肺癌呼出气体检测[7],在早期检测和筛查中具有广泛的应用前景,引起学术界的广泛关注。研究表明,呼出气体中的一些挥发性有机气体(VOCs)与是否患有肺癌以及肺癌的分期有着密切的关系[8,9],并已经确定了呼出气体中的一些肺癌标志物[8,10~12]。近年来,越来越多的研究小组设计了针对肺癌相关VOCs的传感器[13~15],这也成为该领域的重要发展方向。鉴于卟啉具有光敏特性好、响应速度快、性能稳定,采用光谱技术可以检测到它的微小变化等优点[16],本文提出了一种与以往不同的荧光卟啉传感器阵列系统,通过卟啉敏感材料与待测物之间的交叉响应机制,对不同肺癌标志物有着相当好的识别效果。利用自主研发的荧光卟啉传感器阵列系统,对不同体积分数的对二甲苯、苯乙烯、异戊二烯、己醛这4种肺癌标志物进行了识别区分,期望为后续临床研究提供一定的支持。
本文使用的荧光卟啉交叉响应传感器阵列由敏感物质和基底材料构成。敏感物质均由重庆大学生化传感中心自助合成并提供。首先通过荧光分光光度计分析各标志物与敏感物质溶液相互作用后的荧光光谱变化;然后将敏感物质附于作为基底材料的聚偏氟乙烯膜(PVDF)上,并根据荧光分光光度计的结果选用特定波长的3个激光LED灯作为激发光源,配合微型光纤光谱仪进行测试。通过前期研究的大量实验,筛选出包含卟啉、卟啉衍生物及指示剂染料在内的共15种对肺癌呼出标志物有不同荧光光谱响应的敏感物质。为便于系统设计,它们按圆形排列在直径为47mm的PVDF膜上,构成荧光卟啉传感器阵列。
设计的荧光传感器阵列检测系统原理如图1所示。
图1 荧光传感器检测系统原理图
系统上电后,微型PC发送控制指令使各硬件初始化。作为背景载气的惰性气体N2在气泵的作用下进入反应气室,各激光LED按一定流程打开关闭,传感器阵列在步进电机带动下旋转,微型光纤光谱仪依次测量各敏感点反应前的荧光光谱。随后,用N2配好体积分数的待测气体进入反应气室与传感器阵列发生反应,待反应达到平衡后微型光纤光谱仪采集反应后的荧光光谱。反应前后的荧光光谱数据送入PC机,计算各敏感点的差谱并进行分析处理。测量结束后气体送入废气处理缸。
本文通过设计的系统对选择的4种曾在多篇文献中被确定为肺癌呼出标志物的VOCs进行检测。标志物由Sigma-Aldrich公司购得的分析纯使用N2作为背景气体,将其配置成4种不同的体积分数梯度,如表1所示。
表1 肺癌标志物及其体积分数
对于每次待测VOCs的检测,系统将自动给出各敏感点反应前后的荧光差谱数据,记为X1,X2,…,X15。结合光谱分析技术和信号处理技术,本文在荧光差谱的空间域上选取了3个特征指标:峰峰值、最大峰位置、积分面积,分别记为:PPV(peak-to-peak value),MPP(maximum peak position),IA(integral area),如图2所示。
图2 荧光差谱的空间域特征
峰峰值、最大峰位置描述的是光谱的个别局部点的特征,积分面积描述的是光谱的宏观特征。而对于复杂系统而言,特别是本文中基于交叉响应机制的识别,从信号分析处理的角度,还有必要关注其局部微观特征,本文借助具有“数学显微镜”之称的小波理论中的小波包进行分析。使用db4小波包对Xi进行三层分解,荧光差谱信号被分解到多个频率,在各尺度空间内的平滑信号和细节信号能提供原信号的时频局部微观信息,特别是原始信号在不同频段上的构成信息。因此,把不同频段上的信号能量求出,便可作为荧光差谱信号的一组模式识别特征指标。记末层各频带重构信号为Sm(m=1,2,…,8),则各频带重构信号能量为
(1)
式中n为荧光差谱数据长度。至此,对于每个敏感点均得到11个特征值:PPV,MPP,IA,E1~E8,将阵列上15个敏感点的特征值写成向量形式,便构成了目标气体可用于模式识别的特征向量,记为Y,显然,Y是一个11×15=165维向量。
本文对上述4种体积分数的4种标志物进行实验,每种标志物每种体积分数均测试10次,实验中设定标志物与荧光传感器阵列的反应时间为15 min。通过系统给出的荧光差谱可以发现,不同标志物的荧光差谱图之间具有明显的差别。以对二甲苯为例,4种体积分数下的荧光差谱如图3所示。
图3 各体积分数下对二甲苯的荧光差谱
可见,随着浓度的增加,各敏感点的荧光差谱变化逐渐增大,但是,只有6个固定的特征点有荧光的变化,它们是X1,X4,X5,X8,X12,X15。其它3种标志物也有类似的规律,即只有固定的敏感点会产生荧光变化,说明系统对不同肺癌标志物响应的荧光差谱图各不相同,具有一一对应关系,这便构成了不同标志物的特有的指纹荧光差谱图,如图4所示。利用这个特点,可以对不同肺癌标志物进行识别。
图4 不同肺癌标志物的指纹荧光差谱图
层次聚类分析(HCA)是一种多元统计分析方法,能够将所观察的数据集内的数据按照相似性的大小将它们聚集成族,从而达到分类的目的。它能在缺乏先验知识的情况下根据数据的特点合理进行聚类,可作为小样本下无监督型模式识别的有力工具。本文从上述实验中的4种标志物的20个样本中分别随机抽选5个,将它们的荧光光谱特征值Y作为输入进行层次聚类,结果如图5所示。
图5 4种肺癌标准物的层次聚类分析图
显然,4种肺癌标志物能够准确无误的聚集。经过多次随机抽取,重复聚类,没有错误现象。
虽然HCA能够将不同肺癌标志物进行正确的区分,但由于特征向量Y的维数很高,这无疑将使得计算的复杂度较大,有必要对数据进行降维处理。主成分分析(PCA)的基本原理就是通过把各特征值进行不同的线性组合构建出新的指标,即主成分,各主成分之间相互正交,这就使得能够用最少的变量反映最多信息量成为可能。通过PCA对上述160次实验的数据进行分析,一共提取到16个主成分,前3个主成分对原特征向量所包含信息的累积贡献已达88 %,按照大于85 %的原则,文本只提取前3个主成分PC1,PC2,PC3,图5中的样本数据在以前3个主成分为坐标的坐标系中的散点图如图6所示,可见前3个主成分所代表的信息可以将不同肺癌标志物进行正确区分识别,能够达到降低维数,简化计算的目的。
图6 前3个主成分的样本散点图
本文提出了一种基于荧光卟啉传感器阵列的肺癌呼出标志物检测系统,并据此对4种已确定的标志物进行检测,按照设计的数据处理方法提取了其特征向量,得到了其特有的指纹荧光图谱。根据HCA,PCA等技术手段对它们进行了识别区分,得到了理想的分类效果。HCA结果显示,所有样本均能够正确的聚到一起。通过PCA,在前3个主成分所代表的88 %信息量的散点图上便可将样本明显的区分。研究表明:该荧光卟啉传感器阵列系统能够快速有效的对肺癌标志物进行检测识别,若通过大量实验建立完整的肺癌标志物特征数据库,有望在临床上应用。
参考文献:
[1] Jemal A,Thun M J,Ries L A G,et al.Featuring trends in lung cancer,tobacco use,and tobacco control[J].Journal of the National Cancer Institute,2008,100(23):1672-1694.
[2] Marshall A L,Christiani D C.Genetic susceptibility to lung can-cer-light at the end of the tunnel[J].Carcinogenesis,2013,34(3):487-502.
[3] Lee P N,Forey B A.Indirectly estimated absolute lung cancer mortality rates by smoking status and histological type based on a systematic review[J].BMC Cancer,2013,13(9):1471-1507.
[4] Demetriou C A,Nielsen O R,Loft S,et al.Biomarkers of ambient air pollution and lung cancer:A systematic review[J].Occupational and Environmental Medicine,2012,69(9):619-627.
[5] Kim K H,Jahan S A,Kabir E.A review of breath analysis for diagnosis of human health[J].Trac-Trends in Analytical Chemistry,2012,33:1-8.
[6] Humphrey L L,Teutsch S,Johnson M.Lung cancer screening with sputum cytologic examination,chest radiography,and computed tomography:An update for the US Preventive Services Task Force[J].Annals of Internal Medicine,2004,140(9):740-753.
[7] Pauling L,Robinson A B,Teranishi R,et al.Quantitative analysis of urine vapor and breath by gas-liquid partition chromatogra-phy[J].Proceedings of the National Academy of Sciences of the United States of America,1971,68(10):2374-2376.
[8] Miekisch W,Schubert J K.Diagnostic potential of breath analysis-focus on volatile organic compounds[J].Clinica Chimica Acta,2004,347(1):25-39.
[9] Cornu J N,Tassin G C.Olfactory detection of prostate cancer by dogs sniffing urine:A step forward in early diagnosis[J].Euro-pean Urology,2011,59(2):197-201.
[10] Ligor M,Ligor T,Bajtarevic A,et al.Determination of volatile organic compounds in exhaled breath of patients with lung cancer using solid phase microextraction and gas chromatography mass spectrometry[J].Clinical Chemistry and Laboratory Medicine,2009,47(5):550-560.
[11] Phillips M,Gleeson K,Hughes J M B,et al.Volatile organic compounds in breath as markers of lung cancer:A cross-sectional study[J].Lancet,1999,353(9168):1930-1933.
[12] Rudnicka J,Kowalkowski T,Ligor T,et al.Determination of volatile organic compounds as biomarkers of lung cancer by SPME—GC—TOF/MS and chemometrics[J].Journal of Chromatography B:Analytical Technologies in the Biomedical and Life Sciences,2011,879(30):3360-3366.
[13] Natale C D,Macagnano A,Martinelli E,et al.Lung cancer identification by the analysis of breath by means of an array of non-selective gas sensors[J].Biosensors & Bioelectronics,2003,18(10):1209-1218.
[14] Hou Changjun,Lei Jincan,Huo Danqun,et al.Discrimination of lung cancer related volatile organic compounds with a colorimetric sensor array[J].Analytical Letters,2013,46(13):2048-2059.
[15] Dragonieri S,Annema J T,Schot R,et al.An electronic nose in the discrimination of patients with non-small cell lung cancer and COPD[J].Lung Cancer,2009,64(2):166-170.
[16] 侯长军,张红英,霍丹群,等.卟啉传感器研究进展[J].传感器与微系统,2008,27(3):1-4.