张绍康 林 勇
(上海理工大学医疗器械与食品学院,上海 200093)
基于多层过滤的光度法微生物鉴定算法的研究
张绍康 林 勇*
(上海理工大学医疗器械与食品学院,上海 200093)
针对一种全自动光度法微生物鉴定仪设计了相应的微生物鉴定算法。算法根据酶标板板孔阴阳性的综合信息,采用多层过滤机制逐步调整样本微生物与模板微生物的相似度:首先通过夹角余弦法计算原始相似度,然后将匹配异常的板孔分为绝对、显著和大概率异常等3个等级对相似度进行不同程度的调整,最后根据调整后的相似度给出鉴定结果。通过微生物重复实验以及与梅里埃鉴定方法的比对实验验证了算法的有效性,对5种常见微生物进行鉴定实验,本算法检准率均超过85%;与梅里埃鉴定方法比较,本算法有4种高于或等于梅里埃法,1种略低。梅里埃法得到的相似度相对标准差是本算法的1.5~11倍。验证实验结果表明本算法具有高检准率和高鲁棒性的特点。
多层过滤; 相似度; 微生物鉴定; 光度法
微生物鉴定是微生物实验室广泛开展的基础工作。近年来,国家针对抗生素滥用的问题出台政策要求二级及以上医院应配备微生物实验室,微生物样本送检率不低于30%[1-2]。这对高效快速的微生物鉴定提出新的挑战。传统的光度鉴定法以其灵敏度高、准确度高、操作简单等特点被广泛应用于微生物鉴定中[3-4]。目前基于光度法鉴定系统流行于各大微生物鉴定厂商,例如:法国梅里埃公司的VITEK-ATB、VITEK系统[5],美国Dade MicroScan公司的Auto-Scan4[6],美国BIOLOG公司Microlg-M、GENⅢMicroStation[7]系统,SENSITITRE公司的Auto-Reader、Sensititre ManualSysyem系统[8]。这些产品都能较准确地完成微生物鉴定,但大多数是半自动型[9-10]。半自动型鉴定过程需要人工干预,因此效率不高,易误操作。针对这一问题,我们研发了一款全自动微生物鉴定仪器并进行鉴定算法设计。首先,该仪器工作原理是全程通过机械手定时自动地移动微生物培养酶标板至光度获取区域进行测量[11],从而得到每个板孔的光度值,然后将其传输到上位机并转换为阴阳性数据,最后通过鉴定算法得到鉴定结果。
本研究设计了一种基于多层过滤的光度法微生物鉴定算法。这种算法具有高准确性、高鲁棒性等特点。算法过程:微生物培养结束得到鉴定板条上各孔的阴阳性数据,将其与微生物标准库进行模糊匹配,根据板条的综合信息得出鉴定结果。临床微生物的鉴定实验验证了算法的有效性。
1.1 基于多层过滤的光度法微生物鉴定算法
所使用的算法为多层惩罚系数调整相似度算法(multi-layer adjusted similarity coefficient algorithm, MASCA)。该算法是首先将实验样本各孔阴阳性数据与模板微生物库中的每种微生物相应板孔信息进行对比得到原始相似度,然后根据匹配程度的综合信息进行多层惩罚,最后计算得到样本与所有模板微生物的相似度(similarity, SIM),从而给出判断结果。
1.1.1 问题描述
为了方便描述算法,首先对鉴定过程中采用的符号和概念进行形式化的定义。鉴定微生物使用模板的孔数为n。微生物培养结束后得到板条各孔的阴阳性的情况,在这里通过向量E来描述,有
(1)
式中,Ai表示第i孔的阴阳性,可表示为
(2)
鉴定微生物的核心思想是通过待鉴定微生物各孔的阴阳性分布与标准微生物的阴阳性分布情况的比较,提取标准微生物库中与待测微生物最接近的微生物作为候选鉴定结果,在算法中用相似度Corr的大小表示其近似程度。把标准微生物的阴阳性分布情况存放于标准微生物数据库中(模板库通过标准菌的培养实验确定),微生物数量为s,第i种标准微生物数据用向量表示为
(3)
式中,Pij为第i种微生物在第j个孔上出现阳性的概率(j=1,2,…,m),此概率值是通过对已知的标准微生物经过多次实验,依据实验结果进行统计得到的。
式(1)和式(2)在于将实验微生物与微生物库中的模板匹配转化为寻找E和Fi中哪一个相似度最大,并且该相似度要达到一定阈值要求时才认可为该微生物[12]。
1.1.2MASCA算法的设计
图1为MASCA算法流程,主要包括5个步骤。
图1 MASCA算法流程Fig.1 MASCA algorithm process
步骤1:原始相似度(RawCorri)计算。通过计算向量E和Fi的夹角余弦值获得,有
(4)
当E和Fi为零向量时,因为无法计算夹角余弦值,所以通过计算E和Fi的欧式距离来代替RawCorri。
步骤2:绝对异常调整。针对标准微生物数据Pij为0或1时,而某次实验值却相反为1或0的情况(即在标准库中该孔值为100%阴性或100%阳性时,而实验值却相反为阳性或阴性)。因此需要对该类孔进行较大的惩罚,令实验微生物与所有标准微生物比对的最小绝对异常孔数为Hmin,当前标准微生物绝对异常孔数为H,惩罚系数PC0设定为
(5)
式中,α是一个常数。
步骤3:显著异常调整。针对标准微生物数据中Pij为小于等于0.05或大于等于0.95时而实验值为1或0的情况,其惩罚系数PC1计算方法与PC0计算方法类似,不同之处在于其使用的Hmin应在原来的基础上增加一个步长τ (实验中τ为2),即参与计算式为
(6)
步骤4:大概率异常惩罚。针对该反应孔在标准库中大概率呈阳性而实验值却为阴性结果的情况(例如某孔有85%概率呈阳性,然而实验结果为阴性),定义概率阈值记为Pt,惩罚系数的调整原则为首先统计上述孔的总个数记为m,其标准微生物i对应各孔的Pi1, Pi2,…, Pim惩罚系数PC2表示为
(7)
式中,a=0.5,b=0.15,c=0.95,这些系数均来源于对已有的实验数据进行大量的统计训练优化, 根据作者经验调整获得的,且在验证实验中取得了较好的鉴定结果。
步骤5:相似度综合分析。将步骤1~步骤4计算得到的初始相似度和调整系数相乘,即可获得调整后的相似度AdjCorri,将AdjCorri进行排序,最终获取实验鉴定结果。鉴定结果的判断标准是取AdjCorri排序前10的值分别是R1,R2,…,R10。若这些值满足下列任何一个条件:一是R1-R2>0.3且R1>0.4,二是R1-R2>0.1且R1>0.8, 则鉴定得到唯一结果,否则仪器无鉴定结果,只将Ri结果显示,进行手动鉴定。
1.2 实验验证
1.2.1 实验数据
为了确保获得微生物实验数据的真实性,整个实验是在微生物实验室进行的。分别针对5种微生物进行了多次验证实验,这5种微生物属于实验鉴定所用标准菌。在恒温培养前,为了避免或降低培养液量因素的影响,采用自动加液仪器对板条的各孔进行精确加液;然后将板条放入鉴定用的仪器中进行恒温培养,全程通过机械手定时自动地移动微生物培养酶标板至光度获取区域进行测量;最后将测量的光度信息传输到计算机并转换为阴阳性数据,通过鉴定算法得到鉴定结果。
本次实验使用的5种微生物以及实验次数分别为:大肠埃希菌B共32次;阴沟肠杆菌B共14次;粪肠球菌共16次;铜绿假单胞菌共20次;金黄色葡萄球菌金黄亚种共12次,总鉴定次数为94。其中金黄色葡萄球菌金黄亚种、粪肠球菌为革兰氏阳性微生物,大肠埃希菌B、铜绿假单胞菌、阴沟肠杆菌B为革兰氏阴性微生物。
在鉴定过程中,用到了模板数据。模板数据是标准菌经过培养后酶标板各板孔的阳性概率。获取模板数据的方法是对每种微生物标准菌采取重复实验处理并保存每次实验各孔的阴阳性值,然后经过统计计算得到每个孔的阳性概率值,即本文第1.1.1节中Pij。
1.2.2 验证方法
为了验证该算法的有效性、高检准率和高鲁棒性,采用两种方法验证,一是微生物重复实验,二是与梅里埃鉴定算法作对比。在验证方法中采用平均相似度(AvgC)、相似度相对标准差(RSD)和检准率(R)等3个指标来衡量鉴定算法的性能。RSD和R可表示为
(8)
(9)
2.1 微生物重复实验鉴定结果及分析
用光度法获取实验微生物的阴阳性反应数值,并采用MASCA进行鉴定,重复实验的鉴定结果如表1所示。
表1 微生物鉴定结果Tab.1 Microbial identification results
注:S.a.sub(金黄色葡萄球菌金黄亚种),E.fae(粪肠球菌), E.coliB(大肠埃希菌B),P.aer(铜绿假单胞菌),E.cola- B(阴沟肠杆菌B)
Note: S.a.sub(Staphylococcus aureus subsp),E.fae (Enterococcus faecalis),E.coli B(E. coli B),P.aer(Pseudomonas aeruginosa),E.cola B(Enterobacter cloacae B)
由表1可知,在所有重复实验的鉴定结果中,每一种微生物的平均相似度都达到了较好的结果。其中金黄色葡萄球菌金黄亚种的相似度更是高达0.908。从相对标准差即相对于平均值的离散程度的结果中,可以看出金黄色葡萄球菌金黄亚种的结果最稳定,相对标准差仅为0.6%,阴沟肠杆菌B的为2.7%。在5种微生物鉴定结果只有铜绿假单胞菌稳定性稍低,通过将其和余下四种微生物的数据结果对比分析,发现主要原因是由于铜绿假单胞菌样本自身反应的稳定性差导致的。检准率除阴沟肠杆菌B为85.7%和铜绿假单胞菌为85.0%外均达到100%。
由以上数据可知在鉴定结果中不同种微生物的相似度略有所差异,同种微生物的鉴定结果中相似度也不等。这是因为:一是微生物对不同碳源和氮源的利用程度不同;二是不同的微生物对营养物质的利用率也有所不同;三是在不同的培养环境下生长,生长反应出现不同,造成了某些孔通过光度法获取的数据出现偏差。总之,目前多层过滤调整相似度算法能够较为准确地鉴定革兰氏阴性菌和阳性菌。
2.2 与法国梅里埃微生物鉴定仪鉴定结果比较
通过对上述实验标本再次用法国梅里埃公司的微生物鉴定方法进行鉴定并将其鉴定结果参数与采用MASCA方法的结果参数进行比较,比较结果如表2所示。与梅里埃鉴定算法相比较时,分别从检准率和相似度的相对标准差验证该算法的可行性。由表2可知,上述样本两种算法都得出了较好的鉴定结果。对于检准率,除阴沟肠菌B外,采用MASCA鉴定的其他微生物样本检准率均高于或等于梅里埃算法。
表2 鉴定结果比较Tab.2 Comparisons of identification results
图2 两种算法鉴定成功次数的文氏图Fig.2 Venn diagrams for the successful identification number of two algorithms
图2中的数字5(2次阴沟肠杆菌B,3次铜绿假单胞菌)表示MASCA没有鉴定成功而梅里埃鉴定成功的次数;79次为共同鉴定成功;10次(4次大肠埃希菌B,2次粪肠球菌,4次铜绿假单胞菌)表示MASCA鉴定成功而梅里埃没有鉴定成功。本次实验总的鉴定成功率本仪器为94.7%,梅里埃为89.3%。由表2中相对标准差发现,5种微生物MASCA的鉴定结果均表现出比梅里埃算法更好的稳定性。
通过以上的参数对比得出MASCA算法整体上对于已在医院运用的梅里埃算法有了进一步的提高,这验证了该算法的有效性。
在通过基于光度法获知每个板条各孔阴阳性的基础上,与标准模板数据库对比,并对对比信息采用多层过滤调整相似度算法处理,以达到快速高效地鉴定微生物。大量的重复实验表明,MASCA具有较高的检准率和鲁棒性;与梅里埃鉴定算法进行对比时,MASCA表现出了较高的检准率和更强的鲁棒性。因此,MASCA对于自动化鉴定微生物具有重要的实践意义。
在多次鉴定实验结果中存在误判现象,通过分析得出造成这种结果的原因有以下两个方面:
1)微生物在培养时偶尔存在污染导致无法鉴定出结果,例如相邻孔之间培养液互相侵入。
2)微生物培养时有大量的水蒸气造成光度法对获取的处理数据不准确。这两方面问题在现有鉴定仪中属于共性问题。
针对上述两种情况,首先调出误判实验的样本图像,通过手动输入人工判读,如果判读成功就为第2种情况,否则为第1种情况而需要重做实验。
虽然目前已做重复实验微生物能够获得大部分微生物鉴定上的成功,但是还有一些未达到快速成功的鉴定。这主要是由于基于光度法获取的阴阳性本身信息量小,是此方法的一个瓶颈。针对此瓶颈提出基于时间序列法获取更大信息量的假设。基于时间序列法是通过一定时间间隔去采集实验微生物的信息,从而可以对每种微生物的每个孔拟合出一条微生物的生长曲线。此方法可以获取更多的微生物的信息,因此可以达到更快速更准确地鉴定微生物,而基于时间序列法将是下一步的研究内容。
[1] 陈竺. 中华人民共和国卫生部抗菌药物临床应用管理办法[EB/OL].http://www.gov.cn/flfg/2012-05/08/content_2132174.htm,2012-05-08/2015-08-10.
[2] 郭燕红, 胡必杰, 刘荣辉, 等. SIFIC医院感染预防与控制临床实践指(2013年) [M]. 上海:上海科学技术出社, 2013: 228-228.
[3] Ramazan G, Can E. Micellar sensitized catalytic kinetic spectrophotometry for highly accurate and reproducible determination of Ⅴ(Ⅳ) and Ⅴ(Ⅴ) [J]. Rare Metals, 2014, 33(4): 466-478.
[4] 李秀芳. 水分析化学 [M]. 北京:北京大学出社, 2013: 213-213.
[5] Jin WY, Jang SJ, Lee MJ, et al. Evaluation of VITEK 2, MicroScan, and Phoenix for identification of clinical isolates and reference strains [J]. Diagnostic Microbiology & Infectious Disease, 2011, 70(4): 442-447.
[6] Quesada MD, Giménez M, Molinos S, et al. Performance of VITEK-2 Compact and overnight MicroScan panels for direct identification and susceptibility testing of Gram-negative bacilli from positive FAN BacT/ALERT blood culture bottles [J]. Clinical Microbiology and Infection, 2010, 16(2): 137-140.
[7] Wragg P, Randall L, Whatmore AM. Comparison of Biolog GEN III MicroStation semi-automated bacterial identification system with matrix-assisted laser desorption ionization-time of flight mass spectrometry and 16S ribosomal RNA gene sequencing for the identification of bacteria of veterinary interest [J]. Journal of Microbiological Methods, 2014, 105: 16-21.
[8] Drew RJ, Paulus S. Comparison of Sensititre microdilution method to other standard methods for susceptibility testing of coagulase-negative staphylococci from paediatric blood cultures [J]. Diagnostic Microbiology and Infectious Disease, 2014, 78(3): 213-216.
[9] 滕利荣, 孟庆繁, 逯家辉, 等. 生命科学常用仪器使用技术教程 [M](第2版). 北京:科学出版社, 2012: 393-420.
[10] 周庭银. 临床微生物学诊断与图解 [M]. 上海:上海科学技术出版社, 2007: 412-420.
[11] Xu Hao, Li Ying, Tang Hongwu. Determination of rutin with UV-Vis spectrophotometric and Laser-Induced fluorimetric detectionsusing a non-Scanning spectrometer [J]. Analytical Letters, 2010, 43(6):893-904
[12] Leordeanu M, Sukthankar R, Hebert M. Unsupervised learning for graph matching [J]. International Journal of Computer Vision, 2012, 96: 28-45.
Multi-Layer Adjusted Similarity Coefficient Algorithm Based on Photometric Method in Microbial Identification
Zhang Shaokang Lin Yong*
(SchoolofMedicalInstrumentandFoodEngineering,UniversityofShanghaiforScienceandTechnology,Shanghai200093,China)
multi-layer filter;similarity;microbial identification;photometric
10.3969/j.issn.0258-8021. 2016. 01.014
2015-07-09, 录用日期:2015-08-11
国家自然科学基金(31100902, C060404);上海市重点学科建设基金(S30501)
R318
D
0258-8021(2016) 01-0114-05
*通信作者(Corresponding author), E-mail: yong_lynn@163.com