何文军,李 曼,李 涛,钟伟国,肖长周,钟彦晶,张云超,徐 宁
(广州中医药大学第二附属医院/广东省中医院,广州 510370)
血细胞形态检查是临床检验的常规工作,也是疾病诊疗的重要手段[1-3]。传统人工镜检分类是血细胞形态检查的金标准,对技术人员依赖性较大,一方面存在要求高、速度慢、工作量大、重复性差、难追溯等问题,另一方面也影响了检验数据与实验室信息系统(LIS)和医院信息系统(HIS)等电子信息处理系统对接。同时,因检验结果缺少图像数据,无法满足大数据积累和深入研究的需求。因此,临床实验室迫切需要改进工作流程,引进稳定、高效、易于数据化的细胞形态检测系统。本研究采用先进的图像处理、收集数据和识别形态等技术,建立一套新型的细胞形态自动阅片分析系统。该系统可以进行白细胞六分类计数、有核红细胞计数和网织红细胞计数,并在此基础上给出白细胞个数修正因子,同时可以初步估算血小板数量,还可提示异常红细胞。每个数值均有图像结果支持,方便审核者浏览,数据化结果可与实验室信息系统对接,实现电子化管理[4]。
1材料与方法
1.1 系统设计 研究以先进的图像识别技术为基础,建立三个功能子模块:图像采集、算法训练和算法应用,组成形态自动识别工作系统。系统的框架如图1所示。
1.1.1 配置图像采集系统:在分辨度和放大倍数满足要求的情况下,安装用于镜检瑞氏染色血涂片的成像设备,并连接500万像素以上的图像采集系统,用于血涂片图像的采集、储存。
1.1.2 开发自动控制系统:配置自动控制马达,编写显微镜自动控制软件,通过控制信号调节载物台的上下运动调焦,并控制玻片的左右、前后运动,模拟人工阅片模式。
图1 血细胞形态自动识别系统框架图
1.1.3 建立数据库:由三位经验丰富的血液学专家识别白细胞、红细胞和血小板,选取结果正常和异常的人血液标本涂片瑞氏染色,选择分类明确的细胞图像存入系统。通过形态识别管理系统提取各类细胞图像的面积、边界和纹理等40多项特征,运用人工神经网络(artificia neural network,ANN)和AdaBoost算法进行训练,建立白细胞六分类、红细胞和血小板图像标准数据库。
1.1.4 开发形态自动识别分析软件:图像处理模块是系统的核心部分。采用先进的图像处理技术、小波信号处理、数据挖掘和模式识别等技术,通过课题组自主研发的计算机识别技术自动判断图像中各区域细胞的重叠情况,正确性要求达到95%以上。
1.1.5 构建数据处理和结果输出模块:结合临床需求对采集到的数据进行处理,输出临床结果。
1.2.2 免疫组化S-P法检测凋亡相关因子Fas、Fasl在胎盘滋养细胞中的表达:参考基因科技Fas、Fasl免疫组化试剂盒说明书,切片常规脱蜡水化,抗原修复,冲洗,过氧化物酶阻断剂孵育10 min,加一抗,室温60 min后,PBS冲洗,加二抗室温30 min后,PBS冲洗,DAB显色,苏木素复染,梯度酒精脱水,封片,光学显微镜下观察并拍照。鼠抗人Fas单克隆抗体、兔抗人Fasl 单克隆抗体、SP免疫组化试剂盒、DAB染色液(聚合物法)均购自基因科技(上海)有限公司。
1.2 系统组成
1.2.1 硬件系统:主要是全自动显微成像单元,由显微放大光学通路和自动控制平台组成。可自动识别血涂片中细胞重叠部分,选取细胞平铺部分,模拟人工阅片,自动调焦;调节血涂片位置。其框架见图2。
图2 显微镜硬件框架图
1.2.2 软件系统:包括图像采集、图像特征提取、识别血细胞并标记、复核结果及生成报告。
1.2.2.1 图像采集:由血液学专家标注血细胞图像中的细胞类型,为机器学习算法提供信号(见图3)。其它有监督学习功能的分类算法也可应用该软件。
1.2.2.2 图像特征提取:提取专家标注细胞的特征数据,包括血细胞的面积、周长、圆度、色度、灰度均值、熵、对比度等。
1.2.2.3 识别血细胞:根据这些图像特征提取算法,自动找到图像中需要的血细胞的区域和位置并做出标记。见图4。
图3 输入专家标注白细胞类型工作界面
1.2.2.4 复核结果:确定分类结果正确性,计算分类准确率,然后确定上述特征中的有效性,根据分类准确性算法的参数,对血细胞图像中的细胞类型进行自动分类。该系统实现和支持的分类算法包括:线性分类算法、二次曲线分类算法、近邻分类算法(KNN),神经网络分类算法(MLP),支持向量机分类算法(SVM),贝叶斯分类算法(bayes error estimation),基于信息量和决策树的分类算法。
图4 自动提取和标记白细胞工作界面
图5 生成报告工作界面
1.2.2.6 工作流程:制备血涂片 → 采集图像 →提取特征→ 识别血细胞 → 复核结果→ 生成报告
2结果系统应用
2.1 白细胞自动识别系统的应用评价
2.1.1 评价对象:随机抽240例白细胞计数范围在(2.0~25.0)×109/L的血液标本,涂片,瑞氏染色,镜检计数,要求白细胞总数超过(3.50~9.50)×109/L范围的数量应大于百分之五十。
2.1.2 评价方案:项目研发的自动识别系统从每张瑞氏染色的外周血涂片中分割出100个白细胞图像,自动分类为中性粒细胞、淋巴细胞、单核细胞、嗜酸性粒细胞、嗜碱性粒细胞和其他有核细胞。所有试验均以人工镜检计数为标准[5]。
2.1.2.1 正确率:在260例血液涂片中抽取240例计算正确率,系统自动扫描血涂片、识别、分类,人工判读细胞图像,正确率为系统正确识别的白细胞数与所有识别的白细胞数的百分比。
2.1.2.2 重复率:在上述240例血液涂片中随机抽取20例,人工审核系统自动判读的每例100帧白细胞,再一次计算白细胞数,与总数2 000个白细胞的百分比即重复率。
2.1.2.3 漏检率:抽240份血涂片余下的20例,划分入选区域,覆盖非入选区域,系统只可识别入选区域。系统对血片进行自动扫描,读取白细胞信息,与人工镜检计数的差值(差值必须为正数)即漏检白细胞数,漏检数与人工镜检计数的百分比即系统漏检率。
2.1.2.4 稳定性:对一张血涂片的相同位置连续检测10次,结果即系统稳定性。
2.1.2.5 检测速度:在上述血片中随机抽20例,计算系统采集、分类和生成报告所用时间的均值即系统检测速度。
2.1.2.6 结果分析 使用Excel 2007软件统计数据。
2.1.2.7 结果:系统计数白细胞2 000个,人工计数1 998个, 重复率为0.1%,系统计数白细胞2 962个,人工计数2 983个,漏检率0.7%,正确率95.1%,稳定性97.7%,检测速度≤5 min/片,总体性能达标。每张血片中嗜碱性粒细胞较少,故存在阅片误差,仅55.4%。白细胞分类计数的正确率见表1,综合性能评价见表2。
表1 240张血涂片分类结果
表2 综合评价性能
2.2 红细胞与血小板自动识别系统的应用评价
2.2.1 对红细胞大小进行预分类:小红细胞,大红细胞,巨幼红细胞,正常红细胞;提示有核红细胞,检验人员可根据复原图总体判断血涂片的红细胞状况。
2.2.2 血小板数量估算:系统可获取血小板概览图,并将概览图中血小板数量换算出平均每高倍镜视野下的血小板数量。人工镜检血涂片,选取分布均匀,视野清晰,估算血小板数量。方法:血小板数(×109/L)=一个高倍镜(油镜)视野中血小板平均个数×15×109/L(或血小板估算经验系数,根据视野面积计算0.16倍)[6]。
3讨论随着临床实验室血液学复检规则的严格执行及临床标本的增加,实现自动化仪器进行细胞形态分析是实验室自动化发展的必然趋势[7-10]。20世纪60年代末研发出第一台可自动搜索血涂片细胞并可对细胞进行分类的全自动研究系统cellscan/gloprw[11],2000年以后,新的检测系统对白细胞形态的识别率达百分之八十以上,同时可识别成熟红细胞和血小板,但主要在欧美国家使用,还没有成熟的血细胞形态检测仪应用于我国市场,因此,建立一个完整的、具有市场应用价值的分析识别产品,有着广阔的应用前景。
随着全自动血细胞分析仪在检验工作中的普及,可快速提供检查结果,但由于方法学的局限性和细胞形态的多样性,仍需配合血涂片细胞形态学检验,以提高血液检查的准确性[12-14]。中科院的洪继光教授等针对白细胞识别问题,提出了反映细胞形状、纹理特征及光密度等上百种参数,结合图像识别方面技术的突破与实践积累,能够很好地解决白细胞实时检测时的精度和速度问题[15]。本研究设计了一个开放性的图像识别管理系统,不仅可以识别血细胞的形态,还可应用到其他主要依靠肉眼判断和识别的工作中,比如:血涂片找疟原虫、尿液沉渣分析、白带分析、前列腺液分析、精液分析等。肉眼显微镜镜检存在速度慢、重复性差、主观性强、缺少图像证据、差错率高等不足,本研究以先进的图像识别技术为基础,建立图像采集、算法训练和算法应用三个功能子模块,组成形态自动识别工作系统,包括由显微放大光学通路和自动控制平台组成的硬件系统,由图像采集、图像特征提取、识别血细胞并标记、复核结果及生成报告的软件系统。除此之外,该系统也是一个柔性可扩展、紧凑而灵敏的血细胞自动分类系统,它将高清晰的显微镜成像、边缘识别数学模型和计算机技术相结合,有效地整合和利用现有先进技术,通过人工镜检结果不断改善对血细胞形态的识别,更加清楚的判断细胞类型,反特征排除,建立细胞与不同疾病之间的联系,提高检验工作在临床诊断中的价值。
通过对血细胞形态识别的自动检测系统多方面的评价,有效地验证了该系统的可应用性,并将其延伸到其他形态学检验中,为临床提供结果,为科研积累数据,促进医学领域的发展。