申相 陈英 温占波 郑劲林 周正干
1(北京航空航天大学机械工程及自动化学院 北京100083)
2(军事医学研究院辐射医学研究所 北京100850)
3(北京慧荣和科技有限公司 北京101102)
当涉及大量人员受照的辐射事故发生时,救治方案需要及时确定他们的受照剂量[1],以便了解暴露人员接受治疗的优先次序,并减轻其对自身受照情况的担心。由于事故的突发性,虽然职业人员能够使用自身携带的物理剂量计进行剂量监测,但更多情况是没有佩戴或即使佩戴了也无法准确获得物理剂量的,这就需要使用生物剂量方法来估算暴露人员的受照剂量。除此之外,微核检测作为放射职业人员体检中的一个必须项目,已经列入国家强制标准。胞质分裂阻滞微核(Cytokinesis-block micronucleus,CBMN)分析是目前除染色体畸变金标准之外最有效的剂量估算方法,其通过在细胞培养过程中加入细胞松弛素B,将人外周血淋巴细胞中双核细胞(Binucleated cell,BC)的微核(Micronuclei,MN)率与受照剂量相关联,常用于放射生物剂量学中的未知剂量估算[2-5]。MN 来自于电离辐射诱导产生的分裂滞后的整条染色体或染色体片段。当细胞受到辐照时,MN在细胞核分裂后期处于滞后状态,因此不被包含在细胞的主核中,而是成为小的圆形实体保留在细胞质中[6]。相较于双着丝粒染色体分析,CBMN 分析更加简单且制片速度更快,因此更加适用于大批人群的快速生物剂量测定。
人工视觉分析的主观性及其较长的检测时间[7-8],无法满足快速检测的需求。为解决这些问题,国内外一些学者及公司尝试多种自动化分析方法以求快速准确地鉴定BC 以及MN。目前只有德国蔡司等公司采用荧光染色的方法检测BC 和MN,且该方法对于常规吉姆萨(Giemsa)染色的标本检出率较低[9-11]。国内尚无CBMN自动化分析软件。CBMN 自动化分析系统一般由硬件设施与软件程序组成,硬件设施由上位机控制,目的是自动获取高清细胞图像。分析软件则以高清细胞图像作为输入,通过分析算法进行自动化检测与分析,最终输出剂量估算需要的数据,包括MN率、微核细胞率等。国外从20世纪90年代初开始了CBMN 自动化分析研究,目前国际上较知名的系统为 Metasystems (Metafer, 德国) 和PathFinder (IMSTAR, 法国)。 无论是德国Metasystems 系统还是法国的PathFinder 系统,它们都采用传统的门控识别策略[12-13]。本文主要对细胞图像的自动化获取方式及自动化图像分析算法的研究进展进行综述,总结并展望CBMN 自动分析的未来发展趋势。
目前国际上主流的细胞图像获取方式有自动显微镜成像以及成像流式细胞仪(Imaging flow cytometry,IFC)成像。起初,为了增加图像自动化分析的通量和计数的可重复性,CBMN 分析的成像方式是使用显微镜和电荷耦合器件(CCD)相机成像。近几年,一些研究者和公司将流式细胞术应用到了CBMN 分析上,并结合荧光显微镜的可成像特点与常规流式细胞仪的高通量特点,研发了IFC[14-15]。因为自动显微镜成像使用的是细胞涂片,所以可以使用Giemsa 或者荧光染料进行染色,前者可以长期保存。IFC使用的是细胞悬浮液,并使用激光器进行荧光诱发,因此只能使用荧光染料染色,用过无法保存且不具有可重复性。
自动显微镜成像系统(图1)一般由三个部分组成:(1)彩色/荧光显微镜,带有10×、20×、40×、60×和100×物镜的光学显微镜;(2)电荷耦合器件相机,使用彩色或者黑白的相机,该相机通过接口连接到计算机,实时显示和拍照;(3)运动控制台和存储系统。计算机通过发送指令,使运动控制台按照规划的路径移动,同时显微镜上下移动调焦,然后拍摄捕获细胞图像并将其存储在计算机中。在自动显微镜成像产品领域,德国的Metasystems 以及法国的PathFinder 是国际上知名的产品。其中,Metasystems 已被研究人员广泛用于各种研究,例如临床病理、癌症研究、细胞及分子遗传学检测等[16]。Verma 等[17]介绍了他们使用Metasystems 的操作过程。首先,他们将荧光染色的载玻片装载到Metasystems 系统的移动载玻片扫描平台上,然后对当前载玻片中心进行手动聚焦,随后系统自动进行载玻片扫描,自动聚焦和扫描整个载玻片大约需要8 min。系统使用10×物镜捕获细胞核和MN 的图像,并将单元格和MN图像重新显示在软件界面上(单元格形成画廊视图中显示的坐标),同时通过高分辨率的相机捕获图像以进行保存。如果需要连续扫描多张载玻片,则需要在开始时为所有的载玻片手动进行中心点聚焦。
经过研究人员验证,PathFinder 中用于MN 测定的自动化图像分析系统可用于毒理学领域,监测生物体内细胞对诱变剂的暴露情况,其中包括电离辐射[13]。Decordier 等[12]描述了PathFinder 系统的自动获取图像的步骤,其中硬件设施的操作与Metasystems基本相同,但他们只使用Giemsa染色的样片。整个检测和计数过程分为两个步骤:第一步,检测细胞质和细胞核,找出BC;第二步,在检测到的BC 中搜索MN。由于PathFinder的MN 分析使用了400×的放大倍数,而放大倍数越大,扫描以及算法分析的时间越长,且该系统仍然需要人工视觉验证,因此每天仅能扫描12 张载玻片。
图1 自动显微镜系统组成Fig.1 Composition of automatic microscope system
得益于载玻片可重复扫描的特点,使用自动显微镜成像方法时,可以存储图像并在需要时重新扫描样片,也可以在扫描的同时鉴定和记录单核、多核细胞的图像。但扫描得到的图像效果受限于标本的制作质量,而标本的质量可能因实验室条件和操作者技术水平而异。在扫描时间方面,对于同样大小的样片来说,放大倍数越大,需要寻找拍摄的图像就越多,自动化扫描以及算法分析消耗的时间也越长。而较低的放大倍数则可能导致图片不够清晰以及像素点信息不够,影响后续自动分析的识别效果。
IFC是一种新的细胞成像技术,具有常规流式细胞术(Flow cytometry,FCM)的高通量特点与荧光显微镜的可成像特点。IFC 与传统的FCM 相似,都是用荧光染料标记细胞,并将荧光染色后的待测细胞制作成细胞悬液[18-19]。然后用一定的压力将悬液压入流动室,通过用高压将缓冲液从鞘液管喷出,并保持鞘液管出口方向与待测样品流成一定角度,这就使得缓冲液能够包绕细胞悬液高速流动,组成一个圆形的流束。最后,细胞悬液在圆形流束的包围下,单行排列,依次通过检测区域。在发光源方面,流式细胞仪以激光作为发光源,用垂直照射的方式照射在细胞流上。被荧光染料染色的细胞在激光束的照射下,产生散射光和激发荧光,从而被二极管和光电倍增管接收并识别计数。FCM 因为缺乏细胞成像与显示,所以无法直接检测双核细胞[20-23]。而IFC可以对细胞进行成像,在得到不包含细胞质的细胞核、MN荧光图像的基础上进行BC 以及MN 的识别,因此可以用于CBMN的自动化分析。
美国的MilliporeSigma 公司研发了一款名为ImageStreamX(ISX)的IFC[24]。ISX 同样是将被荧光染色后的细胞悬液聚焦到检测区域,通过发光二极管和至少一个激光发射源对细胞进行照射。激光照射被荧光染色的细胞后会产生透射光和散射光,这些光由物镜收集。最后,通过光谱分解元件对这些光进行分解,并聚焦到电荷耦合器件相机上进行成像。在ISX中,光谱分解元件可以将波长为400~800 nm 的光分成特定的范围,并投射到电荷耦合器件相机的不同感应位置上,这使得ISX可以对多种荧光染色的细胞进行不同颜色的荧光成像且互不影响。
哥伦比亚高通量微创放射生物剂量学中心则将IFC与高通量机器人技术集成,开发了基于定制机器人平台的快速自动生物剂量测定技术(Rapid automated biodosimetry tool,RABiT-II)[15]。机器人系统可以自动执行包括血液样品培养、离心、染色在内的所有样品处理步骤,并将样品接入到IFC中进行分析和成像。通过使用自动化机器人系统,RABiT 系统具备每天处理6 000 个血液样品(每份样品至少为0.03 mL)的能力,并且可以做到无偏差的样品处理和图像数据采集。
由于IFC可以成像,因此IFC兼具荧光显微镜的可成像特点与常规流式细胞仪的高通量特点,并可以对细胞图像进行视觉验证、分析算法门控参数和阈值的优化和验证。
CBMN自动化分析对于MN的判定标准与人工判定标准基本保持一致[25-26],即MN的直径为主核平均直径的1/16~1/3,不具有折光性,可以与主核接触,但二者不重叠不连接,染色深浅与主核相同或略浅(偶尔可能染色更深)。传统的CB 微核测定法是通过显微镜下人工判定微核图像来确定,但人工的方式不仅费时费力,并且判定的结果容易受到检测者的主观经验影响。由于不同的检测者对于判定标准的解读可能存在不同,尤其是对于微核与主核“重叠、接触”的图像。在目前只能获取二维图形的情况下,受限于染色程度、拍摄角度以及个人经验等条件,对于一些形状复杂的细胞图像,不同检测人员之间可能会产生不一致的判定结果。与传统的人工计数方式相比,CBMN 自动化分析提供了高通量、高稳定性的结果,在统一判定标准的前提下,将检测者的判定方式和经验造成的主观影响降至最低。
目前国际上存在多种自动化分析方法用于鉴定BC 及其中的MN。无论图像的自动化获取方式如何,不同自动化分析算法的主要区别之一在于分析的对象是否包括细胞质。当只有细胞核信息而没有相关细胞的细胞质信息时,表示分析的对象只有细胞核。而这类算法不仅要定位细胞边界并估计每个细胞中的细胞核数目,还需要对细胞核相对于彼此的位置及其相对大小进行分析。当这类算法使用的细胞图像来自于自动显微镜成像方法时,通常要求操作者在制作样片时尽可能降低细胞的密度,因为细胞密度较大时,有可能出现不同细胞的细胞核被错误地分配给同一个细胞的情况。
MetaSystems 使用的是自动显微镜的图像获取方式,其自动化分析算法的分析对象为细胞核和MN[9]。该算法首先寻找细胞核,再将两个被染色的相邻核判定为BC,然后通过在BC 的两个核周围定义一个圆形区域作为该细胞的领域,最后在该区域内寻找MN。因此,这种方法可以自动检测BC和MN并为其计数。MetaSystems自动检测算法采用的是传统门控策略,通过设定一系列参数作为门控策略的“门”,符合“门”标准的就被判定为BC或者MN,用于BC和MN的参数基于形态学标准,例如面积值、长宽比、凹度等。Varga等[10]描述了他们使用MetaSystems的经验,发现人工视觉计数和自动计数之间具有较高的相关性,但自动化MN计数的数量仅为人工计数的35%左右。而不同的染色方式和染色深浅也会对MetaSystems的自动化识别结果产生影响。Tamizh等[11]介绍了他们在MetaSystems 系统(3.9 版本)上分析碘化丙啶(PI)荧光染色和Giemsa 染色样片时的区别,发现人工分析Giemsa 染色和荧光染色的玻片时,两者的分析结果没有显著差异,而在自动分析的结果中两者具有非常显著的差异。自动化分析时,Giemsa染色的相关系数为0.875,而PI染色的相关系数为0.962。因此可以证明,使用MetaSystems自动分析荧光染色样片得到的结果与人工视觉计数的结果相关系数更高,其假阳性率也更低。即对于MetaSystems的自动化MN分析,使用PI染色要优于Giemsa 染色。 在分析时间方面,MetaSystems使用的是10×物镜和单色黑白相机[9],这使得其能够很快地完成一张载玻片的扫描与分析(5~10 min),但也有可能会将一些载玻片或者相机镜头上的杂质误判为MN(该黑点刚好出现在BC内)。还有Verhaegen[27]研究了一种算法,首先对自动显微镜成像得到的细胞图像进行单阈值分割,然后计算包括各目标区域的面积在内的7个特征参数并进行判定。然而,这种分析算法与MetaSystems 的算法具有同样的缺点,即容易造成误识别,将分离在外的两个不同细胞的细胞核识别成一个BC。
关联细胞质的自动化分析算法是一种将整个细胞作为一个检测单位的算法,一般使用不同的阈值来实现图片背景、细胞质、细胞核/MN 的分离。在染色方面,染料不仅要标记细胞核/MN,也要标记整个细胞,这样,不仅细胞核是可见的,整个细胞(包含细胞质)也都是可见的。可视化的细胞核和细胞质能够将细胞核/MN 与相应的细胞相匹配,从而可以更精确地识别BC和MN。
PathFinder 使用的算法就是一种关联细胞质的传统门控策略识别算法。该算法将整个染色的细胞作为检测的起点。不仅能够识别BC,也能够识别出单核以及多核细胞。PathFinder使用Giemsa染色的载玻片进行图像分析,系统首先识别细胞的胞质以判断是否为一个完整的细胞;然后,检测细胞中的核数目,从而鉴定是否为BC;最后在第三步中对MN 的数量进行检测。Decordier 等[12]发表了他们在PathFinder系统上的经验,同时使用了改进的载玻片制备技术来降低细胞密度并提升细胞分散度。经过测试,PathFinder的CBMN分析显示出了与人工计数具有良好的相关性,其CBMN自动化计数为人工计数结果的68.5%。经过验证,PathFinder平台的新型CBMN自动化图像分析系统可用于监测生物体内细胞对诱变剂的暴露情况,包括电离辐射[13]。由于IMSTAR 使用了400×的放大倍数,而放大倍数越大,扫描以及算法分析的时间越高,如果再加上人工验证(排除假阳性)的时间,PathFinder每天仅能扫描12张载玻片。
除了PathFinder,还有其他一些学者研究的关联细胞质的传统门控策略识别算法。Lyulko 等[28]介绍的RABiT 系统通过使用双重染色(细胞质与细胞核分别荧光染色)来降低MN假阳性结果。在RABiT 系统使用的双重染色的载玻片中,分别利用Cell mask orange 染色剂以及4',6-二脒基-2-苯基 吲 哚 (4', 6-diamidino-2-phenylindole,dihydrochloride,DAPI)染料对细胞核和细胞质进行染色,然后通过荧光显微镜以及多台摄像机分别成像,从而保证分析系统的高通量。其图像分析算法以细胞质为分析起点,分别对细胞质和细胞核的图像进行单独分析。图像分析算法采用Matrox imaging library(MIL)阈值化方法来分离细胞核/MN,同样采用门控策略来对细胞、细胞核、MN进行判断,使用的判定参数包括细胞和细胞核的圆(椭圆)形度、面积、紧密度、粗糙度和费雷特伸长率等。
Szirmai等[29]提出一种可对MN 图像进行自动分析的系统,同样使用自动显微镜成像的照片。该软件基于细胞、细胞核和MN 的轮廓线来识别BC 和MN。使用Giemsa 染色剂对淋巴细胞进行染色,但要求样片染色效果好(染色浅且均匀)。当细胞核与细胞质在背景强度上有显著差异时,才能通过阈值法得到较好的检测效果。Bahreyni等[30]描述了他们在使用10×目镜以及40×物镜下捕获的图像进行自动化分析时,对BC 以及MN 计数的结果。他们设计的软件能够在各种细胞质颜色强度和外周血涂片中含糊的MN 情况下,检测到BC,并进行了200 张图像的实验测试。Böcker等[31-32]研制的淋巴细胞微核图像分析系统包括两步:首先,在低倍镜(10×物镜)下寻找BC 并记录其位置;然后,再转到高倍镜(63×物镜)下识别其中的MN。其测试结果为:BC 的识别能力约为人工的65%,MN识别的准确率约为71%。同时该研究也指出MN 的识别准确率较低的主要原因有:Giemsa染色导致出现MN伪像;一些MN体积极小;MN 与胞浆对比度差;MN 粘连(尤其是对于高剂量射线照射后的样本)。由于采用了先低倍镜查找再高倍镜分析的步骤,获取图像需要的时间大大增加。
国内也有一些学者进行了CBMN 图像识别算法的研究。闫学昆[33]发表了一种自动化图像分析算法,该算法使用MetaSystems 平台在63×物镜放大倍数下拍摄得到的细胞图像,载玻片上细胞使用Giemsa 染色。算法将整个图像处理流程划分为图像的预处理、自动分割、淋巴细胞区域的分类、双核淋巴细胞的自动识别、粘连细胞的判别与分离、MN的自动识别和计数这6个步骤。双核淋巴细胞以及MN的自动识别采用传统门控策略,使用的判定参数包括面积、缺陷率和长宽比等。
曾理等[34]将时频分析方法(即小波分析算法)应用到CBMN 图像的边缘提取算法中,通过时频分析方法将图像的灰度值集中到细胞边缘附近,从而得到噪声影响小、边缘连续且清晰的细胞核(含MN)图像,且同时保证了MN 的清晰度,使得MN能与主核有明显的区别。与传统的边缘提取法相比,该算法具有噪声低、边缘清晰的特点。
易东等[35]建立了一种消除细胞图像的斑点缝隙噪声的方法。该方法采用灰度倒数加权法来消除缝隙噪声,对二值图像使用收缩再扩张的方法来消除斑点噪声,并使细胞边缘光滑。实验结果表明,灰度倒数加权法能使得图像边缘上丝状和黑色区域里的小洞被有效地去除;而二值图像收缩再扩张的算法可以把一些小的块状杂质去掉。该方法也可用于其他图像噪声消除的处理。
IFC 算法的分析对象是不包含细胞质的细胞核/微核的荧光图像,虽然IFC 理论上具有很高的通量,但是实际研究中发现IFC的MN检出率并不高,只有使用显微镜测量MN数量的20%~30%。
Rodrigues 等[14]介绍了他们使用ISX 的经验。通过使用ISX系统,他们可以在无需制作载玻片的情况下捕获悬浮细胞中的图像。ISX使用门控策略来分析每个BC 的MN 数量,使用的判定参数包括细胞核/MN 面积、圆形度、长宽比和像素梯度下降值等。ISX可以在约5 min内以40×或60×物镜的放大率收集包含数千个细胞图像的数据文件,并可以得到单/多核细胞的百分比,剂量反应曲线的详细数据以及包含核质桥和核芽的高分辨率细胞图像。Verma 等[17]对ISX 进行了测试,证明ISX获得的MN数量为放射生物剂量法中使用显微镜测量MN数量的30%左右,因为对于一些较小的MN或非常靠近主核的MN,系统可能会出现遗漏。
Wang 等[15]将成像流式细胞术集成到了RABiT-II 中。首先在样本的处理方面,通过调整血液与培养基的比率、在细胞固定之前添加低渗液等措施优化核荧光(DRAQ5)染色的效果,从而使BC的产量提高81%;然后,在成像处理算法方面,对处理算法进行修改,从而减少了图像分析的时间,其使用的判定参数包括细胞核/MN 圆形度、面积值、宽高比、两个核的重叠度、各个核之间的距离等。在RABiT-II 系统中,所有的样品处理步骤均由RABiT-II cell explorer 机器人系统自动执行;最后,他们对使用4 Gy 照射的血液样本进行测试,发现自动化分析获得的MN数量约为放射生物剂量法中使用显微镜测量MN 数量的20%。
虽然IFC具有高通量的特点,但是MN检测率并不高,加之IFC只能使用荧光染料染色(样本保存时间短)和较高的硬件设施成本,因此目前IFC在CBMN自动化分析领域尚未广泛应用。
无论是自动显微镜成像还是IFC,其目的都是为了获取高清的细胞二维图像。由于二维图像只能显示某个角度的细胞形态,一些藏在细胞核背面的MN以及核质桥往往会被遗漏或者在图像中显示不完整。在自动化分析算法方面,绝大部分的算法都是使用传统门控识别策略,由于这种策略的识别率低,在自动化分析时就需要更多的血液样本来获取足够的BC。
随着硬件设施的精度和稳定性的不断提升,人们已经能够在更短的时间内获取更多更全面的细胞图像信息。因此,如何在更多细胞图像信息下进行更全面更符合需求的CBMN 自动化分析将成为这个领域未来的重点研究方向。
(1)基于三维图像的CBMN 自动化分析。本质上,细胞是一个三维实体,随着技术的不断进步,从多个不同角度获得单个细胞的多个图像会成为可能,从而可以重构出三维的细胞实体,这将有助于捕获所有CBMN 中的生物标志物(如核质桥、极小的MN、藏在细胞核背面的MN 等),从而进一步提高MN的检出率,并提升剂量估算的准确性。完整核质桥数据也能为将来发展以核质桥为基础的生物剂量估算研究提供基础。
(2)使用机器学习或深度学习的自动化分析算法。随着硬件系统性能和存储设备容量的提升,研究人员已经可以采集并存储到越来越多的细胞图像,非常适合对这些海量数据使用机器学习或深度学习的方法进行训练。
(3)自动化程度、检出率更高的CBMN 自动化分析。使用自动化制片,可以制作出标准统一的样片。再通过提高制片技术,制作染色均匀且染色程度浅、细胞密度低的载玻片,能够进一步提升MN的检出率。在现有国民经济水平不足以支持全面使用荧光染料检测的情况下,通过彩色图像识别,以方便区分杂质,能够降低误识别率,提升检测结果的精确度。