娜迪亚·阿卜杜迪克依木,姚娟,刘志华,严传波
1.新疆医科大学基础医学院,新疆乌鲁木齐830011;2.新疆医科大学第一附属医院,新疆乌鲁木齐830011;3.新疆医科大学公共卫生学院,新疆乌鲁木齐830011;4.新疆医科大学医学工程技术学院,新疆乌鲁木齐830011
恶性肿瘤一直都是威胁人类健康的重大疾病,我国对此也是高度关注,专门设置恶性肿瘤登记机构[1]。在中国发病率和死亡率居前10 位的恶性肿瘤中,食管癌的世界比重分别超过60%和50%[2-4]。食管癌流行情况在不同民族、区域间有很大差异[5]。中国部分少数民族食管癌死亡情况比较的统计结果表明,以新疆哈萨克族食管癌最多,其男女合计死亡率比其他少数民族高2~3倍,比全国平均水平高2.3倍,新疆托里县哈萨克族食管癌发病率高达155.9/10万,大大高出该县其他民族(22.3/10 万)和全国平均水平[6]。X 线钡餐检查方法简便,病人容易接受,因此仍是目前诊断食管癌的重要手段之一。
我国是世界上包虫病患病最严重的国家之一[7],在西北畜牧业发达地区较常见,其膨胀性生长过程对肝组织产生压迫症状,因该病流行性广、危害性大,严重影响民众身心健康[8-9]。包虫病中肝包虫病的发生率大于65%[10-11],肝脏是包虫病最先累及的器官,使肝内出现单个或多个膨胀性的囊肿。2016年我国约有5 000 万人受困于该病,有360 余县流行包虫病,患病人数高达17 万,国民患病率达0.34%。新疆、甘肃、西藏、宁夏、四川等地该病10年病死率达到94%,被称为“虫癌”[12]。由于新疆地区肝包虫发病率较高,此病已成为新疆地方性特色病[13]。因肝包虫病起病隐匿,临床症状和体征无特异性,故及时发现并正确诊断肝包虫病,对降低肝包虫的发病率和死亡率有重要意义。针对肝包虫检查,CT 图像具有检查方便、图像清晰、高分辨率、快速有效以及成本较低等优点,是目前肝包虫病诊断中首选且应用最为广泛的一种检测手段[14-15]。
无论是食管癌X射线图像还是肝包虫病CT图像都需要专业医师人工阅片,随着数字化医学影像技术的发展,各种类型的现代医疗诊断与成像设备提供了大量的医学图像信息,对医学图像信息的定性解读方式已经不能满足临床的需求。仅凭借医生自身的经验容易产生漏诊和误诊,因此需要医生和计算机辅助诊断系统(CAD)合作完成这项艰巨任务。图像技术的发展改善了医学影像的质量和显示方式[16],经过医学图像处理的医学图像信息能够直观反映患者的疾病状态,为计算机辅助诊断系统提供科学性依据,从而使临床医生对人体内部病变部位的观察更直接、更清晰,确诊率也更高[17],这为疾病的确诊以及选择有效的治疗方法起着决定性的作用。
常规X线钡餐检查常不易发现浅表性小癌肿,还存在术前分期分型不规范等问题。肝包虫不同病症表现出了较相似的CT 成像,医生在诊断时会受个人主观性和经验有限性等干扰,导致精准识别不同类型肝包虫病有一定的困难。这些状况催促研究者进一步改进影像诊断检查的功效,研究食管癌和肝包虫计算机辅助系统,实现病灶的自动分型和分期,从而辅助临床医师选择合适的治疗方法,对于治疗疗效有重要的意义。研发新疆哈萨克族食管癌和地方性肝包虫病计算机辅助诊断系统,需要对食管癌和肝包虫病影像图像进行大量的研究。因此,这是一项既有挑战性又有重大社会经济价值的研究课题。
国内外研究者也将计算机辅助诊断技术应用于疾病诊断且做了许多研究工作,然而应用于地方性疾病的相关研究较少。Demir 等[18]提出用于检测计算机断层扫描图像中肺结节的CAD 系统,实验结果显示,候选结节的外表面纹理特征可用于提高计算机断层扫描图像中肺结节检测的灵敏度。Ohura等[19]提出一种通过使用二进小波变换和分形维数从内窥镜图像诊断早期食管癌的计算机辅助方法。Zhan 等[20]从多序列磁共振图像中提取高、低级别胶质瘤的特征,然后训练KNN 分类器对胶质瘤进行分级从而设计一种自动有效的CAD 工具,协助放射科医师对胶质瘤进行分级。Sommen 等[21]提出一个基于早期食管腺癌的CAD 系统,使用两种特征提取算法提取图像的纹理和颜色特征,通过支持向量机进行分类,由分类结果可知查全率达到95%。孔喜梅等[22]根据不同类型肝包虫病CT 影像特征,利用决策树C4.5 分类模型来研究新疆地方性肝包虫CT 图像的单囊和多子囊等分型。胡彦婷等[23]在研究肝包虫图像分类时提出一种结合多尺度局部二值模式和尺度不变特征转换纹理分析后通过线性支持向量机对特征值分类的肝包虫CT 图像分类方法,为新疆肝包虫病CAD系统的研发提供有利参考。本研究充分利用食管癌X 射线图像和肝包虫病CT 图像自身有用信息,讨论Hu 不变矩形状特征与小波纹理特征在KNN 机器学习分类模式下的分类准确率,实验流程如图1所示。
图1 实验流程图Fig.1 Flow chart of experiment
研究对象来自新疆医科大学第一附属医院放射科,在专业医师的指导下,选择新疆哈萨克族食管癌溃疡型、缩窄型和蕈伞型钡餐造影图像各422 幅,共1 266幅图像;选择单囊型和多子囊型肝包虫CT图像各420幅,共840幅图像。
图像预处理的目的是改善图像质量和突出需要分析的特征,对于输入质量较低的图像,经过处理输出高质量的图像[24]。本研究所使用的图像预处理方法是图像归一化、中值滤波去噪和直方图均衡化。首先对每一幅图像提取病灶感兴趣区域(Region of Interest,ROI),然后对所提取的病灶区域进行归一化处理,得到大小为30×30像素的食管癌X 射线ROI图像和大小为76×51的肝包虫病CT的ROI图像。中值滤波算法是以某像素的领域图像区域中像素值的排序为基础,将像素领域内灰度的中值代替该像素的值。它的优点在于能够抑制随机噪声的同时不使边缘模糊。直方图均衡化是图像处理领域中利用图像直方图对比度进行调整的方法。本研究把去噪后图像的直方图变换为均匀分布的形式,增加像素灰度值的动态范围,从而达到增强图像整体对比度的效果,预处理结果见图2和图3。
图2 X射线图像预处理结果Fig.2 Results of X-ray image preprocessing
图3 肝包虫CT图像预处理结果Fig.3 Results of hepatic hydatid CT image preprocessing
根据实验侧重点的不同,特征提取有很多种方法,如灰度特征、颜色特征、纹理特征、形状特征以及基于点的梯度特征的提取等。特征提取对后面的分类器设计和效果有很大的影响,所以根据实验内容,选取合适的特征提取方法对整个实验的结果起着重要的作用。本研究引用形状特征提取方法和纹理特征提取方法。
形状是图像中的重要可视化特征[25]。形状特征是对象区域对象几何特性的反应[26]。形状特征的描述通常有两种常用的方式:基于边界的描述和基于区域的描述,基于区域的描述方法中常用的方法是不变矩。1962年Hu 提出的不变矩特征具有对平移、旋转和比例缩放是不变的特性[27-28]。
纹理是物体表面的固有特征之一[29]。纹理指图像中像素(或子区域)的灰度变化规律,图像中局部不规则而宏观有规律的特性称为纹理。诊断学中区分病灶的重要形态特征是正常的组织结构被破坏,反映在影像图像上则呈现为图像纹理的改变。因此,可利用纹理特征的差异对不同患者的影像图像进行分析,从而实现对病灶组织和正常组织的分类识别[30]。小波变换方法被广泛应用于纹理特征的分析和分类研究中。
X 光是穿透性很强的射线,能够穿透人体,在穿透人体时,被含钙的成分(骨)、水分(血液等)、软组织(肌肉)等吸收而减弱。X线会穿过人体,遇到被遮挡的部位,底片上不会曝光,成像后呈现白色,因此可以呈现出所检查部位的基本形态。大量的研究表明,不变矩的独立性佳、具有很好的抗噪能力、不会出现信息的冗余现象、具有良好的抽样特性,非常适合对多畸变不变图形的识别以及分类。除此之外,Hu不变矩具有平移、旋转和尺度不变性,而且对图片的质量有一定的要求,图片质量越高鲁棒性越好。本文中经过图像预处理后的食管癌X射线图像,提取的Hu 不变矩形状特征,较清晰地表达了食管癌图像的形状细节。CT 不同于普通X 线成像,它是用X 线束对人体一定厚度的层面进行扫描得到的断层解剖图像,其密度分辨力明显优于X 线图像,使得X 线成像不能显示的解剖结构、病变组织纹理等得以显影。小波变换特征具有多分辨率(也叫多尺度)的特点[31],可以由粗到细逐步观察信号,它在时域和频域都有表征信号局部特征的能力,有利于检测信号的瞬态或奇异点。
K 最近邻(K-Nearest Neighbor,KNN)分类算法是理论上比较成熟的方法,也是最简单的机器学习算法之一[32-33]。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别[34-35]。由于KNN 方法主要靠周围有限邻近的样本,而不是靠判别类域的方法来确定所属类别,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。
图4是阐述KNN分类过程的经典实例。图4中,训练样本包括三角形(Trangle)和正方形(Square)两类。为了描述简便清晰,我们分别用T和S代表它们的数目。图中的圆点是测试样本,K是距离测试样本最近的训练样本数目,即最近邻数目。当K=3 时,如图中虚线小圆圈范围内,T=2,S=1,T>S,由上面叙述的原理,此时测试样本被分配到三角形一类。而调整K=5 时,如图中虚线大圆圈范围内T=2,S=3,T<S,此时测试样本标签判定为正方形[36]。
图4 KNN算法实例图Fig.4 An example for K nearest neighbor algorithm
本研究使用溃疡型、缩窄型和蕈伞型食管癌X射线病灶图像和单囊型、多子囊型肝包虫CT病灶图像用于提取其纹理和形状特征,应用KNN分类器对食管癌X射线图像和肝包虫CT图像进行分类。不同特征提取方式下3种食管癌两两分类的分类结果与单囊型和多子囊型肝包虫分类结果如表1和表2所示。由表1可知,使用Hu不变矩形状特征进行分类时,3种类型食管癌分类准确率都比使用小波变换纹理特征分类准确率高,这说明对食管癌分类,提取Hu不变矩形状特征结合KNN分类器比较适合。由表2可得,肝包虫病CT图像小波变换纹理特征分类准确率比Hu不变矩形状特征分类准确率高,这说明对肝包虫病分类,提取小波变换纹理特征结合KNN分类器比较适合。
在KNN分类器训练过程中,当K取不同的值时,得到的分类准确率也不同,本研究中K值取1~20,采用10 折交叉验证的方法,10 折交叉验证用于评估模型的预测性能,尤其是训练好的模型在新数据上的表现,可以在一定程度上减小过拟合。图5a~c 分别为溃疡型与缩窄型、蕈伞型与缩窄型、溃疡型与蕈伞型食管癌的Hu 不变矩特征和小波变换特征及混合特征的分类准确率随着K值变化而变化的折线图。根据图5a~c 的变化趋势可以看出,Hu 不变矩特征在K=1 时取最高值,分别为85.60%、74.42%、76.65%。小波变换特征分类最高准确率分布在K取值15~20时,分别为64.39%、61.75%、61.31%。这说明食管癌分类中对于Hu 不变矩特征KNN 分类模型K=1 为最优值。
表1 食管癌不同特征下的分类准确率(%)Tab.1 Classification accuracy under different features of esophageal cancer(%)
表2 肝包虫病不同特征下的分类准确率(%)Tab.2 Classification accuracy under different features of hepatic hydatid disease(%)
图5 食管癌和肝包虫病分类准确率与K值变化曲线Fig.5 Classification accuracy and K value curve of esophageal cancer and hepatic hydatid disease
图5d 是单囊型与多子囊型肝包虫Hu 不变矩特征,小波变换特征及混合特征的分类准确率随着K值变化而变化的折线图。根据图5d 的变化趋势可以看出,小波纹理特征在K=15~20 时取最高值为78.62%,这说明肝包虫分类中对于小波纹理特征KNN分类模型K=15~20为最优取值范围。
ROC 曲线指受试者工作特征曲线,是反映敏感性和特异性连续变量的综合指标。曲线下面积越大,诊断准确性越高。在ROC 曲线上,最靠近坐标图左上方的点为敏感性和特异性均较高的临界值。ROC曲线越凸越近左上角表明其诊断价值越大。曲线下面积可评价诊断准确性。ROC面积值在0.5~0.7时有较低准确度,0.7~0.9 时有一定准确度,在0.9 以上有较高的准确度[25]。
如图6a~c所示,溃疡型与缩窄型、蕈伞型与缩窄型、溃疡型与蕈伞型食管癌在Hu不变矩形状特征下的ROC曲线下面积都在0.7~0.9内,分别为AUC≥0.861、AUC≥0.747和AUC≥0.769。以上实验结果表明,食管癌X射线图像基于Hu不变矩形状特征的KNN分类器ROC曲线下面积都大于0.7,分类有一定的准确度。图6d显示,肝包虫CT图像基于小波变换纹理特征的KNN 分类器ROC 曲线下面积≥0.852,大于0.7,分类有一定的准确度。因此,针对新疆哈萨克族溃疡型、缩窄型和蕈伞型食管癌形状特征和肝包虫病纹理特征本研究有一定的诊断价值。
图6 食管癌和肝包虫不同特征下的ROC曲线图Fig.6 Receiver operating characteristic curves under different features of esophageal cancer and hepatic hydatid disease
本文根据所选取的病灶图像的形状和纹理特点,分别提取图像的Hu不变矩形状特征和小波变换纹理特征,利用KNN分类器对特征值进行分类。实验结果显示,对于食管癌X射线图像Hu不变矩形状特征具有较好的特征表达能力,Hu不变矩形状特征结合KNN分类器的研究方法对新疆哈萨克族食管癌分型具有一定的参考依据。对于肝包虫CT图像小波纹理特征具有较好的特征表达能力,小波纹理特征结合KNN分类器的研究方法对地方性肝包虫分型具有一定的参考依据,也为后期研发计算机辅助诊断系统奠定基础。后续将使用深度学习方法对新疆哈萨克族食管癌和地方性肝包虫病进行疾病分类并应用于计算机辅助诊断系统。