孙宏军, 何 亮, 俞飞虹, 徐海燕
(1.南京航空航天大学 经济与管理学院,江苏 南京 210016; 2.南京医科大学第一附属医院 超声医学科,江苏 南京 210029)
调查结果显示,人群中罹患甲状腺结节率为19%~67%,其中5%~15%患者的甲状腺结节为恶性,如果甲状腺结节检查为恶性,则该患者有很大几率患上了甲状腺癌[1]。超声检查是甲状腺结节诊断、治疗及随访评估中首选的影像学检查方法[2]。
超声检查诊断取决于超声设备的性能,更与超声医师的认知和经验密切相关,不同医师对同一病例的诊断结论可能差别很大,给临床处理带来困难。2009 年Horvath等[3]首次建立了甲状腺影像报告和数据系统,规范了甲状腺结节的超声诊断报告。此后,不同地区的研究者陆续提出了多种超声风险分层系统,提高了对甲状腺结节的鉴别诊断能力[4~6]。美国放射学会于 2017 年发布了《ACR甲状腺影像报告和数据系统:ACR TI-RADS委员会白皮书》提出了一种风险分层方法(以下简称 ACR TI-RADS)[7]。刘红等回顾性分析661例甲状腺结节的超声影像学资料及病理结果,证实了ACR TI-RADS在定性诊断甲状腺结节中具有较高的临床应用价值[8]。ACR TI-RADS根据甲状腺结节的成分、回声、形态、边缘和强回声五个影像学特征进行诊断,将甲状腺结节分为1~5类, 1类阴性,2类良性,3类可能良性,4类可疑恶性,5类高度怀疑恶性。因此,基于超声图像的甲状腺结节诊断可以归结为多属性多类别的分类问题,使用计算机分类算法构建模型能够辅助医生进行甲状腺结节分类诊断。
多属性分类是指根据对象在多个指标下的综合评价将其分类至相对应的类别。多属性分类可以有效地处理复杂指标条件下的决策分析问题,在社会经济生活等方面有着广泛的应用。分类决策算法应用主要有两类:一类是直接分类法,即决策者直接给出效用函数、指标权重和分类阈值等决策参数,运用这些参数建立多属性分类模型进行分类,如ELECTRE TRI[9];另一类是基于案例学习的方法,即决策者通过对具有代表性的典型案例集的分类结果进行学习,构建对应的模型,对所有评价对象进行分类,其代表性算法有优势粗糙集[10]以及基于案例距离的分类决策模型[11,12]等方法。直接分类法依赖于决策者的认知水平和经验积累,如ELECTRE TRI需要进行大量的两两比较以及人工设定分类阈值。当决策者认知具有局限性时,直接给出这些分类结果较为困难。案例学习分类法是基于多属性评价指标将方案按照某种特征进行类别划分,将具有相似性质的方案划分为同一类别。
在甲状腺结节诊断过程中,超声医师通常对病兆特征显著的病例直接给出诊断结果;对较为复杂的病例,则需要通过多个指标比较分析鉴别诊断。本文借鉴该思想,提出了一种两阶段多属性分类方法,第一阶段根据ACR TI-RADS中的直接分类标准构建决策树模型,识别出区分性最好的类别;第二阶段,通过典型案例学习建立多属性分类决策模型,计算指标权重和分类阈值,完成复杂案例的分类。
疾病诊断思维是指利用客观临床资料按科学思维方法进行思维活动,以达到揭示疾病实质,解决疾病诊治问题的目的[13]。在诊断学中,将疾病的诊断程序分为四个步骤:(1)收集临床资料,是指了解病人的情况并进行相关检查;(2)分析、评价、整理,将分散的临床资料整合起来,从整体上进行思考和推理,结合临床经验及专业知识,找出诊断线索;(3)提出初步诊断;(4)确立及修正诊断。根据疾病诊断思维,结合甲状腺结节的临床实际诊断过程,专业医师在超声检查时首先会根据个人的医学知识和经验积累给出一个初步诊断,通常特征明显较容易识别的疾病在此时即可识别出来;然后再详细分析超声图像,对较为复杂、难以区分的情况进行鉴别诊断,最终给出诊断结果。因此,本文在借鉴该诊断思维和临床实践的基础上,针对甲状腺结节的诊断问题提出一种两阶段多属性决策方法。
甲状腺结节分类诊断问题可以描述为根据成分、回声、形态、边缘和强回声五个影像学特征将甲状腺结节诊断为5个类别,各分类说明详见表1。
表1 甲状腺结节类别说明
其中,类别1表示良性(阴性),属于正常甲状腺,不需要随访进一步检查。而类别2~5表示有恶性风险的甲状腺,需要进一步检查诊断,严重的需要手术治疗等。因此本文主要是对类别2~5这4个类别进行鉴别诊断。
成分、回声、形态、边缘和强回声等影像学特征是多属性分类的属性,其影像学描述及量化表示分值参考甲状腺ACR TI-RADS分级标准[7]。基于多属性决策的甲状腺结节分类诊断过程如图1所示,可以使用如下数学表示:
图1 甲状腺结节诊断分类示意图
(1)案例集A,A={A1,…,Ai,…,A|A|},其中Ai为第i个评价对象,|A|为A集合元素个数。
(2)评价指标集C,C=(C1,C2,C3,C4,C5),表示甲状腺结节诊断的{“成分”,“回声”,“形态”,“边缘”,“强回声”}五种特征。其中Cj为第j个评价指标。
(3)对于评价对象Ti的第j个评价指标Cj(Ai),取值根据ACR TI-RADS评价标准得出。
(4)分组G,G(G1,G2,G3,G4),表示甲状腺结节的2~5类别,其中gm为第m个分组。
(2)案例集从历史诊断记录获得,不失一般,本文设定,Tm⊆A,并且Tm∩Tn=Ø(∀m,n=1,…,5,m≠n),即案例集均来自总体评价对象集,并且由于不同分组特点代表性,各自的案例集不存在交集。
ACR TI-RADS将结节按照成分、回声、形状、边缘、强回声五个指标,分别根据超声特征赋予相应分数。表2给出了五个指标可能出现的特征及其对应的得分。在结节评估时,超声医生从每个指标中选择对应的要素然后计算该结节总得分,从而确定结节的ACR TI-RADS级别。本文关于五个指标的量化方法,依据ACR TI-RADS中结论。
表2 甲状腺结节指标量化说明
ACR TI-RADS给出一种甲状腺结节直接分类方法,即将每一种属性量化后的分值相加,按照分值的总和进行分类。基于该分类方法,本文构建四个分类决策树,如图2所示。通过案例测试,识别出区分性最好的类别。
图2 二分类决策树模型
直接分类法对于特征明显的甲状腺结节能够快速分类,但是对于特征区分不明显尤其是需要鉴别诊断的情况,难以有效分类。本文针对这种情况,提出基于案例距离的多属性分类方法对复杂病例进行分类。基于案例距离的多属性分类流程如图3所示,以2个指标3个分组为例,案例距离用欧式距离表示,通过学习典型案例集构建目标函数,求解最优权重和阈值并对全体对象进行分类。
图3 分类流程示意图
3.4.1 案例距离的设定
对于给定的案例集T,通过直接分类法识别出分组g1=Ti后,采用基于案例距离的多属性分类方法对剩余案例Tm(m=2,…,5;m≠i)进行分类,相关定义如下。
3.4.2 多属性决策模型的构建
对于第m组以外的分组的案例应满足以下约束条件,∀q∈{1,2,…,|Tm|},Tq∈(T-Tm):
根据阈值和约束条件的设定,易知案例集Tm分类的总体误差平方和:
数据来源于南京医科大学第一附属医院,从16份中文超神诊断电子病历数据P={P1,P2,…,P16}中,分别用T2={p6,p3,p4,p11},T3={p14,p12,p15,p1},T4={p10,p5,p13,p16},T5={p7,p9,p8,p2}表示,按照成分、回声、形状、边缘和强回声5个指标属性及诊断结果提取决策信息,并根据上文指标量化方法对各案例属性进行量化,构建包含4个类别的可量化计算的案例集,详细信息见表3。
表3 甲状腺结节案例数据集
针对本文甲状腺结节分类问题,通过构建的案例数据集,按照文章第2节两阶段法分析,详细计算过程如下。
(1)第一阶段:采用直接分类法对各类别分类并计算分类正确率,如表4所示。
表4 直接分类正确率
由表4所知,T2的直接分类正确率最高,因此ACR TI-RADS 2的区分性最好。
Step1构建优化模型学习案例集。案例集采集的依据是:每个案例集包含4个案例;其中前3个案例所对应的5个属性评价结果与所在组一致,后2个案例分别从另外两个案例集中选取。
Step2计算各案例集的分组中心点,并进一步计算各案例到分组中心点的距离,详细结果见表5。
表5 案例样本到分组中心点距离
Step4使用LINGO 17.0求解得,R3=0.1093,W3={0.1178,0.0764,0.1036,0.1032,0.5993};R4=0.2684,W4={0,0.1405,0.5677,0.2918,0};R5=0.1831,W5={0.1121,0.0839,0.1137,0.3109,0.3793},将其代入公式(3),可以求得各样本与分类中心点的距离D(Pi)。
表6 样本中心点距离-阈值计算结果
多属性分类模型的权重反映了特征的重要程度。通过分析表3数据集和多属性模型的权重W3,W4和W5可知,T3组的案例数据相对于T2组的案例数据,主要变化在于最后一个属性“强回声”,而W3的最后一个属性的权重为0.599,表明该属性对于确定分组的影响最大。同理可知,T4组的“形状”属性对该分组影响最大,其权重为0.5677;T5组的“边缘”和“强回声”是决定案例是否属于该组的重要特征,因此其权重分别为0.3109和0.3793。
另外,本文所提方法根据临床疾病诊断思维将决策过程分为两个阶段,与直接分类方法相比较:
(1)甲状腺结节分类诊断问题本质上是典型的多分类问题,因此可以尝试直接采用成熟的模型和算法进行求解。分别采用逻辑回归模型(LR)和层次支持向量机(H-SVM)来解决本文甲状腺结节智能诊断分类问题。考虑到本研究中的类别是互斥的,属于单标签多分类问题,因此对于逻辑回归模型,直接通过分类器得到4个类别;对于层次支持向量机,采用“偏态树”的形式,即每一个包含多个类别的节点上的分类器,将一个类别与其它类别分开,直至所有节点上只有一个类别。因案例数据有限,此处采用交叉验证法,案例数据分为4组(每组分别从T2~T5中各取1个案例),其中3组作为训练数据,1组作为测试数据,共进行3次,详细计算结果如表7所示。
表7 分类模型精度比较
由表7可知,采用本文所提两阶段多属性分类方法的结果优于其它方法。
(2)使用文中第二阶段的基于案例距离的多属性分类模型直接进行分类决策。由公式(9)可知直接进行分类至少需要7个约束不等式,则目标函数即计算7个误差调整系数平方和的最小值,而本文所提方法的目标函数是计算5个误差调整系数平方和的最小值,如表8所示,计算复杂度更低。
表8 分类模型计算时间比较
综上分析,本文所提方法对于解决甲状腺结节分类诊断问题,在分类精度和计算复杂度上比直接分类求解更有优势。
本文针对甲状腺结节的诊断问题进行了拓展研究,提出一种两阶段分类方法,在第一阶段根据经验知识进行直接分类,将区分性较好的类别直接识别出来;第二阶段,通过学习已有的案例信息,构建最优化求解模型得出分类参数信息,将其应用于案例的分类决策。该方法适用于多分类疾病诊断等一类医学问题,例如乳腺结节的诊断分类、高血压的分期诊断等。该方法以临床疾病诊断思维为指导,充分利用专业医生的医学知识和临床经验,又结合了多属性决策模型的优势,对特征明显易于分类的情况直接给出诊断结果,对于较为复杂需要鉴别诊断的病例能够通过模型快速得到结果且准确率高,这些优势使得本文方法便于推广使用。