张婷婷,渠 宁,郑 璞,陈雅玲,史荣亮,嵇庆海,孙国华
1.复旦大学附属肿瘤医院头颈外科,复旦大学上海医学院肿瘤学系,上海 200032;
2.Nuralogix公司,多伦多M5C1C3;
3.复旦大学附属肿瘤医院超声诊断科,复旦大学上海医学院肿瘤学系,上海 200032
甲状腺肿瘤是人体最常见的内分泌肿瘤。普通人群中,通过触诊甲状腺结节的检出率为1%~5%,而采用高分辨率超声检测甲状腺结节的检出率可达19%~68%。根据全球的流行病学资料显示,甲状腺恶性肿瘤发病率呈现逐年递增的趋势[1-2]。目前甲状腺结节诊断通常采用触诊、超声、超声引导下细针穿刺(fine-needle aspiration biopsy,FNAB)、CT和MRI等检查。甲状腺结节的良恶性鉴别最常采用超声及FNAB检查[3]。高分辨率的影像学资料及高质量病理切片有利于准确地诊断,然而影像及病理资料的判读则存在较大的主观性,其主要依赖于诊断医师的知识与经验,而这造成了结果的异质性。另外,患者数量的急剧增加导致了医师劳动强度大幅提升和平均诊断时间的缩短,亦会影响诊断结果。目前,对影像及病理资料的人工判读的准确性及异质性并不理想,成为甲状腺肿瘤诊断发展的瓶颈。
机器学习(machine learning,ML)是一门多领域交叉学科,应用计算机模拟或实现人类的学习行为。因其具备高效率、低消耗、较高的准确性及同质性等优势而在社会各领域的应用获得了越来越广泛的关注,其中早期的人工神经网络(artificial neural network,ANN)及新兴的深度学习(deep learning)最为突出[4]。机器学习和医学领域的结合已经成为当前热点之一,在短短的几年时间内已经取得丰硕的成果,其中计算机辅助诊断(computer-aided diagnosis,CAD)最为突出[5-6]。该研究主要对深度学习及神经网络在甲状腺肿瘤诊疗中的应用进行介绍。
人工神经网络是模拟大脑神经元的生物活动非线性模型。基本原理如同神经元的分级突触组织,接收多个输入信息的神经元分配给每个输入信息以权重,并根据这些加权数据的总和来决定是否触发向下级的传导。ANN通常由至少三层逻辑单元组成,包括输入层、隐藏层和输出层。输入层负责接收相关数据资料,一个或多个以某种特定分层方式连接的隐藏层合成此数据,最后输出层接收处理后数据并生成答案。ANN在数据处理上具有许多独特的优势:包括可以快速识别线性类型,对于混杂及不完全数据的处理,高容错能力和从训练数据推广的能力等。另外,ANN的分析无需从潜在关键变量的假设或提前识别开始,因此可用以发现某些既往可能被忽视的潜在预后影响因素。
深度学习是一种深层的人工神经网络,曾被评为2013年度十大科技突破创新技术之一。它是一种非线性的多层特征学习模型,通过自动检测原始数据(例如像素、字符等)的特征信息并进行分类,然后按照非线性模块化的方式学习到其多个层次上的特征,再进行逐步简化及整合并产生最终的结果[6]。与传统ANN相比,深度学习具有更多的隐藏层。深度学习的算法可以自动地提取分类需要的低层次或高层次特征,高层次特征是指该特征依赖于分级(层次)学习的其他特征[4]。例如对于图像资料,深度学习算法首先从原始图像学习得到的一个低层次表达(例如边缘检测器、小波滤波器等),然后在这些低层次表达的基础上再建立表达(例如已有低层次表达的线性或者非线性组合方式),再重复这个过程,最后得到一个高层次的表达。深度学习会根据研究问题和数据的特性对学习的层数进行调整,以达到更好的学习效果。深度学习已经演化出不同的分支,如卷积神经网络(convolutional neural network,CNN)、循环神经网络(recurrent neural network,RNN)等[4-6]。
与传统ML相比,深度学习的最大优势在于仅需小部分人工编程,即可自动识别并学习数据源特征并进行分析及传递。另外,深度神经网络具有更多的隐层,能够为模型提供更高的抽象层次,从而显著提高模型的分类能力。深度学习多采用监督式学习(supervised learning),即在机械学习过程中提供对错指示,一般是在数据组中包含最终结果(0,1),并通过加权的形式减少学习过程距离目标函数的偏移,从而提高结果的准确性。另外,深度学习具有对混杂因素不敏感,仅对特定目标特征敏感的优点[4]。
机器学习最早主要用于完成语音识别及图像辨认等工作。虽然ML在数据处理方面具有诸多优势,然而其发展却长时间受限于硬件条件的不足,直至GPU计算模块的出现极大地提高了矩阵运算的速度,将原先可能需要耗时数月的训练过程缩短为数天乃至数小时,从而促使各种相关技术快速发展并受到广泛应用[4]。
随着技术的发展与成熟,机器学习目前已成为社会各领域研究的热点。Google公司的多国语言识别翻译系统、DeepMind项目及苹果公司的Siri语音服务系统应用的就是深度学习技术。2016年初,基于深度学习算法的电脑围棋程序Alphago击败了前世界排名第一的韩国围棋选手李世石。卷积神经网络是深度学习在图像处理领域最突出的技术,以其为基础的图像识别系统项目已被许多大型公司争相开展,包括Google、Facebook、Microsoft、IBM及Adobe等。NVIDIA、Intel及三星公司等也欲将CNN技术应用于智能手机、相机及机器人的成像系统中。
机器学习应用于医学领域可追溯到20世纪90年代。基于CNN的系统在图像识别上已显示出其自身的价值,在许多图像识别任务中达到接近乃至超越人类的表现水平。美国斯坦福大学的皮肤癌人工智能检测系统,通过与人类皮肤科专家诊断的比较,其特异度和灵敏度均得到了认证,且该结果刊登在医学杂志Nature上[7]。另外,许多学者报道了运用ML技术开展各方面医学领域的研究,包括基因组学、蛋白质组学、组织病理学及预后风险评估等。Danaee等[8]通过对TCGA数据库中1 097例乳腺癌患者及113例正常人组织RNA测序结果的研究发现,深度学习可用于处理肿瘤基因检测多维而复杂的数据。Pouliakis等[9]尝试应用深度学习技术进行肿瘤病理细胞学诊断。Litjens等[10]报道应用深度学习进行乳腺癌及前列腺癌的组织细胞学诊断。Lundin等[11]研究ML对乳腺癌5、10及15年生存预测的准确率分别为0.909、0.886及0.883。深度学习在医学领域的应用前景还在不断探寻之中。
医学影像诊断是机器学习在医学领域最早应用的方向,其作用也得到了广泛的肯定。目前已有许多学者报道了机器学习方法在甲状腺肿瘤影像诊断中的应用。Zhu等[12]对618例患者超声影像资料分析,纳入形状、边缘、回声强度、内部组成、钙化及晕征共6项因素,采用ANN方法建立鉴别甲状腺肿瘤良恶性模型,模型准确率、敏感性和特异度分别为84.3%,84.5%及79.1%。Lim等[13]通过比较ANN模型与两名经验丰富的影像科医师对109枚甲状腺结节的良恶性判断,发现ANN模型的诊断准确率显著高于医师的准确率。经过对543例甲状腺结节患者(其中恶性207例,良性403例)超声影像资料的分析,Yu等[14]建立ANN诊断模型,应用另外45例患者资料验证模型的准确率、敏感性及特异度分别为90%、88.24%及90.91%。Halicek等[15]对50例进展期头颈部肿瘤(其中甲状腺癌21例)进行高光谱成像(hyperspectral imaging,HSI)的CNN分析,提出CNN运用于HSI图像时可以较好的区分肿瘤与正常组织。Chi等[16]采用深度卷积神经网络根据超声影像对428例公用数据库资料及164例当地资料进行甲状腺结节良恶性鉴别,前者准确率、灵敏度和特异度分别为98.29%、99.10%和93.90%,后者分别为96.34%、86%和99%。与其他肿瘤相似,机器学习在甲状腺肿瘤影像诊断中同样表现出了较高的准确率及较好的应用前景。
在甲状腺肿瘤超声引导下FNAB中,机器学习同样表现出了在细胞病理学诊断中具有较高的准确性。Gopinath等[17]采用多种计算机学习技术对FNAB细胞学图像资料进行分析,其准确率最高可达到90%。另外,Mansoor等[18]通过对5例甲状腺滤泡状腺瘤的1 904枚细胞及5例甲状旁腺瘤患者的690枚细胞采用ML的方法进行分类,结果准确率为98%。两项研究均提示机器学习在甲状腺癌细胞学诊断中的应用前景。对于FNAB细胞学病理诊断为恶性潜能未定的453例甲状腺肿瘤患者,Ippolito等[19]采用ANN算法根据患者病理及临床资料将其分为高危或低危组,并与最终术后组织病理类型进行对比,结果表明ANN法的敏感性及特异度均高于传统细胞学分类方法。另外,Saylam等[20]对116例术前穿刺提示恶性潜能未定的结节性甲状腺肿患者纳入相关临床因素建立ANN模型预测结节恶性可能,经与术后病理比对,ANN模型预测准确性较高,AUC值为0.824。但目前相关报道较少,机器学习在甲状腺肿瘤病理诊断中的作用还有许多方向有待研究。
目前关于机器学习在甲状腺肿瘤诊疗其他方面的研究较少。Jajroudi等[21]报道了ANN法在甲状腺癌患者预后评价中的作用,该研究纳入7 706例样本,采用ANN算法建立甲状腺癌预后评价系统,其对5年生存预测的准确率、敏感性及特异度分别为90.7%、95.9%和83.7%。当前机器学习在医学领域的应用也主要集中在医学辅助诊断和治疗方案选择上,较少涉及随访部分,这也是未来需要进一步探索的方向。
机器学习具有高效率、高准确性等诸多优点,它的快速发展与广泛应用给社会各领域带来了动力,机器学习和医学领域的结合已经成为当前热点之一。与其他疾病相比,机器学习在甲状腺肿瘤诊疗中的研究相对较少。根据现有研究结果,机器学习在甲状腺肿瘤超声诊断、细胞学诊断中具有较好的应用前景。然而甲状腺肿瘤的诊疗中还存在许多其他有待提高的方面,如影像诊断中CT及MRI的诊断价值、甲状腺滤泡状癌的诊断及甲状腺癌患者预后评价等。随着机器学习在甲状腺肿瘤诊疗中的应用不断扩展,或许其在未来可以在改善和提高甲状腺肿瘤的诊断、治疗及患者管理等许多方面发挥巨大作用。
[1] CHEN W, ZHENG R, BAADE P D, et al. Cancer statistics in China, 2015 [J]. CA Cancer J Clin, 2016, 66(2): 115-132.
[2] LA VECCHIA C, MALVEZZI M, BOSETTI C, et al. Thyroid cancer mortality and incidence: a global overview [J]. Int J Cancer, 2015, 136(9): 2187-2195.
[3] HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association Management Guidelines for Adult Patients with Thyroid Nodules and Differentiated Thyroid Cancer: The American Thyroid Association Guidelines Task Force on Thyroid Nodules and Differentiated Thyroid Cancer [J]. Thyroid, 2016, 26(1): 1-133.
[4] LE CUN Y, BENGIO Y, HINTON G. Deep learning [J].Nature, 2015, 521(7553): 436-444.
[5] SUZUKI K. Overview of deep learning in medical imaging[J]. Radiol Phys Technol, 2017. doi: 10.1007/s12194-017-0406-5. [Epub ahead of print].
[6] LEE J G, JUN S, CHO Y W, et al. Deep learning in medical imaging: general overview [J]. Korean J Radiol, 2017,18(4): 570-584.
[7] ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologistlevel classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115-118.
[8] DANAEE P, GHAEINI R, HENDRIX D A. A deep learning approach for cancer detection and relevant gene identification[J]. Pac Symp Biocomput, 2016, 22: 219-229.
[9] POULIAKIS A, KARAKITSOU E, MARGARI N, et al.Artificial neural networks as decision support tools in cytopathology: past, present, and future [J]. Biomed Eng Comput Biol, 2016, 7: 1-18.
[10] LITJENS G, SANCHEZ C I, TIMOFEEVA N, et al. Deep learning as a tool for increased accuracy and efficiency of histopathological diagnosis [J]. Sci Rep, 2016, 6: 26286.doi: 10.1038/srep26286.
[11] LUNDIN M, LUNDIN J, BURKE H B, et al. Artificial neural networks applied to survival prediction in breast cancer [J].Oncology, 1999, 57(4): 281-286.
[12] ZHU L C, YE Y L, LUO W H, et al. A model to discriminate malignant from benign thyroid nodules using artificial neural network [J]. PLoS One, 2013, 8(12): e82211.
[13] LIM K J, CHOI C S, YOON D Y, et al. Computer-aided diagnosis for the differentiation of malignant from benign thyroid nodules on ultrasonography [J]. Acad Radiol, 2008,15(7): 853-858.
[14] YU Q, JIANG T, ZHOU A, et al. Computer-aided diagnosis of malignant or benign thyroid nodes based on ultrasound images[J]. Eur Arch Otorhinolaryngol, 2017, 274(7): 2891-2897.
[15] HALICEK M, LU G, LITTLE J V, et al. Deep convolutional neural networks for classifying head and neck cancer using hyperspectral imaging [J]. J Biomed Opt, 2017, 22(6):60503.
[16] CHI J, WALIA E, BABYN P, et al. Thyroid nodule classification in ultrasound images by fine-tuning deep convolutional neural network [J]. J Digit Imaging, 2017,30(4): 477-486.
[17] GOPINATH B, SHANTHI N. Computer-aided diagnosis system for classifying benign and malignant thyroid nodules in multi-stained FNAB cytological images [J]. Australas Phys Eng Sci Med, 2013, 36(2): 219-230.
[18] MANSOOR I, ZALLES C, ZAHID F, et al. Fine-needle aspiration of follicular adenoma versus parathyroid adenoma:the utility of multispectral imaging in differentiating lesions with subtle cytomorphologic differences [J]. Cancer, 2008,114(1): 22-26.
[19] IPPOLITO A M, DE LAURENTIIS M, LA ROSA G L, et al.Neural network analysis for evaluating cancer risk in thyroid nodules with an indeterminate diagnosis at aspiration cytology:identification of a low-risk subgroup [J]. Thyroid, 2004,14(12): 1065-1071.
[20] SAYLAM B, KESKEK M, OCAK S, et al. Artificial neural network analysis for evaluating cancer risk in multinodular goiter [J]. J Res Med Sci, 2013, 18(7): 554-557.
[21] JAJROUDI M, BANIASADI T, KAMKAR L, et al. Prediction of survival in thyroid cancer using data mining technique[J]. Technol Cancer Res Treat, 2014, 13(4): 353-359.