基于深度学习的人工智能在病理诊断的应用进展与展望*

2018-01-19 19:34张世豪冼丽英高敏陈志晓
中国医学创新 2018年25期
关键词:诊断系统机器病理

张世豪 冼丽英 高敏 陈志晓

在1956年,由几位科学家在达特茅斯会议提出了人工智能概念。得益于计算机技术和互联网的高速发展,人们看到了人工智能在诸多领域的巨大潜力。随后,高科技公司和社会资本踊跃进入并积极参与和推动人工智能的发展。如今,人工智能可谓是如火如荼,四处开花结果。目前,基于深度学习的人工智能已经影响了病理学以及与其相关的行业的工作模式。为什么基于深度学习的人工智能在医学界、学术界乃至工业界受到如此广泛的关注?病理学科面临什么样的窘境?基于深度学习的人工智能将如何解决这些问题?本文将带着上述问题,介绍基于深度学习的人工智能在病理诊断的应用进展,并简要分析在这一领域的发展。

1 深度学习、机器学习与人工智能的关系

人工智能是计算机科学的一个分支,它是一种产生出与人类智能相似表现的智能机器,是人们试图通过研究、开发人工智能来模拟、延伸和扩展人类智能的理论、方法、技术及应用系统[1]。

学习是人类具有的一种重要智能行为,机器学习是一种实现人工智能的方法。实现机器学习最基本的做法是通过算法来使机器解析数据、并从数据中学习规律。

深度学习是一种实现机器学习的技术,在机器学习中深度学习是一种基于对数据进行表征学习的方法[2]。由于无监督学习训练深度神经网络和残差网络的出现,深度学习被人们有争议地认为是一种独立的学习方法。

2 深度学习的由来

从机器学习模型的层次结构维度来看,机器学习的发展历程经过了两个阶段,分别是浅层学习和深度学习。深度学习被认为是一个相对于浅层学习的概念。

2.1 浅层学习阶段 1960年文献[3-4]提出迭代法(Delta规则)之前,机器学习中一直没有引入隐层的概念。1984年文献[5-6]研究者提出受限玻尔兹曼机(Boltzmann machine),便是这种概念延伸出的算法。1986年,Rumelhart等[7]研究者提出的反向传播算法(Backpropagation algorithm),成为这种概念延伸出的经典算法。这种算法在机器学习中实质是简单感知器的收敛程序,能让人工神经网络模型从大量训练样本中简单地学习一些能用简单网结解决问题的规则。往后数年间陆续有浅层机器学习模型被提出,如支撑向量机(Support Vector Machine)、Boosting算法等。这个时候的人工神经网络虽然也被认为是多层感知器,实际上由于没有足够多层网络训练的经验,多数例子是只含有一层隐层网络(特征层次)的浅层模型。

2.2 深度学习阶段 通过对猫视觉皮层细胞的探讨,揭示了高级动物视觉神经的机理,与高级动物视觉神经的机理相似,深度神经网络同样具有丰富的层次结构,区别于浅层学习,深度学习的模型结构含有多层隐层网络,且着重特征层次的特性,在算法上常表现为权重叠加。在1989年,Lecun等[8]研究者提出了卷积神经网络(Convolutional Neural Network),便是高级动物视觉认知模型延伸出的网络计算模型。

在2006年,Hinton等[9]研究人员在一篇关于机器学习中实现深度学习的文章中报道了两项重要成果:(1)很多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类。(2)无监督学习的“逐层初始化”(layer-wise pre-training)可有效克服深度神经网络训练上的难度。从此掀起了基于深度学习的机器学习热潮,如今依旧热度不减。

3 基于深度学习的人工智能在病理诊断的应用

基于深度学习的人工智能已在乳腺癌、胃癌、肺癌等多种疾病病理诊断中应用[10-14],范围集中于早期肿瘤筛查、疾病分级和良恶性诊断等方面。

3.1 乳腺癌病理领域 文献[15]基于深度学习的机器学习方法构建了一个“乳腺影像报告数据系统”用于检测评判乳腺癌患者CT图像,验证阶段取得了显著的成绩。文献[16]基于卷积神经网络和计算机图像处理构建了一个智能图像诊断系统对细胞学涂片进行检测评判,发现二分类(癌和非癌组织)与病理专家的一致性高达0.833,四分类(正常组织、良性疾病、原位癌和侵袭癌)与病理专家的一致性高达0.778。2016年在英国英格兰诺丁汉市举办的PathSoc大会上,基于深度学习的人工智能的自动人表皮生长因子受体-2评分系统对人表皮生长因子受体-2评分的结果优于病理专家[17]。

3.2 胃癌病理领域 Bejnordi等[18]研究者基于深度学习的机器学习方法构建了一个智能图像诊断系统对细胞学涂片进行检测评判,发现对于胃癌分类与病理专家的准确性高达69.90%。Yoshida等[19]研究者同样基于深度学习的机器学习方法构建了一个智能图像诊断系统对细胞学涂片进行检测评判,发现三分类[非肿瘤、癌(包括可疑癌)和腺瘤(包括可疑肿瘤性病变)]与病理专家的一致性为0.556,二分类的敏感度高达89.50%、阴性预测值高达90.60%。

3.3 肺癌病理领域 张缨等[10]研究者基于人工神经网络和计算机图像处理构建了一个“肺癌早期细胞病理电脑诊断系统”对细胞学涂片进行检测评判,发现系统能完成肺癌主要病理类型(肺鳞癌、腺癌以及小细胞癌等)的细胞病理诊断;系统与病理专家的符合率高达91.80%;以术后组织病理为“金标准”,系统的敏感度、特异度和准确性分别为94.79%、90.91%、94.20%。

4 展望

人们健康意识不断提高对医疗卫生提出了的更高要求,因此各类疾病的液基细胞学筛查和诊断的需求量不断增加。同时,我国执业病理医生和细胞病理学筛查员的职业回报率低且工作环境恶劣,以至于相关执业人员不断流失[20-22]。三甲医院病理医生必须每天高强度阅片,不单耗费大量精力,也因为工作疲劳导致工作能力暂时降低(不能完成任务或诊断效能降低)。这种状况已经持续许久,至今未能有效解决,着眼将来基于深度学习的人工智能病理诊断系统有望能化解这一窘状。

基于深度学习的人工智能特别适合于学习结构化数据,也特别适合解决结构化数据分类问题。数字化病理图像是一种结构化数据,是基于深度学习的人工智能创建或训练的绝佳材料[23-25]。基于深度学习的人工智能病理诊断系统正实现着过往只有人类才能完成的工作和任务,在医学领域,特别是病理学领域展现出了独特的优势。不久以前,数字化病理技术和计算机图像处理技术得到长足发展,数字切片扫描仪和计算机在医院得到广泛应用,解决了基于计算机图像处理的病理诊断系统不可避免的工程问题,也为基于计算机图像处理的病理诊断系统带来了更广阔的发展空间。因此,病理图像是基于深度学习的人工智能的绝佳应用场景。

目前基于深度学习的人工智能病理诊断系统在病理诊断中仍然存在失真的情况,然而病理诊断是终末诊断,诊断结果不允许失真。解决此类问题的主要途径是增加医疗数据以及精准标注,特别是增加由病理专家标注的医疗数据,因为训练集用于监督学习中精准标注是高质量模型的先决条件,训练集源于偏差或不完整的数字化病理图像,会影响建立模型的效果(最终决策会产生失真);或者深入研究无监督学习的深度学习系统,试图让系统解决进行人工类别标注成本高或难以人工标注类别的问题;或是从另外一些方面整合医疗信息,如分子检测、基因测序等;同时,由于疾病类型和病症繁多,病理诊断针对每单以病种建立模型是病理标注简洁化的方式,因此病理标注需要亚专科化,病理标注团队需要制定标准化的流程。还有,病理学是一门经验性医学,目前病理样本的类型存在分布不均或部分病例稀缺等问题,从业者应该联合起来,分享优秀算法和有价值病理样本,打破利益集团的垄断。总之,试图通过各个方面力求提高基于深度学习的人工智能系统在病理诊断中的准确性。围绕基于深度学习的人工智能在病理诊断深入研究,将为新型医学概念与医疗模式带来无限可能。

猜你喜欢
诊断系统机器病理
机器狗
机器狗
病理诊断是精准诊断和治疗的“定海神针”
开展临床病理“一对一”教学培养独立行医的病理医生
CTCS2-200H型列控车载设备运用状态在线诊断系统的研究与应用
列控车载设备智能监测诊断系统开发探讨
区间轨道电路智能诊断系统的探讨
信号集中监测智能预警及诊断系统的设计与实现
未来机器城
不一致性淋巴瘤1例及病理分析