谢俊祥 张琳
1.中国医学科学院 北京协和医学院 医学信息研究所 (北京 100020)
2.中国青年政治学院 图书馆 (北京 100089)
3.中国科学院大学 (北京 100049)
4.中国科学院文献情报中心 (北京 100190)
内容提要: 随着大数据时代的到来,人工智能在图像分类、检测等任务中相对传统识别方法均取得了令人瞩目的突破。2017年,斯坦福大学人工智能皮肤检测系统发布,人工智能在皮肤病诊断系统中的应用开始普遍。文章从人工智能用于皮肤病诊断的原理、方法、现有系统以及存在问题等方面入手,分析皮肤影像计算机辅助诊断的现状以及未来发展空间,以期推进我国皮肤疾病的医疗诊断水平。
人工智能(Artificial Intelligence,AI)是当前科学技术发展中的一门前沿科学,同时也是一门新思想、新概念、新技术不断出现的新兴学科。其在计算机科学、控制论、信息论、神经心理学、哲学、语言学等多种学科研究的基础上发展起来,目前已被应用到地质勘探、石油化工、军事、医疗诊断等各个领域。早在20世纪60、70年代,人工智能技术就被应用到了医疗常规疾病的诊断上,但由于研究任务的复杂性,缩小了医疗专家系统的研究范围。直至20世纪80年代中期,Pearl的形式论使得贝叶斯网络在计算机上才成为易处理,从那时起,人工智能才在临床诊断问题上得到了实施。但人工智能应用到医学影像领域仍较少,大部分系统不直接利用人工智能获得图像,而是依赖于由观察者建立的主观的观察物[1-3]。近年来,随着人工智能技术及方法的发展,传统图像处理方法得到了改进,开始应用到皮肤病的诊断中。本文对人工智能在皮肤病诊断中的应用原理、现状、存在问题等进行分析,探讨人工智能在皮肤病诊断中应用的未来趋势。
皮肤病是比较依赖形态学特征的学科,皮肤影像是皮肤病诊断的重要手段。皮肤影像诊断由最初的望诊,发展到放大镜和显微镜辅助诊断,再到近年来数字影像学技术。目前以皮肤镜、皮肤超声、皮肤CT为代表的影像技术已经成为临床皮肤病诊断的重要工具[4]。而人工智能技术也正是通过数据挖掘、案例推理等,对皮肤影像进行特征分析和评价,从而对皮肤病进行诊断。
皮肤影像包括皮肤镜、共聚焦激光扫描显微镜、皮肤高频超声、皮肤光学相干层析成像、皮肤太赫兹成像、皮肤光声成像、多光子激光断层成像技术及皮肤组织病理图像等。基于皮肤影像对各类皮肤疾病进行计算机辅助诊断具有客观、可重复的优点,可为医生提供量化的诊断特征,并对皮损类别进行预测,从而帮助医生对病情进行分析和诊断。
计算机辅助诊断系统大致分为5个环节,包括皮肤影像采集、图像预处理、图像分割、特征提取和分类识别。由于皮肤疾病种类繁多,对皮损进行自动分类一直颇具挑战。传统方法往往需要对原始图像进行繁杂的预处理,需要有经验的工程师手动设计特征提取器,选择合适的分类器进行分类。这类方法泛化能力不强,很难实现复杂的多分类任务。
随着大数据时代的到来和计算机硬件的巨大进步,人工智能技术,尤其是卷积神经网络(Convolutional Neural Network,CNN)等,在图像分类、检测等很多任务中相对传统模式识别方法取得了很大的突破。人工智能技术用于皮肤病诊断,正是基于此发展起来的。人工智能技术通过充分挖掘数据集中存在的内在结构,自发地从原始数据中习得有用的特征表达,继而通过搭建分类网络,对皮损部位进行分类,从而做出正确诊断。
在皮肤病诊断中,常用的人工智能方法主要有基于人工神经网络、基于模糊集合、基于粒子群算法和基于遗传算法的应用。
人工神经网络(Artificial Neural Networks,ANN)技术是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,具有自组织、自学习和自适应性和很强的非线性特性,适合解决背景知识不清楚、推理规则不明确和比较复杂的分类问题。其基本思想是用训练样本集对神经网络训练,确定节点间的连接和权值,再用训练好的神经网络分割新的图像数据。该方法能有效解决图像中的噪声和不均匀问题,在心血管疾病、癌症(结肠直肠癌、乳腺癌、甲状腺癌、卵巢癌、脑瘤、肺癌等)、多发性硬化、妇科疾病、前列腺疾病、糖尿病等疾病诊断上并已取得很好的效果,目前人工神经网络已经开始逐渐应用的皮肤疾病的诊断中。
Jaleel等[5]提出了一个基于计算机的早期皮肤癌诊断系统。该系统使用数字影响处理技术和神经网络方法,使用2维小波变换(2-D Wavelet Transform)提取病变部位的分割图像,并基于此对恶性黑色素瘤与其他皮肤疾病进行癌变区分。Jones等[6]则比较了直方图模型和高斯模型在皮肤病检测中的应用,结果显示,在皮肤病检测中,直方图模型在精度和计算成本方面略有优势。Brand等[7]利用皮肤颜色,基于三维RGB概率图比较了简单概率、色彩空间转换和数值有效等三种方法在皮肤检测中的应用。Mittra等[8]则利用一组归一化对称灰度共生矩阵(Grey Level Co-occurrence Matrices)对肌理图像进行分析,判断皮肤疾病状态。刘延喜等[9]利用神经网络方法对366名皮肤病患者的数据进行自动诊断识别试验,有效的降低了诊断错误率。Barata等[10]则分析了皮肤镜检下黑色素瘤的局部和全局特征,发现病变部位的皮肤颜色和肌理对黑色素瘤的检测极为重要。Nidhal等[11]开发了皮肤检测系统,该系统利用皮肤颜色和肌理进行诊断,并以牛皮癣为例,证明该系统准确度。
受影响设备条件限制、环境影响和患者自身情况等诸多因素影响,皮肤影像尤其具有模糊和不均匀的特点,影像中的区域并非总能明晰准确地划分。因此,模糊(Fuzzy)集合概念为描述模糊对象提供了可能。基于模糊集理论的图像分割方法包括模糊阈值分割法、模糊聚类分割法、模糊连接度分割法等。
模糊集合算法是基于RGB三元色原理。M.Hamidi等[12]基于模糊集合算法,提出了彩色图像分割的新算法,该算法能够自动进行颜色分类和图像分割。印度理工学院的Rajen Bhatt等[13]在2009年提出“低复杂性模糊决策树模型(low complexity fuzzy decision tree model)”,用来对病变皮肤区域进行高效分割和识别。Leonid Sigal等[14]基于模糊集合算法提出了一种用于实时系统中的新型皮肤分割方法,该方法适用于各种皮肤类型。Idoko John Bush等[15]提出了利用人工神经网络和模糊集合的集成算法进行皮肤疾病检测。
粒子群优化算法(Particle Swarm Optimization,PSO)是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法。优化问题的解决对应于搜索空间中一只鸟的位置,称这些鸟为“粒子”。每个粒子都有自己的位置和速度(决定飞行的方向和距离),还有一个被目标函数决定的适应值。粒子们追随当前的最优粒子在解空间中搜索。在每一次迭代中,粒子通过跟踪两个“极值”来更新自己。第一个就是粒子本身所找到的最优解。另一个极值是整个种群目前找到的最优解。该方法主要用于医学图像分割、配准和融合等领域。Abdi等[16]基于粒子群优化、支持向量机(Support Vector Machines,SVMs)以及相关规则(Association Rules,ARs)的诊断模型来诊断红斑-鳞状皮肤病,其精确性达到98.91%。
遗传算法首先由美国学者J Holand提出,是一种建立在自然选择和群体遗传学机制基础上的随机、迭代、进化、并行搜索(优化)算法,其主要特点是群体搜索策略和群体中个体之间的信息交换,它能在搜索过程中自动获取和积累有关搜索空间的知识,自适应的控制搜索过程,以求得最优解或近似最优解。赵倩等[17]基于支持向量机和遗传算法对初步提取的皮肤显微图像的特征参数进行优化组合,对皮肤显微图像特征选择问题得到较理想的结果。
皮肤癌是最为常见的人类恶性肿瘤,病因迄今不明。其根据肿瘤细胞的来源不同而有不同的分型,包括表皮、皮肤附属器、皮肤软组织、周围神经、黑素细胞、皮肤淋巴网状组织和造血组织等;而临床表现则分为鳞状细胞癌、基底细胞癌、恶性黑色素瘤以及湿疹样癌。皮肤癌通常由肉眼观察诊断,然后通过活体组织切片和组织学检查确诊。研究人员过去曾试图开发自动分类系统,但由于皮肤病变的外观差异很大,实现这一点并非易事。而斯坦福大学的研究人员安德鲁·伊斯特瓦及其同事,基于谷歌推出的GoogleNet Inception v3 CNN架构,用来自2032例不同皮肤癌病例的12.9万张图像,编写了一套能够应用于医学界检测皮肤癌变的机器学习算法[4]。该算法识别出最常见和病死率最高的皮肤癌类型(分别为角质形成细胞皮肤癌和恶性黑色素瘤),其准确率与21位专业临床医生的表现相当。
中南大学湘雅二医院联合丁香园、大拿科技发布了我国首个皮肤病人工智能辅助诊断系统,该系统主要实现以红斑狼疮为代表的皮肤病人工智能辅助诊断。该系统利用湘雅二院的皮肤病图像资源、临床数据以及专家资源,特别是在红斑狼疮的临床研究和基础研究资料。大拿科技提供人工智能应用数据模型,丁香园在合作中协同各方优势资源。通过建立疾病智能诊断模型、患者服务流程、系统推向行业应用等几个阶段,将该系统的识别准确性提高到85%以上。
北京协和医院与北京航空航天大学合作,开发出皮肤镜图片的自动识别系统;武汉协和医院与香港一家公司合作,应用该公司研发的皮肤智能检测系统(Dr.Skin),已经可以有效地进行常见皮肤病的图像智能诊断;南开大学与北京协和医院合作开发的皮肤病人工智能诊断系统对色素性皮肤痣的辨识准确率已经达到92%以上;北京协和医院、中日友好医院、中南大学湘雅二院等医院成立中国医疗保健国际交流促进会华夏皮肤影像人工智能协作组(Huaxia Skin Image and Artificial Intelligence Cooperation,HSIAIC)致力于开发基于皮肤影像资源的人工智能系统;中日友好医院崔勇教授发起的中国人群皮肤影像资源库(CSID)项目,旨在建立可用于辅助诊断模式的、中国人群特异性的皮肤影像资源,为皮肤病人工智能系统提供可利用的重要学习资源等。
人工智能用于皮肤病诊断,虽然已经有相关的系统及研究表明其技术的先进性,但并非完美无缺,其在临床尚未普遍推广,仍存在一些缺陷,主要表现在以下两方面。
首先,标本的体量不足,皮肤科疾病的病种繁多,仅书本记载的皮肤病种就近3000种,且疾病表现复杂,不同的疾病可能出现相似的表现,而同样的疾病在不同人身上、不同部位、不同发病时期都会有不同的临床表现。另外,皮肤病的鉴别标准和诊断标准尚未统一,如何提取病变部位特征、对皮肤影像的病理图像实现自动识别诊断等问题,使得人工智能皮肤病诊断系统的高效准确的自动识别难以实现。
人工智能皮肤诊断系统对疾病的诊断,是一种医学诊断,可直接代替医生用于临床,并可直接影响患者的生命健康。但误诊一旦发生,人工智能诊断的主体在法律上是人(医生)还是物(医疗器械),尚未定论,因此对于其诊断的准入条件、缺陷或过失标准、法律责任等问题,仍无明确的法律法规规定。
尽管人工智能皮肤病诊断类系统存在以上问题,但人工智能的优势却毋庸置疑。在提高诊断准确率的基础上,如何利用人工智能皮肤病诊断系统实现患者自助导诊,系统自动诊断、治疗、药品配送,以及患者教育、随访和管理服务等,是未来人工智能皮肤病诊断类系统的发展方向。