崔勇 于建斌 邹先彪 李航 刘洁 孟如松 刘华绪 谢凤英 马维民 常江
100029北京,中日友好医院皮肤病与性病科(崔勇);郑州大学第一附属医院皮肤性病科(于建斌);解放军总医院第一附属医院皮肤性病科(邹先彪);北京大学第一医院皮肤性病科(李航);中国医学科学院 北京协和医学院 北京协和医院皮肤性病科(刘洁);解放军空军总医院皮肤病医院(孟如松);山东省皮肤病医院(刘华绪);北京航空航天大学宇航学院图像处理中心(谢凤英);上海麦色信息科技有限公司(马维民);优麦医疗(常江)
·专家视角·
亟需加快建设中国人群皮肤影像资源库:高质量皮肤影像是构建智能辅助诊断系统的基础
崔勇 于建斌 邹先彪 李航 刘洁 孟如松 刘华绪 谢凤英 马维民 常江
100029北京,中日友好医院皮肤病与性病科(崔勇);郑州大学第一附属医院皮肤性病科(于建斌);解放军总医院第一附属医院皮肤性病科(邹先彪);北京大学第一医院皮肤性病科(李航);中国医学科学院 北京协和医学院 北京协和医院皮肤性病科(刘洁);解放军空军总医院皮肤病医院(孟如松);山东省皮肤病医院(刘华绪);北京航空航天大学宇航学院图像处理中心(谢凤英);上海麦色信息科技有限公司(马维民);优麦医疗(常江)
皮肤位于人体表面,很多皮肤病仅根据皮损的“可视化特征”即可确诊,因此皮肤病学是最适宜应用各种图像技术的临床二级学科[1⁃2]。随着设备研发水平和数据分析技术的不断提高,构建智能辅助诊断系统的条件已逐渐成熟。作为智能辅助诊断系统的必备基础,大规模的高质量皮肤影像是整个实施路径中最为值得关注的问题。
皮肤病种类繁多,经典教科书《Rook′s Textbook of Dermatology》记载的皮肤病诊断名称超过2 000种,对皮肤科医师的诊断能力提出很高要求。诊断行为及其准确度受到很多因素的影响(如学习能力、分析能力、记忆能力、生理心理状态等),因此不同医师的诊断能力和水平之间存在显著差异。
皮肤影像是基于影像技术发展起来的一系列辅助诊断方法,主要包括皮肤摄影、皮肤镜、皮肤表面3D分析仪、皮肤共聚焦显微镜、皮肤超声等。皮肤摄影最早可以追溯到1848年,Hullihen医师拍摄1例因烧伤而引起的面部和颈部皮肤异常[3]。16世纪就已有学者使用显微镜观察甲襞血管,Goldman医师首次使用皮肤镜分析色素痣与黑素瘤,被视为皮肤镜临床应用的开端[4⁃5]。皮肤表面3D分析仪、皮肤共聚焦显微镜和皮肤超声等则是医学工程与影像医学结合的产物。由于皮肤影像诊断方法的出现,皮损的“可视化特征”也逐步拓展为“可利用皮肤影像诊断方法获取的可视化特征”。皮肤影像诊断方法拓展和深化了临床医师的信息获取能力,帮助使用者获得比原先更多的具有诊断价值的信息,从而提升皮肤病诊断水平和效率。
由于原理和侧重点不同,每种皮肤影像诊断方法均具有各自的优势和局限性,如何整合不同的成像技术实现彼此优势互补,为明确诊断提供更加全面和精确的信息是皮肤影像学发展的重要课题。事实上,多模态影像技术也是现代医学影像学发展的方向,目前临床上以PET/CT为代表的多模态成像是一个成功的代表。充分利用我国数量庞大的皮肤病患者资源,构建适用于我国人群的皮肤病智能辅助诊断系统,已经成为重大课题。如何在现有工作基础上,对高质量皮肤影像数据库的构建路径、适用性数据信息的挖掘策略及深入学习模式等开展研究,是构建皮肤病智能辅助诊断系统的核心和关键。
自电脑诞生之日起,利用存储分析技术来进行疾病辅助诊断的努力一直在持续。近年来“智慧诊断”、“人工智能(artificial intelligence,AI)”,得到社会高度关注,也在皮肤病诊断领域得到同步发展,并且逐渐成为趋势。
早期皮肤病“智慧诊断”研究主要针对预知特征,从皮肤图像中提取信息进行判断,在2012年之前能够达到的最低错误率为25%。2012年机器深度学习首次被应用在ImageNet数据集上,错误率降低到16%,并随着算法改进进一步降低至2016年的3.5%。而在ImageNet数据集上,人类分类错误率约为5.1%,高于机器的错误率,这是机器深度学习带来的技术突破[6⁃7]。
2016年 12月,斯坦福大学 Esteva等[8]针对129 450幅皮肤病临床图像(包含2 032种不同疾病),利用深度卷积神经网络(DCNN,人工神经网络的一种,是第一个真正成功训练多层网络结构的学习算法,已成为当前语音分析和图像识别领域的主流模式)进行细粒度(fine⁃grained)对象的像素和疾病标注,并构建训练模型,在随后的模型验证中对“来源于角质形成细胞的皮肤肿瘤”(恶性)与“脂溢性角化病”(良性)、“恶性黑素瘤”(恶性)与“痣”(良性)进行机器识别,并与21位认证皮肤科医师的诊断结果进行对比,结果显示,DCNN的准确度达到参与测试的医师水平,证明人工智能对皮肤肿瘤(特别是恶性黑素瘤)的诊断水平已经可以媲美专业皮肤科医师。
最近洛克菲勒大学Gareau等[9]使用Q⁃score危险因素标示方法进行13种机器深度学习算法分析,对黑素瘤诊断的敏感度达到98%,特异度达36%。加拿大滑铁卢大学Glaister等[10]开展的研究系统描述了皮肤影像特征数据的标注及抽取技术,并设计基于机器深度学习的黑素瘤筛检系统。此外尚有很多在图形图像识别领域的医疗人工智能研究案例,其效果也比传统的机器学习效果显著。构建智能辅助诊断系统的技术层面要素(包括DCNN、随机丢弃技术、基于大规模无标注图像的非监督特征学习、基于全球图形处理器(GPU)的机器深度学习模型训练等)已经逐渐成熟,可用于建立皮肤病的智能辅助诊断系统。
人工智能及信息挖掘技术的突破将在皮肤疾病的诊断中起到重要作用,几乎可以肯定的是,不远的将来会出现更为“智能”的“皮肤病电脑医生”,但这并不意味着皮肤科医师在临床诊疗和临床决策中的重要角色将被替代,相反,我们完全可以充分利用智能辅助诊断系统给我们带来的实际益处。同时应该认识到,并非每种皮肤病都存在可辨别的可视化特征,有的疾病诊断可能需要从细胞、分子甚至基因水平获得更多证据,因此智能辅助诊断系统具有一定的适用范围,存在一定的技术边界。
从相机/数码相机开始出现时,我国皮肤病学工作者就已经开始自发积累皮肤影像资料(个人归集阶段)。随着临床教学、研究素材积累、论文发表、教材编写需求的上升,皮肤影像资料归集逐渐成为教研室、杂志社、编辑部的主动行为(集体归集阶段),期间出版了很多高质量的皮肤病图谱,成为皮肤影像资料的典型形式。
2002年,由安徽医科大学第一附属医院、中国医科大学第一附属医院、第四军医大学西京医院、郑州大学第一附属医院、广东医学院附属医院等协同创立“中国皮肤病摄影图像联盟”,开始建立跨单位的皮肤病影像数据库(主要是皮肤摄影和组织病理);高天文、张海龙等建立“中国皮肤性病学网”,成为基于网络归集皮肤影像资源的成功尝试。2014年张学军、崔勇等实施我国首个基于医院网络的远程皮肤病学项目——“安徽省云医院”,建立我国首个皮肤科医生联合体,成为大规模开放式归集皮肤影像数据的可参考模式。2016年我国皮肤影像领域专家联名发表文章《应重视皮肤影像辅助诊断方法的质量管理》[11],在本领域规范性方面发挥了推动作用。
基于已积累的皮肤影像资源,已逐步开展临床和基础研究,主要包括皮肤影像诊断方法对各种类型皮肤病的诊断价值研究、各种皮肤影像诊断方法与组织病理表现的相关性和差异性研究、多种皮肤影像诊断方法组合模式对诊断效率的提升作用研究等,部分已获得初步成果[12⁃17]。2017年崔勇等与上海麦色信息科技有限公司合作,利用机器深度学习策略对200组特定疾病的多维度皮肤影像(皮肤摄影+皮肤镜+皮肤反射式共聚焦显微镜+组织病理)进行综合分析,最终机器诊断准确率达到86%,对影像数据挖掘和分析技术框架进行了初步定型。
为了推动我国在该领域的数据积累和深入研究,由国内皮肤影像专家团队和数据处理技术团队联合发起的“中国人群皮肤影像资源库”项目已正式启动。该项目是一个以智慧诊断集成方案为最终归宿的多中心协同项目,首次采用“完全开放的众筹模式”设计,主要实施路径是建立皮肤影像资源库协作网,制定皮肤病辅助诊断质量管理系统和图像服务“云”平台,开发数据归集模式和数据信息挖掘技术,并在此基础上探索建立新型皮肤病智能辅助诊断系统。
1.充分认识“多维度”皮肤影像资料的重要性:对于很多皮肤病而言,我们仅通过临床表现很难达到对疾病本质的准确把握,因此诊断都是“相对准确”的。组织病理学是我们区分、规定和命名皮肤病的工具之一,尽管并非适用于所有皮肤病的诊断,但在没有更好“金标准”出现之前,组织病理学仍然是我们建立皮肤影像资源库的重要参照。
与肉眼识别皮损可视化特征相比,各种皮肤影像诊断方法获取的是特定层面或视角的信息。不同方法获得信息之间是否具有一致性,特别是它们与组织病理学特征之间是否存在对应性,决定了这些信息将来是否能作为智能辅助诊断系统的可靠指标。鉴于以上原因,我们在建立皮肤影像资源库时,首先应考虑纳入“多维度”皮肤影像,包括皮肤摄影、皮肤镜、皮肤共聚焦显微镜、皮肤超声等,以及对应部位的组织病理学资料。“多维度”皮肤影像是将来评估和标准制定、开展相关研究的重要素材。
2.着力解决皮肤影像质量标准化问题:皮肤影像质量标准化问题不容忽视。不同参数皮肤镜成像质量存在差异,两种皮肤镜术语体系并存,多数皮肤共聚焦显微镜使用者未接受正规、标准化操作和结果判读培训等。因此,除了后期开发影像数字处理流程和模式外,纳入皮肤影像资源库的原始数据需参照如下标准。
(1)皮肤摄影:①体位:以皮损为中心,突出重点,明确显示解剖位置;②光线:尽量选择自然光或无影闪光灯下拍摄;③背景:一般选纯色为背景色,既保证背景简洁、主体突出,又不失医学摄影的严肃和庄重;④构图:既需全景照片反映皮疹部位、数目及分布规律,也需特写表现皮疹性质及更多肉眼难以分辨的细节,可拍摄成组照片[18⁃19]。
(2)皮肤镜:①皮损整体:光源选择自然光,并注明模式(偏振光或非偏振光)、放大倍数;②局部细节:分别拍摄皮损最大放大倍数且图像清晰的照片。
(3)皮肤共聚焦显微镜:①纵向扫描:从角质层到真皮浅层的纵向扫描,每层厚度5 μm;②水平扫描:角质层、颗粒层、棘层、基底层、真表皮交界、真皮浅层有病理改变的水平扫描图像;③局部细节:每一层所表现的病理变化,拍摄局部的细节照片。
(4)皮肤超声:①纵向扫描:皮损区域使用高频或超高频超声扫描,标注扫描频率(20 MHz、50 MHz等频率);②整体及细节成像:能清晰显示表皮、真皮及皮下组织,测量皮损范围、深度、血流、性质及与周围组织的关系等。
(5)组织病理学:①与皮肤镜等检查的取材位置相对应;②留取照片(整体图像、细节图像);③标注放大倍数、染色方式、皮损部位等。
3.正确处理样本库规模与质量的关系:样本规模是皮肤影像资源库的重要参数和属性,也直接决定影像信息标注工作量、建设周期、人力及经费投入等。从数据处理角度出发,纳入研究的样本数量越大,各种皮肤影像中信息提取的把握度就越大,对智能辅助诊断系统的支撑作用也就越大。但是如果纳入样本库的皮肤影像存在诊断错误、不符合质量标准化要求或多维度皮肤影像不匹配时,后期数据处理的精度和效率将受到显著影响,“有效样本量”大大下降。因此我们在考量皮肤影像资源库的样本量时,仍应首先强调数据的质量。
4.将医学经验和临床指南与智能辅助诊断系统融合:在众多不同的皮肤病中,相当一部分已经具备较为成熟、可用于诊断的医学经验,部分病种已总结出基于共识的“临床指南”,这既是皮肤科医师开展业务学习的依据,也是临床工作中验证诊断和鉴别诊断的标准。智能辅助诊断系统的构建依赖于机器深度学习,其学习模式与已具备的医学经验和临床指南也存在多种对接方式和模式。
当建立了样本量足够的皮肤影像资源库后,构建智能辅助诊断系统可采用两种策略:①基于医学经验的模型:是疾病预测的传统方法,通过临床医生指导和临床医学文献获取皮肤病的风险因素,并基于这些风险因素建立预测模型,给出各种皮肤病诊断的把握度;②基于数据驱动的模型:对皮肤病风险因素无任何假设,基于已有数据分析算法的研究,根据所有可能的风险因素建立统一的不依靠任何预先设定和领域专家干预的数据驱动模型。两种数据模型的建立和对比,将成为最终确定智能辅助诊断系统优化方案的基础。
基于各种皮肤影像辅助诊断方法已日益成熟、国内外研究进展以及不同种族个体皮肤特性之间存在差异性等现状,建设基于我国人群的大规模高质量皮肤影像数据库势在必行,也是开展机器深度学习研究、探索适用性强的皮肤病辅助诊断模式和临床决策系统的重要基础。对上述瓶颈问题的思考和解决,将有助于促进皮肤病学真正迈向“信息化”和“数字化”,更是将来在更大范围内开展远程皮肤病学和智慧诊断等的必由之路。
[1]崔勇,杨森,张学军.数码技术与皮肤病学[J].临床皮肤科杂志,2008,37(1):61⁃62.DOI:10.3969/j.issn.1000⁃4963.2008.01.037.
[2]崔勇,Daniel WP,Davis MD,等.远程皮肤病学的现状和展望[J].中国皮肤性病学杂志,2011,25(11):829⁃831.
[3]崔勇,Daniel WP,Davis MD,等.皮肤病摄影的回顾和展望[J].中华皮肤科杂志,2011,44(10):754⁃755.DOI:10.3760/cma.j.issn.0412⁃4030.2011.10.030.
[4]冉玉平.新视野、新平台、新模式-皮肤镜在皮肤性病诊治中应用体会和展望[J].皮肤病与性病,2014,36(1):13⁃16.DOI:10.3969/j.issn.1002⁃1310.2014.01.006.
[5]崔勇,林艳,于瑞星,等.历史、现状及发展方略——皮肤镜在中国[J].中国皮肤性病学杂志,2017,31(2):119⁃122.DOI:10.13735/j.cjdv.1001⁃7089.201608024.
[6]马世龙,乌尼日其其格,李小平.大数据与深度学习综述[J].智能系统学报,2016,11(6):728⁃742.DOI:10.11992/tis.201611021.
[7]侯宇青阳,全吉成,王宏伟.深度学习发展综述[J].舰船电子工程,2017,37(4):5⁃9,111.DOI:10.3969/j.issn.1672⁃9730.2017.04.002.
[8]Esteva A,Kuprel B,Novoa RA,et al.Dermatologist⁃level classification of skin cancer with deep neural networks[J].Nature,2017,542(7639):115⁃118.DOI:10.1038/nature21056.
[9]Gareau DS,Correa dRJ,Yagerman S,et al.Digital imaging biomarkers feed machine learning for melanoma screening[J/OL].Exp Dermatol,2016.http://onlinelibrary.wiley.com/doi/10.1111/exd.13250/full.[published online ahead of print December 19,2016].DOI:10.1111/exd.13250.
[10]Glaister J1,Amelard R,Wong,et al.MSIM:multistage illumina⁃tion modeling of dermatological photographs for illumination⁃corrected skin lesion analysis[J].IEEE Trans Biomed Eng,2013,60(7):1873⁃1883.DOI:10.1109/TBME.2013.2244596.
[11]中华医学会皮肤性病学分会皮肤病数字化诊断亚学组,中国医学装备协会皮肤病与皮肤美容分会皮肤影像装备学组,中国中西医结合学会皮肤性病专业委员会皮肤影像学组,等.应重视皮肤影像辅助诊断方法的质量管理[J].中华皮肤科杂志,2017,50(4):235⁃238.DOI:10.3760/cma.j.issn.0412⁃4030.2017.04.001.
[12]孟如松,蔡瑞康,赵广,等.皮肤镜图像分析技术在育发类产品的功效评价研究[J].CT理论与应用研究,2010,19(1):71⁃76.
[13]赵莹,蔡泽明,巩毓刚,等.斑秃皮损的皮肤镜影像及其与临床病理的关系[J].中华皮肤科杂志,2011,44(1):30⁃34.DOI:10.3760/cma.j.issn.0412⁃4030.2011.01.011.
[14]章星琪.常见脱发疾病皮肤镜征象与病理的联系[J].临床皮肤科杂志,2011,40(12):771⁃774.DOI:10.3969/j.issn.1000⁃4963.2011.12.034.
[15]中西医结合学会皮肤性病学专业委员会皮肤影像学亚专业委员会.毛发疾病皮肤镜诊断专家共识[J].中国麻风皮肤病杂志,2016,32(3):129⁃132.
[16]中西医结合学会皮肤性病学专业委员会皮肤影像学亚专业委员会.红斑鳞屑性皮肤病皮肤镜诊断专家共识[J].中国麻风皮肤病杂志,2016,32(2):65⁃69.
[17]中国医疗保健国际交流促进会皮肤科分会皮肤影像学组,中华医学会皮肤性病学分会皮肤病数字化诊断亚学组,中国医师协会皮肤科医师分会皮肤外科亚专业委员会,等.《皮肤镜术语规范:第三次国际皮肤镜协会会议共识》解读[J].中华皮肤科杂志,2017,50(4):299⁃304.DOI:10.3760/cma.j.issn.0412⁃4030.2017.04.017.
[18]李政霄,马慧群,于建斌,等.如何拍摄满意的皮肤病皮损临床照片?[J].中国皮肤性病学杂志,2014,28(11):1184⁃1186.DOI:10.13735/j.cjdv.1001⁃7089.2014.1184.
[19]中国中西医结合学会皮肤性病学分会皮肤影像学亚专业委员会.皮肤科摄影专家共识[J].中国麻风皮肤病杂志,2016,32(10):577⁃580.
《皮肤科结缔组织病诊治》书讯
由复旦大学附属中山医院皮肤科李明教授和中国医学科学院皮肤病研究所孙建方教授共同主编的《皮肤科结缔组织病诊治》已于2017年5月由北京大学医学出版社出版。全书15章,87.6万字,彩色皮损和组织病理照片1 243张。该书有以下特点:①突出了皮肤科诊治结缔组织病的鲜明特色,对皮损辨识、组织病理检查和皮肤科常规治疗都做了详细叙述;②既有各种疾病的典型皮损和病理照片,又有不同患者、不同病期和不同部位的照片,可起到看图识病的作用;③对各种结缔组织病的临床表现、诊断、鉴别诊断和治疗做了详细介绍;④书中附有国际公认且最新的结缔组织病诊断标准及病情活动度判定标准。该书是皮肤科、风湿科、儿科、内科等与结缔组织病相关科室医师的重要参考书。
有需求的读者可到全国各大书店或购书网站购买,编者不办理邮购。
崔勇,Email:wuhucuiyong@vip.163.com
米尔斯坦亚美医学基金会项目“中国人群皮肤病数字图片资源库的建立与应用”
10.3760/cma.j.issn.0412⁃4030.2017.07.016
2017⁃02⁃27)
(本文编辑:颜艳)