王志燕 宋涛
【提要】 人工智能是指任何能感知环境并采取行动以最大程度实现目标的设备。近年来,人工智能在颅颌面外科中的应用日渐增多。人工智能已可用于辅助颅颌面相关疾病的诊断及外科治疗,如预测胚胎患唇腭裂的风险、早期诊断畸形综合征、治疗面部麻痹、预估术中出血量等。本文就以上内容进行分析评价,同时探讨人工智能在医疗行业发展的伦理、安全等问题。
人工智能(Artificial intelligence,AI)是指任何能感知环境并采取行动,以最大程度实现目标的设备。简单地理解,即AI 是由人制造出来的机器,可以具有和人类一样的智能。AI研究领域诞生于1956 年达特茅斯学院的一个研讨会上,由John McCarthy 创造了“人工智能”一词[1]。但AI 的发展并非如预想的一样顺利,由于进展缓慢、资金短缺,经历过两次“寒冬”后,21 世纪初期,随着计算机的普及、大量高性能硬件的开发,AI 技术再次成为许多国家的研究热点。2017 年的未来围棋峰会上,DeepMind 公司的AlphaGo 战胜了围棋世界冠军柯洁,标志着AI 发展进入一个新的阶段。目前,AI 技术已渗透到生活的方方面面,如自动驾驶、人类面部识别、搜索引擎推荐、广告精准投放等。
机器学习(Machine learning,ML)是AI 的一个分支,是指机器可以像人一样从数据中找到信息并从中学习规律。ML可以分为3 种类型,即无监督学习(Unsupervised learning)、监督学习(Supervised learning)和强化学习(Reinforcement learning)。无监督学习是指从信息中自动找寻规律,并将其分成各种类别。监督学习是指通过历史数据的标签,运用模型预测结果。强化学习是指其帮助人们作出决策和规划,并利用奖励回馈机制促进学习的一种方式。
深度学习(Deep learning,DL)是ML 研究中的新领域,但与ML 不完全相同,DL 是利用深度神经网络,将模型处理得更为复杂,从而使模型对数据的理解更加深入。同ML 方法一样,深度ML 方法也有监督学习与无监督学习之分。例如,卷积神经网络(Convolutional neural networks,CNNs)就是 一种深度的监督学习下的ML 模型,而深度置信网就是一种无监督学习下的ML 模型(图1、2)。
图1 人工智能、机器学习、深度学习及卷积神经网络之间的关系Fig.1 The relationship between artificial intelligence,machine learning,deep learning and convolutional neural networks
图2 机器学习分类Fig.2 The classification of machine learning
近些年,AI 技术在医学领域也迎来了研究热潮。AI 可辅助临床医生作出更准确、及时的诊断。如利用DL 技术自动筛查糖尿病肾病,并将可能有视力损害的糖尿病肾病患者转诊给眼科医生进行进一步的评估和治疗,降低视力丧失的发生率[2];也可用于预测癌症易感性、复发率和死亡率[3-4]。除此之外,AI 与大数据的结合对精准治疗也产生了深远影响,如通过DNA 图谱的大数据可对有相同异常基因的人群提供更精确的药物治疗,同时减少药物开发的样本量,提供更精准的药物开发[5]。
在一些发展中国家,唇腭裂手术的费用对于一个普通家庭来说是难以承担的,并且可能需要多次手术,对于患儿本身也是一种痛苦。所以如何早期诊断唇腭裂就显得尤为重要。目前认为伴或不伴腭裂的非综合征性唇裂(Nonsyndromic cleft lip with or without cleft palate,NSCL±P)与多基因和基因位点的遗传变异相关。为了预测巴西人群中非综合征性口腔裂的风险,Rubin 等[6]在由722 个非综合征性口腔裂和866 个正常对照组成的病例样本中,将随机森林和神经网络方法应用于72 个单核苷酸多态性分析,结果显示其中有13个单核苷酸多态性对于预测NSCL±P 风险的神经网络至关重要,并且由这13 个单核苷酸多态性组成的ML 模型预测NSCL±P 风险的总体准确性为94%。该研究可用于协助NSCL±P 遗传咨询。巴基斯坦的研究者从3 家不同医院收集了1 000 份怀孕女性样本及数据,采用各种ML 算法来预测出生前胚胎唇腭裂的可能性。结果显示,基于多层感知器模型,测试数据可达到92.6%的准确性。或许不久的将来,人们可以通过一个简单的移动应用程序就可以预测胚胎患唇腭裂的风险[7]。
深层表型是基因疾病精准治疗的一个新兴趋势。已知30%~40%的遗传综合征会影响面部容貌。Hallgrímsson 等[8]利用AI 技术对7 057 名受试者进行三维面部图像分析,其中有3 327 名是综合征患者,囊括396 种综合征;727 名受试者是这些患者的亲属;剩下的3 003 名受试者既无相应综合征,也无类似疾病的亲属,即不相关也未受影响的受试者。结果表明,AI 对不相关也未受影响的受试者分类准确率高达96%。剔除不相关也未受影响的受试者,AI 对综合征患者分类的平均准确率达78.1%,敏感率达56.9%。可以看出定量三维面部成像的深层表型在促进综合征诊断方面具有相当大的潜力。此外,值得关注的是综合征患者的亲属常被AI 识别为综合征患者。这或许揭示了患者亲属可能是未被发现的病例或者可能是半显性遗传的病例。
畸形综合征患者有不同的面部畸形特征。这些面部畸形特征对于畸形综合征的早期诊断很重要。土耳其的研究者利用AI 技术开发了仅通过简单面部图像数据便可以对脆性X、Hurler、Prader Willi、Down、Wolf Hirschhorn 综合征进行分类的系统,准确率达86.7%,该系统有望被临床专家用于畸形综合征的预诊断[9]。
在口腔和颌面外科领域,DL 已被广泛用于放射影像学中,解决复杂问题。CNNs 作为DL 方法之一,最常用于医学影像中的器官划分,相关疾病的识别、分类。颌骨的囊肿和肿瘤通常是无痛和无症状的,临床很难早期发现。研究者使用深度CNNs 自动诊断全景照片上的双侧颌骨的囊肿和肿瘤,以协助口腔科医生更有效地诊断和治疗病人[10]。
恢复面部对称性是面部麻痹的主要治疗目标。为了治疗面部麻痹需要对面部进行定量测量,但该过程的实施并不容易,不仅耗费时间,有时还需要昂贵和复杂的仪器。Hidaka 等[11]开发的实时面部不对称分析软件巧妙地解决了这些问题,不仅容易操作,还可以免费使用。这款软件利用最新开发的AI算法对整形外科手术的主要目标--嘴和眼部的变形进行实时计算,从而实时显示口腔和眼睛不对称,重建瘫痪侧面容。大多数人选择美容手术都是希望变得更有吸引力。研究表明,快乐积极的面部表情通常会使一个人更加有吸引力和魅力。台湾地区的一项研究希望通过增强积极的面部特征并减少负面的面部特征,以提高面部吸引力,达到个体化的美容效果。然而仅凭人眼观察、记录人类的面部微表情是很困难的。Li 等[12]通过AI 辅助的面部分析系统分析人类面部微表情,量化静态和动态的面部微表情,为面部除皱等面部美容治疗提供了更为准确的评估。
假体可以替代颅颌面缺损的结构,从而恢复缺损部位相关的功能和美学。传统的软组织假体制造方法耗时且昂贵,对颌面整形技术的要求也较高,尤其在颜色匹配环节需要多次与患者缺损组织附近的皮肤进行比对,过程繁琐且患者体验较差。随着三维数字技术的发展,假体制造过程与传统方法相比,得到了一定程度的简化,但手工着色硅树脂缺少精确性,最后仍无法再现患者原有肤色。Mine 等[13]提出了一种基于人工神经网络的DL 算法,准确地再现了患者的皮肤颜色。由此可见,利用深度神经网络对颌面部假体进行着色是一种很有前景的修复技术。
如果术前可以预测术中出血量,对围手术期的准备工作,尤其是稀有血型的备血等极为有利。另外,如果术前预估术中出血量较大,可能会影响对手术方案的选择。Stehrer 等[14]利用了一种ML 的算法(随机森林算法)来预测术中出血量。筛选了1 472 例接受正颌手术的患者,最终纳入了950 例患者。其中80%的患者资料用于生成智能预测系统,20%用于测试该系统准确性。结果显示,系统预测760 例术中出血量与实际出血量平均偏差7.4 mL。因此,此方法可应用于正颌手术失血量的分析。
唇腭裂是口腔颌面部常见的先天性畸形,其手术标记和切口的设计是决定手术成败的重要因素。为了降低唇腭裂手术的技术门槛,四川大学开发了一种基于DL 的新型机器人手术辅助技术。他们首先建立了一个唇腭裂手术定位数据集,用来训练模型定位手术标记和切口。其次根据数据集的特殊性设计了新的定位方法,大大降低了算法的复杂性。该模型较其他人脸特征提取方法有较强的优越性和适应性[15]。
近年来,随着AI 在医学领域的飞速发展,在实际应用中出现了许多新的问题及挑战。有些问题并没有标准答案,需要今后长期的实践与探讨。
AI 系统的算法和统计模型是建立在数据集之上的,收集大量、高质量的数据对于AI 系统的发展至关重要。然而从数据的采集、整理到储存平台的应用都存在着各种问题和困境。
在大型临床试验的数据采集过程中,有些研究采用商业软件、电子智能穿戴设备等进行数据采集,其安全性及有效性目前还是未知的。即使医疗机构专业的数据采集设备也会因为错误的校准而导致测量误差。不仅如此,数据集需要具有代表性,如果在采集过程中缺乏少数民族或群体,就会导致对这些群体的非代表性预测。对于数据的处理,在AI 系统使用前需将临床指标数据化,并且需将数据滤过为一致和可用的格式,否则将影响临床应用。
其次,构建大型高质量的数据库对于任何一个研究机构而言,都意味着大量的人力、时间和资金投入。比较高效的解决办法就是数据库平台共享,然而由于研究机构采集数据时缺乏统一标准、各大数据库的管理缺乏一致性,最后导致实际可用的数据库是有限的,而且这些可用的数据库的用途也是有限的。
目前处于信息高度发达的年代,个人信息及隐私很难保证安全性。提供给算法公司的数据是否合法、是否安全、是否具有保密性,目前我国并没有相应的法律规定。为了防止个人数据在未经同意的情况下被公司或者社会组织用于营利,欧盟、新西兰、澳大利亚等国家已纷纷颁发相应法律、法规捍卫各自的数据主权[16]。
ML 数据输入到输出的过程被认为是“黑箱”,也就是说ML 无法提供其输出的基本原理,这就使预防或者发现算法的缺陷和漏洞变得困难,也就无法保证其最终应用于临床的安全性。
AI 用于整形美容行业的同时,催生了一系列社会安全问题。有不法人员为了不受法律约束,有意将面部整形为其他人的模样,窃取他人身份;或者有些爱美人士整容后,国家的面部识别库无法识别其身份,为出关、办理公务等带来了不便[17]。
在临床诊疗过程中,人文因素是必不可少的。有观点认为机器人最终会代替人类,而医生会面临着失业的问题。在诊疗活动中医患沟通是否可以被机器人取代,承担法律责任的主体是机器人还是人,这些问题都需亟待解决。
在整形美容外科中,研究者将数据输入,让机器人建立美的标准,协助手术方案设计。这一行为可能存在种族、性别歧视的可能。不仅如此,还可能被认为传播偏见和削弱人类形象多样性[18]。
目前,我国对于医学人才的培养并未涉及AI 知识的学习,导致医学研究者无法评估算法输出结果是否有意义;而工程技术人员欠缺医学知识,无法确保AI 算法适用于临床。所以,该领域的发展需要多学科合作及相关人才的培养。
从20 世纪70 年代,AI 技术进入医疗领域至今,几十年的发展使AI 技术已深入疾病的预防、诊断、治疗、预后等方面,这既是挑战也是机遇。AI 提供了一种解决问题的新路径。在面对复杂的临床问题时,除了传统方法,我们还可以借助科技手段,更高效、准确地完成临床工作。同时,对于临床工作者也提出了更高的要求,在完善自身医学专业知识和技能的基础上,我们还需要与时俱进,不断更新自身对跨学科领域新知识的储备。
AI 技术目前还处于萌芽阶段,还有很多发展瓶颈和亟待解决的问题。如何建立更有效的管理平台,如何处理数据的安全问题,如何解决“人”与“机”的伦理问题,还有很长的路要走,只有解决好这些问题,AI 才能更好地服务于患者。