巩高,黄文华,曹石,陈超敏,郑东宏
1.南方医科大学生物医学工程学院,广东广州510515;2.南方医科大学基础医学院人体解剖学国家重点学科/广东省医学生物力学重点实验室,广东广州510515;3.河源市人民医院设备科,广东河源517000
在移动智能时代到来之前,经典的医疗设备(如假肢、支架、植入物等)被广泛应用。人工智能(Artifical Intelligence,AI)技术的到来,使医疗技术发生了颠覆性的变革,如:(1)AI设备进行阅片,在保证准确率的前提下,效率是普通医生的几十倍甚至更高,还能够帮助医生处理临床上一些复杂问题,减轻以上的负担;(2)可穿戴设备监测健康记录,患者可随时了解自身状况;(3)识别医生语音或笔记,精确形成电子健康记录存储在病历数据库中,无需花费人力再去整理;(4)陪护机器人的研究,既能代替医生去辐射高危地区,又能时刻陪护病人,随时感受病人健康数据与情绪波动等。5G 时代的到来,智慧医疗进一步发展,促进AI与病理、诊断、影像、精神医学、眼科学、中医学等诸多学科的融合发展[1-3]。AI在融入医疗领域发展的同时也存在一定的挑战,在应用医学的同时也在不断完善自身,促进AI技术的前进。
目前,AI技术在医学的应用主要为以下几个方面:智能药物研发、智能辅助诊疗、智能语音识别与语义理解、健康管理和医院管理。
AI在新药研发领域取得了不错的成绩。为了降低药物的研发成本、缩短药物发现的时间,在药物发现阶段,利用AI技术加速药物靶点发现;在临床前研究阶段,进行化合物筛选,分析化合物的构效关系,用于新药发现和新药风险评估;在临床研究阶段,分析药物重定位,在不断试验中发现新的适应症。目前,AI技术已经应用于心血管疾病、肿瘤控制等药物的研究。特别在2019年新冠病毒疫苗及相关药物研发中发挥着巨大作用[4]。
对于新药研发,靶点的发现及验证是临床前研究的关键步骤之一。2020年,Pawar等[5]通过AI方法识别乳腺和卵巢的常见癌症生物标志物。在研究中,作者通过对重要基因进行优先级排序,并最终预测特定生物标记物的存在;利用开源数据库Gene Expression Omnibus(GEO)的公开数据集,通过层次聚类、k-means 聚类法,再通过随机森林分类算法,最终确定最潜在的靶点为雌激素应答基因-雌激素受体生长调节结合蛋白1(GREB1)。随后,Dezső 等[6]提出一种机器学习方法,以靶点生成产生的药物性对蛋白质进行分类。在文中,笔者提取70 种蛋白质特征,包括蛋白质序列特征、表征蛋白质功能的特征以及蛋白质之间相互作用的属性,经训练后得到模型受试者工作特征曲线ROC 下面积(AUC)为0.89,之后在临床试验药物组成的测试数据集上证明了该方法的有效性。
虽然AI技术的应用缩短了新药研发的周期,大大减少新药研发的成本,但也存在着一定的局限性,如数据质量差、标注不清晰甚至含有错误信息,新药研发标准不统一,这对于当前热门的深度学习来说是巨大的挑战。除此之外,数据学习不定性大,试错成本较高、数据信噪比较低、缺乏优质的数据库等困难制约了AI在新药研发中的发展。因此,数据质量的问题在新药研发中亟待解决。
1.2.1 辅助诊断智能影像诊断是AI在医疗领域中应用最热门的场景之一。一方面,经过图像识别技术对医学图像进行辨认和剖析,快速发现病灶,并将其与正常组织细胞分开,提高影像诊断效率;另一方面,构建深度学习模型,通过对大量的图像和诊断信息进行深入挖掘且不断训练优化,提高模型的诊断能力,降低对复杂疾病的误诊率。
Zhang 等[7]研究一种多模态深度学习模型,用于对所采集视频中儿童的异常行为进行分类,并且结合其他系统模块所采集的信息,辅助诊断系统能够自动生成标准化的诊断报告,包括测试结果、异常行为分析、辅助诊断结论和治疗建议等。文中指出,该系统目前在浙江大学医学院附属儿童医院心理科,用于临床辅助诊断,得到医生和患者一致好评。Yang 等[8]利用密集连接卷积神经网络(DenseNet)评价在高分辨率计算机断层扫描(HRCT)上检测COVID-19特征的诊断效果。数据集采用295例患者的数据,其中健康人数:149 人;COVID-19 患者数:146 人。DenseNet经过数据集训练和验证后,将图像分类为感染或正常两类,最后采用ROC 和AUC 评价模型性能。结果显示,算法在验证集的AUC 为0.99,在测试集的AUC 为0.98。阈值选择为0.8,在验证和测试集的准确性分别为95%和92%。从中得出结论,采用DenseNet 的深度学习可在HCRT 上准确分类COVID-19,可减少漏诊误诊。
1.2.2 辅助治疗AI用于辅助治疗,主要应用为医疗机器人。目前应用最为广泛是手术机器人和康复机器人。手术机器人由外科医生控制中心、床旁机械臂系统、高清影像系统3 部分组成,具有可增加视野角度、减少手部颤抖、操作精细等优点,辅助医生完成临床手术。另外,康复机器人的使用也发展迅速,能完成辅助患者行走或者康复等基本功能。
Shin 等[9]提出并研究了两种基于AI学习和视觉策略的模型预测控制算法:强化学习(RL)和演示学习(LfD)。通过对这两种算法在仿真设置中的性能比较,表明从演示中学习算法可以通过初始化给定演示的预测动态来提高学习策略。此外,文中提到,他们在手术机器人系统上实现了LfD的学习,并通过实验方法成功证明算法的可行性。实验结果表明,LfD 大大减少了神经网络正确学习所需的参数量,从而促进学习过程。LfD 在手术机器人上的实现,表明在演示中涵盖相关的工作空间时,LfD 算法可以产生很好地初始化策略来完成实际环境的任务。作者认为,如果能给出更多的演示数据,更充分地捕获机器人的工作空间,LfD 算法的能力将会更加显著;其次,在实际工作中,机器人的工作空间受到限制,是为了防止视觉遮挡,因此可以开发新的算法来避免遮挡,实现性能上的进一步突破。
强化学习技术的发展,使得机器人能够更加精准地模仿外科医生的动作;深度学习技术能够显著提升机器人辅助手术的稳定性和适应性。目前,在机器人辅助治疗方面还并未广泛应用,技术大多仍停留在理论层面,机器人代替人类完成任务大多运用在医导等方面,如何让机器人更加自主甚至脱离外科医生精确完成手术、如何优化算法,降低成本,让更多机器人投入到一般基层医院,是我们需要一直思考的问题。
随着自然语言处理技术的发展,语音、文字等信息可以很迅速、精确地被计算机捕获,智能虚拟助理系统、慢性病防控和疫情防控系统、医疗文书录入和电子病历等技术应运而出,大大减轻了医务人员的负担[10]。
Doumbouya 等[11]根据全球7 亿文盲人研究出一种无监督学习语音识别技术对无线电广播档案进行识别。这些档案内含资源丰富、能够获取最有价值的信息。作者首先提出两个数据集:一是西非广播语料库,包含超过10 种语言的142 h 音频;二是西非虚拟助手语音识别语料库,由4种语言的10 K标记音频剪辑组成。接着对音频识别网络wav2vec 进行改进得到西非wav2vec,并将两者在语音识别上进行比较,发现西非wav2vec显著优胜。最后针对Maninka、popular 和Susu(这些语言在7 个国家中共有1 000 万人使用,文盲率高达68%),提出一种新的智能语音识别模型,目前还在优化,希望可以为AI研究者提供线索。Zheng 等[12]提出了基于上下文语义感知的云平台,辅助机器人感知周围环境,包括用户的情绪、心理变化等。文中指出,依靠认知的上下文信息框架,机器人可以极大改善用户的交互体验。此外,该平台还集成了各种人工智能识别服务,通过分析大量文字信息来提取语义,结果返回云端,以便在下次交互中做出更好的决策。结果显示,该语义分析平台能够极大改善机器人的交互性和智能性。
由于自然语言处理技术理论复杂,发展滞后,在医疗领域落地时间较晚,许多技术运用不是特别成熟。但目前在慢性病防控和疫情防控系统、电子健康档案数据关系分析、医疗知识图谱的构建等领域展现出良好的价值,如COVID-19 中防控系统的构建,现在已有很多研究者投入其中。
智能健康管理主要体现在患者层面,运用AI技术,可在健康指数、合理饮食、情绪调节、慢性病管理以及某些疾病风险预测等方面提供医疗和指导。目前应用主要有可穿戴医疗设备以及基于物联网的医疗设备等,如血压血糖监测设备、智能化健康档案管理系统、母婴健康管理系统、心理健康监测系统等。
2020年,Zhao 等[13]提出了智能医疗辅助诊断知识库共享系统,实现智能医疗诊断。该系统可建立医学知识图谱,包括呼吸医学知识库,为智能推理系统提供学习平台。文中指出,该系统架构,可满足患者不断提高医疗公共服务的需求,实现便捷、包容的服务体系。此外,结合物联网和云计算,为智能医院管理提供了切实有效的解决方案。
智能健康管理是AI在医疗领域的一个非常重要的应用,时刻影响着人们的生活质量。在此模式上,由计算机、信息技术、软硬件设备发展带来的价值不可限量,远程医疗服务质量将进一步优化。
疫情的爆发警示研究者们重视医院管理对医疗资源配置的重要性。通过建立AI体系,利用病历信息、用户反馈等大数据来协调资源的分配,节省医疗成本、极大改善患者的就诊体验,最大程度满足患者需求[14]。
涉及到伦理的医学数据,一方面获取方式困难,数据多而繁杂,信息的碎片化处理目前还是个难题;另一方面质量高的数据少,得到数据后要经过专家进行精准标注,标注的数量与质量也直接影响到整个数据集。除此之外,每个单位都有属于自己的数据库,每一病种的数据及其形式又不同,没有统一的标准对其进行整合,也缺乏大型的公共数据库系统[15]。高质量的数据是AI发展的首要前提,这一难关阻碍了AI前进的脚步。
临床问题的复杂要求神经网络层数加深,模型的复杂程度与之相对应的数据量不匹配。模型太过复杂,学习能力过于强大,以至于把训练集中数据本身特征学习到了,这样会导致算法过拟合;模型的复杂程度远低于与其匹配的数据量,这导致模型学习能力低下,产生欠拟合。欠拟合可以通过增加数据量和训练次数来解决,过拟合的解决却比较困难,是深度学习中经常会遇到的问题。尤其是在医疗实际应用中,一定要对AI算法进行严格测试评估,否则会导致发生医疗事故和纠纷,引发大规模医源性风险[16]。
除此之外,算法的主观性与算法的“黑箱”问题也不容忽视[17-18]。算法的设计过程中难免会有工程师主观的偏见,有些数据也会存在价值偏好,这样会使得算法模型可能会朝着与预期完全不同的方向决策。“黑箱”问题一直是深度学习中困扰研究者们的难题,模型可解释性弱,对医学问题中复杂问题只知结果不知其过程,这样的瓶颈问题制约了深度学习在医疗领域的渗透。
AI在医疗领域的发展离不开人才的挖掘与培养。特别是涉及AI与医学两个大学科,属于典型的交叉学科,这要求人才能够精通这两个方面。但AI工程师对医学领域的难题了解较少,对临床复杂性不熟悉,必然会影响到AI系统的研发;具有医学背景的应用人才缺乏对工程算法的理解,对系统开发过程的培训也难以实现,也会影响AI产品的规范性。因此,我们需要解决这样的问题:一方面,我们要大量培养在临床医生和算法工程师之间进行对接交流工作的临床工程师,辅助AI应用医疗,进行过渡;另一方面,从零培养AI与医学复合型专业人才,服务于临床,这是从根本上解决人才缺乏问题的方式[19-21]。
AI在医学方面的应用,主要集中在新药研发、辅助诊疗、语音识别和语义理解、健康管理和医院管理等领域。近3年内,每个领域都有不同程度的突破,但在不同领域都有难以攻破、亟待解决的难题。
新药研发中要经过筛选、预测潜在性质、预测生物活性及毒性、预测蛋白质结构等过程,AI的利用极大减少时间和人力成本,进一步提高药物研发的效率。但准确预测药物靶点仍具有一定的挑战性,目前存在的算法模型的精确度仍然不理想,需要更进一步深入探究。辅助诊断是AI应用于医疗行业最为广泛的领域,尤其是在智能影像方面,已取得巨大成果,但如何扩大共享数据库,提高数据质量,提高诊断准确率,减少误诊漏诊,是一直要努力的方向。语音识别和语义理解相比影像诊断发展略微缓慢,归因于其技术的复杂性及数据结构多样性,主要解决手段仍是要继续开发新算法,对不同语言进行识别与解读,除此之外,对元数据的处理也是非常重要的手段之一。健康管理与医院管理依赖前面3个领域AI技术的发展,更多集中在可穿戴设备检测与大数据碎片化处理技术方面,从而更好地服务患者。综上所述,AI与医学的融合具有巨大发展前景,希望有越来越来多的研究者投入其中,致力于AI研究服务于医学。