丁 元,王伟林*
(1.浙江大学医学院附属第二医院;2.浙江省肝胆胰肿瘤精准诊治研究重点实验室;3.浙江省肝癌诊治技术研究中心,浙江 杭州 310009)
“人工智能(artificial intelligence, AI)”由McCarthy和Minsky等学者首倡,意指“机器模仿人类,进行理解、思考、学习等过程的能力”。目前,在多种技术领域人工智能均已表现出巨大潜力,成为临床医学、生物学、口腔医学[3]等学科的研究热点。结合机器学习技术的医学教学创新也不断涌现,如对临床能力的评价、辅助医生对病理学资料进行判识、对操作进行标准化评估等。
上世纪70年代,计算机辅助教学(computer-aided instruction, CAI)就已兴起,并逐渐渗入到教学的各个过程中。目前,传统机器学习对医学教育的贡献可以表现在教学内容优化、学习过程分析与学习成果评估等环节。
在教学形式优化层面上,应用超文本知识库、教师模型、学生模型三逻辑功能构建的、面向临床医学专业教学的智能化计算机辅助教学方法已经逐渐步入使用[1]。面向医学影像学习的智能教育平台也已有先例。在教学形式优化之外,机器学习推荐算法的研究进一步优化了教学内容的推荐能力,传统机器学习内核的教学辅助工具有效地提升了学生对于知识的掌握深度、广度、速度。
在学习过程分析与学习成果评估方面,应用进化算法内核的组卷系统也频有创新,在教师评价环节中,应用传统机器学习算法的创新也多有报导[2]。这些工具有效利用了庞杂学习记录数据库中的关键隐信息,通过特征工程技术,提取核心知识和关键考点,进而指导教师资源、学位点的考评。2018年的一项研究就很好地结合了大规模队列研究与机器学习评分法,发现整合算法工具后的营养学知识教育显著提升了教学方案的有效性、精准性、互动性[3]。
传统机器学习方法需要在前期确定核心特征作为算法的输入,因此,需要设计者有相当教学经验及能力。同时,数据库的可信度与完整性也会极大影响最终综合系统表现。传统机器学习算法与教育结合促进了教学数据库的创建与完善,为深度学习的蓬勃发展打下了坚实的基础。
得益于近年来的数据库规模、质量的增加,深度学习在大量任务中表现出优越性能, 自超大规模图像识别数据库ImageNet和Unet算法架构模式在医学图像分割识别任务上的优异表现开始,深度学习算法的优势逐渐被认可。
然而,与传统机器学习算法不同,深度学习技术需要更大规模的数据库,神经网络内的提取的特征以超参数形式存储、运行,使得深度学习具有“黑盒”特性。近来,也有一些学者尝试,使超参数权重以图形化的方式表现,以作为良好的感性教学材料,仍远不够成熟[4]。因此,常见的深度学习应用多根据给定输入而给出特定的分析结果,并可能在特定任务上取得接近乃至超越人类的成绩[5]:AI在对以影像资料为代表的临床检查、检验结果判读方面具有良好的能力,基于自然语言处理 (natural language processing, NLP) 的一系列研究成果也提升了算法对病史等文书资料的判读、生成能力[6]。
这些在临床工作中的辅助性功能算法,同样可以在修整后,成为有效的辅助诊断工具与辅助教学工具。针对影像资料的深度学习模型,可以有效辅助医学生提升对解剖结构、手术术式的理解与认识;结合NLP技术的医学记录分析与生成工具,在提升医学生临床问诊能力方面有所建树;基于深度学习技术的临床辅助决策系统也可能在修改后,用于生成仿真病例材料以供学习、分析[7]。自卷积神经网络(convolution neural network, CNN)诞生以来,深度学习框架对影像资料的处理能力大大加强,病灶的检测、分割、分类等方向上进展明显,在结合生成式对抗网络(generative adversarial networks, GAN)等网络后,AI可以根据已有的CT、MRI等检查影像资料,生成其他模态的检查数据,也可以根据已有的影像资料,参考已有的患者影像,生成独立于已有患者、保留病变特征、适应输入形态要求的仿真病灶影像[8]。这些工作进展,使深度学习技术有望在未来对医学影像教学领域产生更大的积极影响。
此外,深度学习在教育领域有更多潜在应用空间:模型可以支持算法对学生表情的实时识别,以促进对教学难点、易于遗漏的知识要点进行补充[9];对学生的慕课学习轨迹进行分析,及时寻找辍学高风险学生进行个性化教学方案设置[10];在新型冠状病毒流行背景下,深度学习可以有效支持在线教育学习管理系统。
随着机器学习应用的普及、信息化教学浪潮的推进,机器学习算法将更深远地影响医学教育的各个环节。网络化、精准化、个性化的新时代医学教育工具,促进了教学数据信息的爆炸式增加,从而催生了人工智能背景下的个性化教学反馈、学习过程的精细化管理,在线教育系统的智能优化等全新的教学支持技术工具。机器学习技术丰富了教学内容、便捷了教学准备环节、强化了学习过程管理、优化了学习过程反馈,提高了教学资源利用率,促进了优质教学资源的扩散。
然而,机器学习归根结底是数据驱动的,这也对隐私安全提出了挑战。笔者曾经参与开发了基于GAN网络的仿真增强CT影像生成算法,在少于100例患者输入的情况下,算法将难以给出成形的仿真影像。数据库的蓬勃发展也带来了入库学生隐私信息泄露的危机。同时,为了降低机器学习相关教学工具的伦理风险,需要审慎地强化对机器学习相关伦理问题的教育、审查。新颖的教学模式也可能弱化教学过程中人与人之间的直接沟通,导致医学人文教育相对弱化,因此,我们也需要强化对医学伦理学的学习与教育,避免虚拟的临床技能练习和模拟仿真病例教学资料等工具弱化学生对患者的尊重与共感。此外,训练仿真病例影像也对教学硬件提出了严峻挑战,距离教学场景中的需求仍有距离。总之,机器学习算法在医学教育的多个环节均表现出了良好的应用效益,并且在传统医学教育环节外,拓展了教育方法的维度与角度,并且与教学信息化、翻转课堂等新兴教育模式结合密切,在前临床教育阶段到住院医师继续教育环节均有应用潜能,是未来医学教育发展的重要方向。