袁瑞, 司敏敏, 张印, 冯志远,3
1.山西医科大学口腔医学院·口腔医院, 山西 太原(030000); 2. 长安大学信息工程学院,陕西 西安(710064);3. 山西省人民医院口腔正畸科,山西 太原(030000)
近年来,人工智能(artificial intelligence,AI)在医学领域取得了前所未有的繁荣。其主要通过机器学习(machine learning,ML)和深度学习(deep learning,DL)来实现疾病分类、早期诊断[1]、放射和病理学分析[2-3]、精准医学指导、改善临床护理[4]和评估疾病预后[4-5]等。口腔正畸学也紧随科技发展潮流,利用AI 进行影像识别、头颅侧位片自动定点、数字化扫描、临床决策、疗效预测和生长发育评估等[6-7]。
ChatGPT(chat with generative pre-trained transformer)是由OpenAI 公司开发的基于深度学习和自然语言处理技术的大型语言模型(large language models,LLM),能够回答连续问题、挑战错误前提并拒绝不适当的请求,颠覆了传统聊天机器人的功能,为用户提供了更好的交互体验[8]。这种强大的深度学习能力和高度拟人化的对话模式有望为口腔正畸教育研究和临床咨询诊疗带来新的革新。
因此,本文将探讨ChatGPT 在口腔正畸教育和临床中的应用潜力,并分析其局限性,为人工智能高效地应用于正畸领域提供思路和方向,帮助更多正畸专业人员提升对AI 的认知度,推动培养“面向世界科技前沿、面向国家重大需求、面向人民生命健康”的新医科专业人才[8]。
ChatGPT 可以根据教师需求生成临床模拟场景[8]、构建课堂测验和评估教学效果等[9-10]。同时,打破时间和地域的限制,让基层医务工作者有同等的机会接触最新的循证知识,提升信息获取效率,为患者提供连续性和同质化的医疗健康服务[8]。ChatGPT 在培养医学生自主学习能力方面也具有优势,包括创建虚拟导师或助手,为学生提供基于情境的知识问答,引导其深入思考;安排个性化的学习计划,提高创新能力与学习效率[9-10];生成病例场景,帮助医学生练习和增强临床思维能力等[8,10]。
ChatGPT 回答医学知识的准确率为60% ~70%[11-12]。研究表明,ChatGPT 在美国医疗执照考试(United States Medical Licensing Examination,USMLE)中的表现达到了三年级学生的及格分数[13]。Kung 等[14]也证明ChatGPT 在没有任何人工协助的情况下完成了USMLE。同时,它还具有一定的遗传学专业知识。Duong 等[15]比较了ChatGPT与人类在回答85 个和遗传学有关的多项选择题的表现,结果表明人类的准确率为66.6%,ChatGPT 的准确率为68.2%,并且它的答案几乎是即时产生的。基于此,本文作者连续3 次将20 道正畸选择题输入ChatGPT 中,每次题目不同,结果显示正确率为30%。这可能与预训练数据集未包含相关内容以及正畸本身的复杂性有关。但ChatGPT 在进一步的强化训练下,回答正畸问题的准确性将会提高。
人类在全面阅读大量文献并将获得的信息连接起来存在局限性,相比之下,ChatGPT 能够快速理解信息并连接证据得出结论[16]。因此,它可以辅助研究者进行论文写作、文献研究、生成研究问题等[17]。
ChatGPT 具有指定标题下文本生成功能,还能将注释组装为连贯的文本,这在生成论文草稿方面有一定的潜力[17-18]。有学者将ChatGPT 生成的摘要与高影响期刊的原始摘要进行比较,结果只能识别出68%的生成摘要来自ChatGPT[19]。同时,它还可以检查标点、语法、变换同义词等,并且根据释义修改文章的语气和风格[20]。这有助于消除语言障碍[21]、平衡竞争环境,使更多人写出高质量的文章[22-23]。值得注意的是,虽然大多数文章检测结果被认为是原创[11],但其真实性和准确性还存在 争 议[18]。《Nature》等 高 影 响 力 杂 志 已 禁 止 将ChatGPT 列为作者,因为它不能对自己的工作负责[24]。因此,研究者应该建立发挥自身创造力为主、ChatGPT 为辅的科研态度[23]和严格的科学标准,防止科学论文的滥造以维护良好的学术环境。Dergaa 等[23]认为ChatGPT 可通过扫描论文和提取重要信息来进行文献研究。此外,它还可根据指定主题提供潜在的研究问题列表以减少研究者过多繁琐的操作而注重新的研究设计,从而加速创新和更多的学科突破[25]。
目前,ChatGPT 还未能实质性地改变正畸医生的工作方式[26],但可以作为医疗对话代理、辅助临床诊疗和优化机器人模型进一步提升AI 在正畸临床中应用的深度和广度。
Strunga 等[27]认为AI 是有希望改善患者护理和正畸效果的领域。ChatGPT 通过机器学习和自然语言处理(natural language processing,NLP)[28],分析用户输入,模拟人类语言行为生成自然合理的回答来提供咨询、筛查疾病、分诊、疗效监测以及培训医疗人员等。这对推进以患者为中心、鼓励患者自我管理、共享医疗过程以及提高满意度和就诊效率具有重要意义[28]。正颌手术是治疗骨性错颌畸形的一种有效手段[29],ChatGPT 在为患者提供与手术相关信息方面具有巨大的潜力。Balel等[30]通 过 向ChatGPT 提 出 手 术 相 关 问 题,并 由33 名经验丰富的口腔颌面外科医生评估ChatGPT的答复,结果显示,除了回答与高级技术有关的问题时表现欠佳,在其他问题方面ChatGPT 能够提供十分准确且有用的答复。基于NLP 模型,ChatGPT还可处理复杂数据,从医学文本如电子健康数据和临床笔记中提取有用信息并翻译成通俗易懂的语言来促进科学发现的传播[31]。此外,OpenAI 公司正逐步在ChatGPT 中推出插件,以便将其作为实体应用于现实生活中。如果将ChatGPT 嵌入挂号小程序,预约挂号、线上问诊和疗效监测三合一,就能更好地实现定制化远程医疗服务,最大程度降低矫治器损坏和治疗失败的潜在风险[27]。研究表明,使用远程监测实现第一阶段治疗所需时间缩短1.7 个月,上下颌前牙运动表达的准确性也相对较高[32]。总之,未来将是实体软件和语言模型强强联合的时代。
ChatGPT 还具有情感支持的功能,通过分析患者的语言、语气,判断其情绪状态,如焦虑、悲伤或兴奋等。它可以开发自我评估工具,通过提问评估患者的精神心理状态,解答疑惑、舒缓情绪、提供心理支持,使患者更加放松地面对治疗。同时,它还能监测患者治疗过程中的情绪变化,帮助医生提供针对性的支持和建议。
有学者向ChatGPT 提供主题指定其编写虚拟案例,GPT 从这些概念中建立一致的因果关系,输出一份包括主诉、病史、检查(包括体格、影像和病理学检查)以及治疗计划的完整的病例报告,并进行讨论[11]。基于此,笔者以中文形式将一份虚构的病例输入其中,ChatGPT 以患者主诉为中心设计方案,对出现的问题逐次回复,以较强的全科思维输出了一份较完整的矫治计划,具体内容详见流程图1。尽管它没有为患者的病情提供具体的诊断或治疗建议,但它在帮助正畸医生撰写病例、突出问题列表和提高医疗文档的速度和准确性方面具有很大的潜力,这有利于简化工作流程、避免漏诊并改善患者护理[33]。
图1 向ChatGPT 输入虚拟病例资料以及ChatGPT 输出的治疗计划Figure 1 Virtual case data entered into ChatGPT and treatment plan created by ChatGPT
值得注意的是,尽管ChatGPT 可以根据患者病例资料设计治疗方案,但最终决定权仍然掌握在专业的医疗人员手中[10]。同时由于人工智能目前尚不具有伦理主体地位和自我意识,也不能独立承担相应的法律责任,只是作为辅助决策的一种工具,对其造成的错误应该追究使用者的法律责任,而非人工智能本身[34]。
口腔正畸还是一门基于影像学资料制定治疗方案的学科。15 名放射科医生对ChatGPT 生成的简化放射学报告进行质量评估,结果表明,这些报告“正确、完整,对患者没有潜在的危害”[35]。尽管有一些不正确的陈述,但研究者强调了它在放射学中的巨大潜力[35]。未来ChatGPT 可直接整合到诊所或放射学中心,自动生成简化的放射学报告有助于患者理解,增加患者在治疗过程中的自主权,并与原始报告一起交给病人,这将是利用最先进的技术来改善以病人为中心的一种经济有效的方式[35]。此外,ChatGPT 还可通过给出合理的影像检查方式来筛查疾病,避免了影像检查的过度使用[36]。
目前,与口腔正畸相关的机器人研究最多的是弓丝弯制和定制矫治器,其次是诊断和正畸模拟,以及辅助颌面外科手术和种植体植入等其他服务。在远程监测和正畸教育中的应用研究占比较少[37]。而ChatGPT 作为一种AI 聊天机器人,很好地补充和拓展了机器人在正畸领域的应用。在未来,ChatGPT 和实体机器人的结合不仅延伸了正畸医生的眼和手,展示出较精密的结果,还能为正畸医生和患者提供更友好、更准确和更高效的服务。
ChatGPT 训练数据不足主要体现在时间、专业范围和语言三方面。其训练数据的截止日期是2021 年9 月,因此它无法提供关于口腔正畸技术、治疗方法和研究的最新信息。由于训练数据覆盖学科有限,目前ChatGPT 对理解复杂的人体解剖还存在局限性[38],在医学考试中的知识水平和解释能力低于医学生[12]。正畸患者数量有限和数据收集难度较大可能会成为该模型发展的瓶颈。此外,由于预训练主要以英文语料为主,因此ChatGPT在面对中文语境时的理解和表达能力较弱。例如对于“苹果比梨多1/6”类似含义的语句,ChatGPT可能会生成“苹果是梨的1/6 倍”或“苹果是梨的1/6”等错误的表述[9]。但是,ChatGPT 的知识和解释能力会通过深度学习迅速提高,有望更好地为医疗健康和教育等领域服务。
在临床应用中,ChatGPT 的精度可能会受影像拍摄技术和用户精准表达需求能力的影响,这决定能否与ChatGPT 更好地契合以输出更精确和满意的结果。同时,ChatGPT 并不总是完全了解提出的问题或上下文[39],对提示的微小变化很敏感,即使输入相同的文本,也可能会得到不一样的结果[19]。甚至有时生成错误且不合理的答案,并以事实的结果呈现,误导不具备专业知识或相关常识的学习者,引起学习迷航与认知障碍[9]。研究者通过提供前部缺血性视神经病变和非动脉炎性前部缺血性视神经病变的眼底照片来测试ChatGPT-4的最新图像分析功能(可以提出视觉问题),结果ChatGPT 错误地认为眼底照片是CRISPR-Cas 系统(一种基因编辑技术)的示意图,然后提供了对CRISPR-Cas 系统阶段的解释,与提供的图像完全无关[40]。这在复杂的医学领域需要引起足够的重视,专业人员必须对其结果进行科学的评估和验证以确保信息的准确性。
在学术研究中,ChatGPT 的可靠性也遭到了一定的质疑[24]。Dashti 等[41]为了验证ChatGPT 能否为科研写作提供准确的学术参考,要求ChatGPT 在Journal of prosiddentistry(JPD)中找到一篇包含特定关键词(如:龋病)的文章,然后确定这些文章是否真的发表过。结果表明ChatGPT 提供的所有75 篇文章都不能准确地在JPD 或Google Scholar 数据库中找到。因此,ChatGPT 目前还不足以提供准确的文献来源。
ChatGPT 强大的文本处理能力使教育资源更容易获得且更为高效[42]。学生通过表达需求来快速获取答案、撰写论文和轻松生成实验报告[43],得到不属于自身的作品。这种极大的便利可能会磨灭学生的创造力,导致无意的作弊[23]和破坏公平的竞争环境[42]。因此,这可能需要教师提供需要批判性思维的作业,以超越AI 的实际能力,从而发挥学生的创造力。
在正畸临床中使用ChatGPT 可能涉及个人和医疗信息的收集和存储[40]。这引发了人们对隐私和数据安全的担忧。因此,在ChatGPT 应用于临床之前,必须实施最先进的数据保护措施,包括敏感信息的加密、安全数据传输和存储以及访问控制。OpenAI 公司也在努力从训练数据中删除个人信息、微调模型以拒绝对私人信息的请求来最大限度地保护用户的隐私安全。
ChatGPT 在不久的将来可能在口腔正畸教育和临床实践领域产生重大影响。由于其处于初级阶段,因此还需进一步研究、训练和验证,以实现在正畸领域的积极作用。此外,还要考虑到ChatGPT带来的负面影响和无法代替正畸工作者的性质,从而进一步优化和发挥其辅助作用。
【Author contributions】Yuan R conceptualized and wrote the article. Si MM conceptualized and revised the article. Zhang Y, Feng ZY guided and critically reviewed the article structures. All authors read and approved the final manuscript as submitted.