“国产医疗版ChatGPT”惊艳亮相

2023-04-24 03:46郭潇雅
中国医院院长 2023年7期
关键词:华佗研究院语音

文/本刊记者 郭潇雅

华佗GPT 在医疗个性化、多模态、语音交互等多个方面有独特体现,通过深度学习,致力于提供便捷有效的医疗咨询服务和患者情感陪伴。

仅用了短短两个月,ChatGPT就已风靡全球,火遍全网,成为人工智能的现象级应用。不过,国内的小伙伴大可不必因为ChatGPT难以注册使用而烦心,就在2023年2月25日,国家健康医疗大数据研究院(深圳)在2022CHINC大会上,重磅展示了一款名为“华佗GPT”的人工智能产品,让在场观众大开眼界。

“新生儿黄疸一定要照蓝光吗”“晒太阳可以去除黄疸吗”“黄疸去医院挂什么科”,中国工程院外籍院士、香港中文大学(深圳)副校长罗智泉现场演示了华佗GPT为患者提供医疗咨询的一段对话,华佗GPT逐一进行了解答。据介绍,这款“国产医疗版ChatGPT”专门针对医疗行业研发,是人工智能驱动的对话式大型预训练语言模型,目前已经过“无监督训练大语言模型”和“有监督微调”的训练阶段,下一步将收集医生的真实反馈,进入加强学习阶段。目前,华佗GPT将主要应用于医疗咨询与情感陪伴,包括患者培训、健康咨询、就医分诊、心理诊断和治疗等。

“今天让我印象最深的事情就是看到了华佗GPT,新技术新应用的进入可真快啊!”天津市宝坻区人民医院副院长吴秀春的这句感叹,代表了展会上诸多观众的心声。

保证“学习质量”

国家健康医疗大数据研究院(深圳)成立于2020年11月,是一家由深圳市大数据研究院发起申请,由国家卫生健康委、深圳市卫生健康委、深圳市大数据研究院共同建设的非营利性科研机构,是一家独立法人的二类事业单位。研究院的总体定位是建设“国际一流、国内领先”的国家级研发平台和“医工交叉融合、开放共享、投资多元、运行高效”的国际化新型研发机构。

香港中文大学(深圳)医学院副院长、国家健康医疗大数据研究院(深圳)院长于广军告诉记者,研究院的工作主要聚焦在医疗大数据和人工智能的研发和应用领域,先后开展了基于扩散模型的病理切片样本生成技术、病理图像细胞核分类方法、肝纤维化智能诊断、基于CT/MRI的腹部多器官分割以及华佗GPT研发等科研工作。

在于广军看来,ChatGPT已经在智能问诊咨询方面凸显出价值,今后至少将在5个方面对医疗界产生深远影响:推动医疗智能化、提高医疗效率、推动医学研究、提高医患沟通效果、缓解医疗资源不平衡。“如果能够通过ChatGPT,把高水平医生的经验以较低成本,迁移到广大基层医疗机构,将会有助于提高我国整体医疗水平。医疗行业应该以积极的态度去把握ChatGPT背后的机遇。”

会场观众亲眼见证华佗GPT 强大功能。

2022年9月,当研究院得知国外正在研发ChatGPT这款产品后,也着手开始布局医疗问答方向的研究,组建了包括医学专家、IT工程师在内的20人研发团队,开始了互联网爬取、文献抽取和知识图谱抽取的知识数据集构建工作。如何收集一些高质量的中文医疗文本,成为团队面临的最重要问题。

通常认为,相比英文数据,中文数据在质量和数量上没有优势,在医疗垂直领域,由于患者隐私的缘故,更少有高质量的医疗文本可以公开访问。为了保证华佗GPT的“学习质量”,研发团队从以下3个方面入手。

一是大规模数据集。华佗GPT训练时使用了大量的文本数据,这些数据涵盖了不同的语言、领域和主题。这使得华佗GPT能够学习到各种类型的知识,提高其理解和生成文本的能力。

二是无监督预训练。华佗GPT使用了无监督的预训练方法,例如预测下一个词或掩盖一个词并预测其词。这些方法可以帮助华佗GPT学习语言结构和语境,从而提高其生成文本的质量。

三是多层次的模型结构。华佗GPT在构架中,采用了多层次模型,包括多个Transformer(扩散)层和自注意力机制。这种结构可以帮助模型理解长文本序列的依赖关系,提高模型生成文本的连贯性和一致性。

“此外,最重要的一点是引入了人类反馈,通过对齐人类的偏好,可以提升深度学习的空间,提供更优用户体验。”于广军说道。

功能优势显现

如果说数据集构建是华佗GPT研发的重点,那么高质量的语音合成就是研发的难点。尽管市面上的语音合成技术已相对成熟,但是根据对话场景,实时生成恰如其分的语音并非易事。通常对话系统在一些垂直领域的应用,对用户的耐心考验很大,用户一般没有耐心和对话系统做长时间的沟通,这样就造成了对话机器人实际使用效率低下。

为了使华佗GPT支持更丰富的语音交互形式,研发团队邀请语音合成领域的巨擘李海洲教授和“数字人”领域专家张瑞茂教授开展了大量“场景依赖的语音生成”研发测试工作,将华佗GPT打造成了“数字人”的产品形态,问答精准快速,并支持多模态的输入。例如用户可以直接上传医院拍摄的胸片或者有问题部位的照片,无缝地植入华佗GPT对话中,增强了用户的体验性和黏性。

“对于一款医疗语音交互系统来说,很多患者并不知道如何准确地描述自己的症状,没有准确的描述,往往无法得到想要的答案,所以图片描述症状可能更客观。”于广军解释道。

在利用外部引擎方面,也是华佗GPT的一大优势。研发团队将医疗文本能力(如出院摘要、体检报告解读)、医疗视觉能力(放射性报告生成)和医疗多模态能力都整合到了华佗GPT里。目前,ChatGPT暂时还无法结合用户的个人信息给出答案,但华佗GPT可以根据个人的遗传病史、历史就医、年龄职业等来动态生成回答。同时,华佗GPT还具备了可以适时调取搜索引擎的能力。例如,用户通过华佗GPT来访问本地信息,获取附近医院联系方式、专家简介等,这也将大大增强用户的体验。

于广军表示,华佗GPT现处于研发的第三阶段,即基于人类反馈的强化学习阶段。医生的真实反馈对系统的模型调节和高效学习至关重要,不仅是对华佗GPT算法的一种考验,也是对研发人员与医务人员沟通协作的一种考验。今后,研究院将加强与医疗机构的合作,进一步夯实华佗GPT的数据基础,提高系统的实用性和应答质量,通过开展应用创新试点进行社会测试,邀请第三方专家对该技术进行综合评估,在功能上不断完善。

待技术成熟之后,研究院将积极寻找合适的应用场景,形成新的业务模式和商务模式,以便于华佗GPT的落地与推广应用。在制度建设方面,研究院将积极建立应用准入制度、监管制度、伦理评估制度、收付费制度等,以保证业务运行安全有序,实现可持续发展。

如果能够通过ChatGPT,把高水平医生的经验以较低成本,迁移到广大基层医疗机构,将会有助于提高我国整体医疗水平。医疗行业应该以积极的态度去把握ChatGPT 背后的机遇。

——于广军 国家健康医疗大数据研究院(深圳)院长

猜你喜欢
华佗研究院语音
北京食品科学研究院
工程技术研究院简介
从心所欲不逾矩——为中国戏曲研究院成立70周年作
不是我!是他捣乱!
魔力语音
华佗学医
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
华佗治病