黄健隽 汤梁峰 叶成杰 刘丽娟 李小玲 郑红梅 张晓波 国家儿童医学中心,复旦大学附属儿科医院信息网络管理中心,复旦大学附属儿科医院呼吸科 (上海 201100)
内容提要:目的:设计并研发一种适用于小儿哮喘临床随访的专病库系统,使临床专科医师能在信息系统的辅助和支持下,开展高质量的专病研究。方法:通过专科医师、信息管理部门协同研发一个系统,包括定义小儿哮喘专病数据采集表、规范纳入和排除标准、建立入组流程、升级门诊医生工作站、搭建医患交互平台,将多来源数据整合形成临床科研一体化的专病库系统。结果:该小儿哮喘专病库系统建设了一个能将患儿首诊、复诊及随访数据进行整合,实现多维数据高效采集并良好整合和呈现的系统,在哮喘专病门诊为小儿哮喘队列研究的患者自动入组、数据自动采集、长期随访管理等多种功能提供了信息化支持。结论:信息化专病库系统在临床上为高效开展专病队列患者入组和随访提供了技术支持,为专病数据采集和管理提供了解决方案,有效提升了专病队列研究的效率。
全面而准确地采集来自患者的数据是临床队列研究的重要内容,也是研究质量的保证[1]。传统队列研究是为了全面收集数据,数据采集方法包括了查询病历、电话问询、现场访谈、纸质问卷等方式,数据处理的基础是基于单机的表格化录入和数据处理。经过多年的发展,医院内信息系统已经全面支持临床医疗各环节,大量的患者诊疗数据实现了无纸化电子存储,临床队列研究所需的数据也大量分散分布在医院的各个系统中。为了改革传统低效的临床数据收集模式,有必要以自动采集的形式全面覆盖院内各数据来源,并对入组患者随访实现统一而快捷的网络化交互管理,建设高效支持临床队列研究的专病库系统。
在开展对临床专病队列建设支持的实践中,本院进行了小儿哮喘专病库系统的建设。哮喘是儿童最常见的有急性发作风险的慢性呼吸系统疾病,其特点是病程长,病情易反复且需要长期的随访治疗,患者多数在门诊进行治疗,需要全流程的细致管理和密集随访。患者的临床数据涵盖了生活居住环境、门诊诊疗、检验检查、院外随访用药等多来源数据,通过信息化管理能显著提高随访和患者管理的效率。
基于上述哮喘发病机制的复杂性,以及哮喘患儿对医护协同随访的需求,建设一个能将患儿首诊、复诊及院外数据进行整合,实现多维数据良好采集和呈现的系统,有助于专科医护人员给患者良好的随访和全周期的照护[2]。通过专科医生为核心的团队与信息管理部门合作,本院探索了一种由信息系统支持专病规范化管理的新模式,本研究通过建设方法、系统设计、建设成效等对本系统的研发和运用进行介绍。
根据哮喘患者的特点,专病医生与医院信息部门对于目前传统哮喘队列的管理特点、数据采集内容进行分析,确定需要重点建设的功能点及系统需求。
传统的队列入组,需要门诊专科医师在接诊时判断该患者是否符合入组条件,存在医师的主观偏差,以及漏操作风险。哮喘专病队列具有明确的入组标准,即患者诊断中是否含有ICD-10编码中的J45-J46诊断编码。在已经使用标准ICD编码的电子病历系统中,基于专病库系统对诊断编码的识别,能实现对符合诊断的患者自动入组。
专病库系统建设中,需要对传统的病例报告表(CRF)进行电子化,并运用整合优势,从医院多个信息系统中精准采集病历报告表中的相关字段进行自动填充,对非结构化数据进行结构化处理,对以图像方式存储的数据进行图像中字符数据的提取。自动填充的病例报告表支持临床多源数据的整合,在友好的界面,以患者为单位统一展示全生命周期数据。
专病库系统数据来源的多样性决定需要从患者方采集数据,小儿的居家照护、居住环境及日常症状等数据由家长自行填报并纳入专病库。对患者的全周期照护也需要患者有联系医师的渠道和接受随访提醒、个性化指导的途径,需要建设一个医患交互平台。
专病库系统以B/S架构布置于医院内部网络,应用服务器和数据库位于医院内网,院内电脑终端通过桌面浏览器直接访问系统。医患交互平台则需要应用服务器通过防火墙和前置机实现移动应用通知服务,通过医院公众号和患者实现数据交换。
本项目构建的哮喘专病库系统总体框架如图1所示,根据系统需求分为患者入组管理、专病数据管理、医患交互平台三大模块。数据来源通过数据采集系统的治理,通过医院现有信息系统和门诊电子病历进行集成,实现数据及时采集和传输。
图1.专病库系统总体架构图
入组发生在门诊诊间,医生在进行门诊病历保存诊断时,系统通过患者基本信息和诊断编码,比对纳入排除条件,自动筛选潜在患者。根据患者是否存在于专病库系统中,区别判断初诊和复诊患者。医生可根据系统的主动提示决定初诊患者的入组或排除。系统对拟入组患者生成专属二维码供患者扫描形成身份识别,以便后续医患交互和精准随访。对复诊患者,系统直接提示跳转查看该患者的临床专病数据。入组流程设计如图2所示。
图2.专病库系统患者入组管理流程
小儿呼吸专科医生主导了哮喘专病库系统中电子病例报告表(eCRF)的建立,该表单充分考虑了数据采集的范围、来源、以及临床和研究的需要。根据临床需求,按模块分别设置为16个诊疗数据模块:基本信息、症状体征、实验室检查、肺功能检查、影像学检查、用药记录、住院信息等;18个随访和调查模块:既往病史、孕产史、喂养史、家庭环境、日常哮喘症状评分、过敏性鼻炎症状评分、哮喘控制测试、日常生活管理、疾病医学管理、社会心理管理、哮喘用药依从性量表等。同时,设置了每个模块数据相应的采集时间点。每个模块下设置所需采集的变量,根据变量之间的从属关系进行划分,本电子病例报告表中的变量分为一级变量295个、二级变量189个、三级变量33个。
所有入组患者的院内数据,由专病库系统通过院内数据平台对接各院内系统(电子病历、检验、检查、用药等)进行自动采集。根据系统架构,专病库系统提供简洁的访问途径,在院内任一联网的计算机终端上可以进行数据调阅和检查,并支持对数据进行增补和修正。
专病库系统运用丰富的数据,支持生成患者的临床决策支持图表。以时间为轴,根据临床医师的需求,全景式展示各项指标,能展示哮喘患者管理中的用药情况、肺功能重点指标的变化趋势、检验项目中特定指标的变化、哮喘急性发作情况等(如图3所示)。
电子病例报告表含有大量随访和调查模块,需要对患者进行问卷调查以便从患者家庭采集信息。医患交互平台支持专病库系统根据设定的内容和频次,在计划的采集时间点向患者家属推送调查表单,并采集家长填写的反馈数据。系统支持对随访调查表单的自动发放时机和内容进行配置,以入组时刻为0日基线,按计划自动推送随访要求,家长填写的数据实时保存在专病库系统[3]。
专病库系统不但按设定的随访计划通过平台向患方推送复诊提醒,也提供患者和医师的个性化沟通交流。患者可以上传院外就诊记录供医护人员参考,医护人员可以进行针对性回复。
在电子病历报告表中,有相当部分变量的来源是自由文本,如症状、体征等均来源于医师书写的门诊电子病历;胸部影像特征则来源于影像学报告。自由文本这一类非结构化数据直接存储,则处理复杂,后续运用困难。需要通过自然语言识别技术进行分析,形成结构化的高质量数据便于应用[4]。人工智能支持的自然语言分析技术,深度学习了本院门诊电子病历、检查报告的样本,实现了对其中变量的准确抽提,实现了相应数据的结构化。
肺功能是哮喘的重要辅助检查,当前本院肺功能报告为图片格式储存,系统无法直接从图片报告中采集重要的肺功能检查数据。为了实现肺功能数据的运用,本系统研发中使用了OCR技术进行肺功能报告的数据采集。通过对肺功能报告图像进行二值化预处理,并运用基于霍夫变换直线提取的特征提取法,根据特征对图像做分类处理,对图像内容有效区域借助Tesseract引擎进行识别,通过医学词典辅助纠错,使肺功能报告内容识别率得到保证,肺功能报告数据实现结构化存储[5]。
专病库系统嵌入门诊医生工作站,通过接口改造,实现病历内容至专病库系统的实时传输。在不影响医师正常接诊流程的情形下,系统以后台运行的形式,完成数据比对,在符合纳入标准的时候,对初诊患者进行入组提示,对复诊患者支持数据调阅。
除了支持从门诊医师工作站一键调阅已入组患者的专病数据,数据管理界面还支持对患者数据进行多维度、复合条件查询(见图4)。并允许对数据质量进行核查,完善数据规约、清洗等治理工作,为临床研究提供支持。
图4.专病数据查询界面
专病库系统以患者入组日为基线,并根据专科医师决定的随访计划定期推送随访调查表单(见图5)。医护人员可以在管理界面回复患者咨询,查看随访调查表单填写情况,并对患者进行表单完整度的核查和补充。
图5.专病随访管理界面
随着专病库系统的试运行,哮喘门诊实现了专病队列患者的规范入组和管理。系统试运行2个月,即分析和采集历史患者数据11817人次,纳入新患者173人并开始规范化随访。通过专病数据管理功能核查电子病历报告表(eCRF)自动采集完整度,新纳入的患者中,填充完整度达到90%。
在医患交互平台使用中,第1周共推送问卷表单16份,患者填写提交5份,完成率为31%。对于不理想的填写完成率,通过分析原因认为,一方面需要医生加强在患者入组时依从性的宣教,另一方面系统升级设置为次日对患者未填写表单进行再次推送。上线第4周,共推送64份,患者填写37份,完成率升至58%,得到了显著提升并在持续改进中。
队列研究是进行病因和结局研究的可靠方法,高度依赖临床数据的高质量收集。目前针对专病队列患者的数据收集方法不一,纸质媒介、单机版表单、联机数据库均被广泛使用,而结合了数据高效采集和随访管理一体化的专病库系统正在兴起,本研究建立的哮喘专病库系统创造性地综合了门诊患者自动识别入组、数据自动采集整合、患者规范化随访管理,以从头入组的形式有效支持了前瞻性队列研究以及对患者全周期随访的规范化管理。
对哮喘患者的照护一般从首次门诊接诊开始,本哮喘专病库系统直接嵌入门诊医生工作站,对从头入组、复诊患者数据调阅等进行实时支持[6]。本哮喘专病库系统将医院信息系统内的数据、患儿家庭自行申报的数据和医护人员需要录入的数据进行整合,形成完整的队列随访全周期数据,较传统方式大幅度节约人力资源并有效提升数据可靠性。在支持临床流行病学研究的同时,有效促进对患儿随访全周期的照护。本系统兼具实用性与创新性,后续可以推广应用到其他通过门诊随访为主专病如小儿慢性肾病、小儿癫痫等,对于科学管理其他儿童常见病患者具有重要意义,也对于其他慢病建立规范化临床研究队列也具有参考意义[7,8]。
临床队列的建立也为进一步拓展专病研究的深度建立了平台。在此平台上,能基于人工智能等新兴技术开展决策支持、患者智慧服务等拓展应用,如结合肺功能报告智能识别的数据提供辅助诊断、根据患者自行填报的信息主动给出照护建议等智慧应用场景[9,10]。
本系统目前仍存在不足之处,如在随访后期,部分哮喘患者因病情缓解,不易保持依从性,数据采集完整度容易下降。现有实践中,专科医生也需要和患者在长期随访中充分进行沟通协调,努力提升患者通过医患交互平台提交数据的依从性。
基于哮喘的临床专病队列研究需求,研发了一个能将患儿首诊入组、临床数据采集、医患交互随访进行整合,实现多维数据良好整合和呈现的系统。在科学管理疾病、开展临床队列研究方面为医护人员提供了强有力的支持。