抗肿瘤药物应用监测数据上报系统设计与实现

2023-08-02 08:29成静
电脑知识与技术 2023年17期
关键词:组件癌症住院

成静

(南京医科大学附属淮安第一医院,江苏淮安 223300)

1 背景

癌症是威胁全球健康的主要公共问题之一,近年来癌症治疗负担在全球呈持续增长趋势。我国癌症发病率和死亡率均居首位,对人民健康构成巨大威胁。我国癌症死亡人数呈逐年上升趋势,治疗费用远高于其他疾病,严重影响国民经济、社会发展和人民健康。在癌症诊治整体迈向个体化和精准化的多学科综合治疗新时代的过程中,癌症规范化诊疗的推进已成为提升我国整体癌症治疗水平与治疗效果的关键[1]。

为贯彻落实《中共中央国务院关于深化医疗保障制度改革的意见》《国务院办公厅关于印发深化医药卫生体制改革2021年重点工作任务的通知》(国办发〔2021〕20号)等文件要求,坚持以人民健康为中心,强化医疗、医保、医药三医联动,国家癌症中心在国家卫生健康委及国家医疗保障局指导下,开展各级医院抗肿瘤药物上报工作,依据非常宝贵的肿瘤大数据资源,可以充分利用真实世界证据,推动规范诊疗再上新台阶,共同促进我国癌症诊疗的同质化、均质化发展。全面提高癌症诊疗质量,规范癌症诊疗合理用药,保障癌症诊疗安全,提高癌症治愈率,改善癌症患者的生存质量具有深远意义[2]。

2 系统的总体设计

Kettle 中文名叫水壶,意指将不同类型数据放到一个壶里[3],最后能按需要的格式流出。Kettle是一个ETL工具集(Extract-Transform-Load,数据抽取、转换、装载),允许用户管理来自不同数据库的数据。Kettle中主要包含两部分:Transformation(转换)和Job(作业),Transformation 完成数据的基础转换,Job 实现对工作流的控制。通过图形界面设计实现做什么业务,并在Job 下的start 模块,有一个定时功能,可以每日、每周等计划方式进行定时执行。在开发、测试和调试阶段,作业和转换可以在图形界面里执行,部署生产阶段一般需要通过命令行执行,需要把命令行放到Shell 脚本中,并定时调度这个脚本。在开发完成后,Kitchen 和Pan 命令行工具用于实际的生产环境。Kitchen和Pan工具是Kettle的命令行执行程序,Kitchen用于执行作业,Pan用于执行转换。采用拖拽组件、连线、配置的方式来构建数据管道,通过超过200个不同的组件,用户可以在不编写一句代码就能轻松完成对数据源读取,对多源数据进行格式转换、关联、建模、统计、计算,并输出数据结果。极大程度地降低开发技术门槛和有效降低开发和维护成本。

2.1 技术方案

由于上报数据涉及多个业务系统,如医院信息系统、电子病历系统、实验室信息系统、医学图像信息系统、病理标本管理系统、病案信息系统等,各个业务系统又来自不同生产厂商,每个生产厂商又使用的是不同类型的数据库,就需要将数据统一抽取的前置服务器,再统一上传国家抗肿瘤药物临床应用监测网。

前置服务器部署包括环境部署:安装JDK--Java语言的软件开发工具包,设置环境变量。以及资源库配置:配置资源库信息,包括数据库、主机名称、数据库名称、端口号、账号、密码等。

2.2 功能设计

Kettle 主要包含两大部分:转换transform:完全针对数据的基础进行转换、作业job:整个工作流的控制(如图1所示)。

图1 transform工作流

1)创建转换transform

先新建转换,更改转换名称,选择转换归属。再建立表输入输出:在组件组-输入中找到组件-表输入,选择数据库连接(数据源),填入相应SQL 语句。接着建立表输出:在组件组-输出中找到组件-表输出,建立表输入和表输出的连接,选择数据库连接(数据仓库),录入目标表名,指定数据库字段,获取相应字段,最后执行SQL即完成建表。建立清理SQL:在组件组-脚本中找到组件-执行SQL脚本,选择数据库连接(数据仓库),填写相应SQL 语句,建立与表输入的关系即可。最后测试转换是否能正常工作[4]。

2)创建作业job

一个转换就是一个ETL 的过程,而作业则是多个转换、作业的集合,在作业中可以对转换或作业进行调度、定时任务等。当数据抽取需要多步骤时,需要分成多个转换,再集成到一个作业里顺序摆放,然后执行即可。作业job 是对整个工作流的控制,可以定时,一个作业可以包含多个作业项,转换transform 只是其中一个作业项。

2.3 最终实现效果

本次设计需要将HIS 系统中病人基本信息数据、费用数据、结算数据等,医生站系统中医嘱数据、病历数据、诊断数据等,实验室信息系统中检验结果数据,医学影像系统中检查结果数据,病理系统中病理检查结果,病案管理系统中病案首页相关数据等各系统中数据进行抽取、转换再上传至全国抗肿瘤药物临床应用监测网。共涉及SQL Server、Oracle Database、MySQL三种类型数据库,21张表(如图2所示)。

图2 最终实现效果

3 系统功能

3.1 上报范围

1)上报患者范围:根据患者诊断来判断是否属于上报范围。通过门(急)诊诊断和住院诊断中的诊断信息筛选出恶性肿瘤患者相关数据进行上报。

2)上报时间范围:医院需要每月上报门诊患者、住院患者的医疗数据。住院患者数据按出院时间进行筛选后上报、门(急)诊患者数据按就诊时间进行筛选后上报(如图3所示)。

图3 上报时间范围

3)上报内容范围:患者的门诊、住院、诊断、治疗、检查、检验、随访等相关数据。

3.2 数据质控方案

1)数据关联关系

医院上报数据实现2个维度的关联:患者维度、单次就诊维度。患者维度:住院患者信息表、门诊患者信息表,以“患者ID”与患者就诊基本信息表关联。患者ID 是患者在本院信息系统内的唯一标识,其他上报数据表中患者ID 均应与本表患者ID 一致。单次就诊维度:住院信息相关表,以“单次就诊唯一标识号”与住院患者信息表关联。单次就诊唯一标识号是患者在本院的单次就诊唯一标识。除了单次就诊唯一标识号,还可以通过病案号、住院号、住院次数等字段实现关联[5]。

2)数据质量

通过数据量、关联性、数据内容正确性,分别验证上报患者数据。包括:字段级检查如时间类型字段是不是合法的时间范围检查、非空校验等、单表级检查如患者存在手术记录,则手术日期为必须项等、跨表级检查如:HIS 系统唯一号在门诊、住院表格中的关联度,检查病人的唯一号在基础信息表中必须存在等,确保数据评估的有效性。

4 应用效果

传统的数据上报方法,是通过医院HIS、LIS、PACS等业务系统报表查询功能或者使用SQL数据库软件等方法将数据查询、导出,整理汇总后上报至国家抗肿瘤药物临床应用监测网,由于各业务系统相互独立,人工查询统计汇总,发生差错不可避免,必须仔细核对,并经业务部门确认数据,浪费人力资源[6]。抗肿瘤药物应用监测数据上报系统应用实施后,解决了上述难题。该系统通过自动采集数据、统计汇总形成报表,最终完成上报,全过程均由计算机完成,无须人工参与,降低了人力资源成本。同时,避免了人工统计所不可避免的差错,有效防止误报、漏报,被国家抗肿瘤药物临床应用监测网评定为A级。

5 总结

持续上报抗肿瘤药物在我院临床应用监测情况,加强肿瘤病人用药管理,规范医院抗肿瘤药物在临床的应用,积极探索医院重点监控项目,建立预警制度,借助国家抗肿瘤药物临床应用监测网的数据分析功能,实现诊疗过程中抗肿瘤药物的全流程管理。依托国家癌症中心肿瘤信息数据库,进行肿瘤规范化诊疗行为综合评价,分析不合理诊疗行为,规范患者全周期治疗过程中的检验检查[5]。在肿瘤诊疗服务领域加强“互联网+医疗健康”建设,增强优质服务的可及性。为肿瘤规范化诊疗管理相关工作提供科学数据依据,积极推行“单病种,多学科”综合治疗理念,制定MDT诊疗标准化操作流程,提升参与MDT 肿瘤患者比例,持续优化肿瘤诊疗模式,提高科学决策水平。

猜你喜欢
组件癌症住院
无人机智能巡检在光伏电站组件诊断中的应用
新型碎边剪刀盘组件
留意10种癌症的蛛丝马迹
U盾外壳组件注塑模具设计
癌症“偏爱”那些人?
对癌症要恩威并施
不如拥抱癌症
QCC在预防神经内科住院患者跌倒与坠床的应用
精神病人住院自缢 医院担啥责
风起新一代光伏组件膜层:SSG纳米自清洁膜层