中医临床肝癌病例数据采集规范化研究*

2023-05-31 04:09宋幸铃周亚娜李紫明田双桂沈绍武毛树松田晓霞
中西医结合肝病杂志 2023年5期
关键词:真实世界肝病肝癌

宋幸铃 周亚娜,△ 李 君 李紫明 田双桂 沈绍武 毛树松 田晓霞

1.湖北中医药大学 (湖北 武汉, 430065) 2.湖北省中医院 3.湖北中医药大学附属医院 4.湖北省中医药研究院

以临床数据指导医疗决策是大数据时代知识工程应用的重要方式,对中医临床数据规范化、结构化、知识化是实现“中医临床大数据知识工程”的重要抓手和基础工作。根据中医临床大数据知识工程的总体规划要求[1]和中医临床肝病创新研究的需要,开展了中医临床肝病大数据知识工程研究,并将该工程研究的重要基础工作—中医临床肝癌病例数据采集规范化作为本研究的目标,以保证临床数据的一致性和完整性,为构建中医临床肝癌病例数据库和知识库提供高质量数据资源。本研究的任务,主要包括:①规范中医临床肝癌病例数据,即对指标进行定名定义和统一分类;②设计中医临床肝癌病例报告表(Case Report Form,CRF)[2],它是中医临床肝癌病例数据的载体和采集的工具,其规范的表结构将作为设计中医临床肝癌病例数据库的依据;③制定中医临床肝癌病例数据采集规程,包括:数据采集相关规定和质控要求,以及标准化数据采集流程等。

1 研究背景与需求分析

当前,以临床问题为导向,开展真实世界中医临床研究,探索中医临床传承创新的方法学、揭示中医临床诊疗规律,用于指导临床实践,受到学界的高度关注[3]。中国工程院院士王永炎在《真实世界中医临床研究》[4]中指出“数据的收集整理分析利用评价中医药辨证论治个体化的方案与共识疗效,发掘名家医案的精粹运用于现实是传承创新的方法学。以大科学、高概念、大数据导向的临床医学、药学的方法学研究非常重要。” 在中医临床肝病研究领域也广泛开展真实世界中医临床研究。基于肝癌发病率和死亡率在全球范围内均居高不下,且中医临床治疗肝癌具有增效、减毒、防复的特色优势,所以已将它作为中医临床肝病专科研究的重点病种之一。开展真实世界中医临床肝癌研究,是以中医临床病例数据作为主要研究对象,是利用数据治理和数据挖掘技术,从其大量临床数据中发现临床诊疗的“事实与规律”,这个过程需要高质量的临床数据支撑。为此,开展基于真实世界中医临床肝癌研究需要肝癌病例数据采集规范化研究,通过对中医临床肝癌病例数据定名、定义和分类的规范以及设计CRF和填报规定与流程,以保证中医临床肝癌研究数据资源的质量水平。

2 数据采集规范化的基本原则

中医临床肝癌病例数据采集规范化的基本原则包括:科学性、合规性、可操作性和安全性等。

2.1 科学性 数据采集需遵循中医肝病学和肿瘤学理论的指导,须由具备医学背景的专业人员及相关多学科人员共同参与,以保证中医肝癌临床数据的科学性。

2.2 合规性 数据采集主要依据国家中医药管理局2010年颁布的《中医病历书写基本规范》,并参考国家药品监督管理局发布的《临床试验的电子数据采集技术指导原则2016年版》、《用于产生真实世界证据的真实世界数据指导原则(试行2021年版)》、临床数据交换标准协会发布的《临床数据管理规范》、临床数据管理协会发布的《临床数据管理规范》等。

2.3 可操作性 数据采集涉及一线诊疗工作,面向多类人员如临床医生、患者、研究者、数据录入员等,应考虑他们的工作条件和应用场景,以满足不同使用者的需求,确保高效采集的可操作性。

2.4 安全性 数据采集须符合国家卫生健康委2020年发布的《药物临床试验质量管理规范》等相关法律法规,符合伦理审查法规要求,充分考虑保护患者权益和隐私,不能直接或者间接暴露患者隐私或敏感信息,进行必要的数据脱敏处理,确保数据传输、交互、共享过程中的医疗信息安全。

3 中医临床肝癌病例报告表设计

中医临床肝癌病例报告表(以下简称“肝癌CRF”),规范设计的内容包括:基本结构、主要指标和专属指标。

3.1 基本结构和主要指标 基本结构是采用中医临床大数据知识工程设计的中医临床信息采集表[5]结构,包括基本信息、诊断信息、干预信息、疗效信息等四个信息采集表。其中,基本信息采集表的主要指标,包括:姓名、性别、年龄、民族、婚况、职业、发病节气、地址等;诊断信息采集表的主要指标,包括:主诉、现病史、既往史、个人生活史、家族史、中医回诊、体格检查、专科检查、辅助检查、病证诊断等;干预信息采集表的主要指标,包括:诊疗计划、治则治法、内治法、外治法等;疗效信息采集表的主要指标,包括:病情转归、证候变化、症状变化、辅助检查指标变化、不良事件等。

3.2 专属指标 专属指标是基于中医临床肝癌研究的特点和需求设计和筛选的指标。基本结构和主要指标满足通用数据采集需要,专属指标则针对肝癌进行精细和专业的数据采集和分析,提高数据采集的针对性和有效性。专属指标根据肝癌诊疗技术和标准[6-9],分为西医和中医两类,西医类主要包括:既往肝病史、吸烟史、饮酒史、肝癌家族史、生命体征、其他体征、肿瘤数目、肿瘤大小、转移灶、门静脉癌栓、肿瘤标志物、病理学类型、免疫组化、基因检测、Child-Pugh分级、ECOG评分、CNLC分期、治疗方案、疗效评估、生存状态、生存时间等。中医类主要包括:望诊、闻诊、舌诊、脉诊、中医症状、中医体质、中医证侯名、中医治则治法、中医内治法处方、处方药物的君臣佐使、中医外治法处方、中医症状疗效评估等。肝癌CRF包括基本信息、诊断信息、干预信息、疗效信息等四个信息采集表,现以肝癌CRF-诊断信息采集表为示例说明如下,见表1。

表1 肝癌CRF -诊断信息采集表(样表)

4 数据采集规程

数据采集规程是标准采集流程和具体要求,其流程包括数据来源、采集时间、记录方式、存储和管理、人员培训、数据监督和审核等,以保证数据质量、安全和满足管理需求。针对肝癌数据采集规程编制的具体要求,应考虑:①制定中医临床肝癌病例纳入和排除标准;②设计及优化肝癌CRF;③选择合适的采集时间点,如出入院时、手术前后等;④选择高效的记录方式,多采用选项类、数值类等方式记录,且应保留文本记录的方式,避免出现数据缺失;⑤加强肝癌研究人员专业培训和监督;⑥核查关键数据,记录修改原因并留下完整稽查轨迹。

5 肝癌CRF测试和优化

在临床对肝癌CRF进行测试,共填报353份肝癌CRF,对部分指标的完成率和缺失率进行了统计和描述,见表2。根据表2,其中吸烟史、既往肝病史、脉象、舌苔、舌质、病理学检查、饮酒史、中医证侯名的完成率相对较高,达到了95%及以上;而门静脉癌栓分型、MVI微血管侵犯、MVI微血管侵犯分级、Edmondson-Steiner分级的完成率较低,低于30%。基于填写结果,可以对肝癌CRF的设计进行优化,如增加完整性验证、增加数据采集说明、优化数据填写流程等,以提高数据采集的效率和质量。

表2 肝癌CRF部分指标的完成率和缺失率

6 临床价值和应用前景

本研究开展中医临床肝癌病例数据采集规范化研究,以中医基础理论为指导,遵循中医临床自身发展规律,应用大数据知识工程理论与技术方法,规范了中医临床肝癌病例数据,设计了中医临床肝癌病例报告表,制定了中医临床肝癌病例数据采集规程,以期获得可供真实世界中医临床肝病研究的病例数据,为构建中医临床肝癌病例数据库和知识库提供数据支撑,也可为中医临床肝病专科其他病种的规范化数据采集提供范例。本研究是开展中医临床肝病大数据工程的基础性工作,为进一步运用数据挖掘和知识关联分析技术,发现中医临床数据中的“事实与规律”,建立知识及知识之间的关联关系模型,绘制中医临床知识图谱及研制中医临床应用AI系统等,以实现中医临床传承创新发展,为促进中医药事业现代化发展提供了坚实的数据支撑。

猜你喜欢
真实世界肝病肝癌
多替拉韦联合拉米夫定简化方案治疗初治HIV感染者真实世界研究
参麦宁肺方治疗223例新冠病毒感染者的真实世界研究
非酒精性脂肪性肝病的中医治疗
你还在把“肝病” 当“胃病”在治吗?
LCMT1在肝癌中的表达和预后的意义
虚拟世界和真实世界的纽带
一种基于LBP 特征提取和稀疏表示的肝病识别算法
虚拟现实:另一个真实世界
microRNA在肝癌发生发展及诊治中的作用
Rab27A和Rab27B在4种不同人肝癌细胞株中的表达