关于人群队列研究中体格数据质量把控的实践与思考

2025-02-19 00:00:00陈书娟胡丹王明达赵霞佘绍荣陈蕾
中国现代医生 2025年1期
关键词:数据质量体格检查

[摘要]"目的"通过对比分析优化前后的体格数据质量,在队列现场的实际操作中评估并进一步优化质量控制措施。方法"采用四川大学华西医院自然人群队列研究在2020年收集的17"420条体格数据和2021年收集的12"762条体格数据。从规范性、完整性、逻辑性、准确性及一致性等多个维度,对2020年(优化前)与2021年(优化后)的数据进行评估与对比。结果"相较于2020年,2021年的数据质量呈现出显著提升。异常数据的比例由1978条(11.35%)大幅下降至276条(2.16%),差异有统计学意义(Plt;0.05)。具体而言,血压异常数据从143条(0.82%)减少至67条(0.52%),腰围异常数据则从1777条(10.20%)显著降低至113条(0.89%)。在数据的完整性和逻辑性评估方面,2021年的表现总体优于2020年(Plt;0.05)。结论"优化调整体格数据的采集流程并实现一体化信息系统管理对提升数据质量至关重要。

[关键词]"队列研究;数据质量;体格检查

[中图分类号]"R331""""""[文献标识码]"A""""[DOI]"10.3969/j.issn.1673-9701.2025.01.015

Practice"and"reflection"on"quality"control"of"physical"data"in"population"cohort"studies

CHEN"Shujuan1,"HU"Dan1,"WANG"Mingda1,"ZHAO"Xia1,"SHE"Shaorong1,"CHEN"Lei2,3

1.Institute"of"Respiratory"and"Comorbidity,"West"China"Hospital"of"Sichuan"University,"Chengdu"610041,"Sichuan,"China;"2.Department"of"Neurology,"West"China"Hospital"of"Sichuan"University,"Chengdu"610041,"Sichuan,"China;"3.Plateau"Health"Joint"Institute,"West"China"Hospital"of"Sichuan"University,"Chengdu"610041,"Sichuan,"China

[Abstract]"Objective"To"evaluate"and"further"optimize"the"quality"control"measures"in"the"field"of"queue"by"comparing"and"analyzing"the"quality"of"physical"data"before"and"after"optimization."Methods"17"420"physical"data"collected"in"2020"and"12"762"physical"data"collected"in"2021"were"used"in"the"natural"population"cohort"study"of"West"China"Hospital"of"Sichuan"University."The"data"in"2020"(before"optimization)"and"2021"(after"optimization)"were"evaluated"and"compared"from"multiple"dimensions"such"as"normalization,"completeness,"logic,"accuracy"and"consistency."Results"Compared"to"2020,"data"quality"in"2021"showed"a"significant"improvement."The"proportion"of"abnormal"data"decreased"significantly"from"1978"(11.35%)"to"276"(2.16%),"and"the"difference"was"statistically"significant"(Plt;0.05)."Specifically,"the"number"of"abnormal"blood"pressure"data"decreased"from"143"(0.82%)"to"67"(0.52%),"and"waist"circumference"data"decreased"significantly"from"1777"(10.20%)"to"113"(0.89%)."In"terms"of"data"integrity"and"logical"evaluation,"the"performance"in"2021"was"also"generally"better"than"that"in"2020,"and"the"difference"was"also"statistically"significant"(Plt;0.05)."Conclusion"It"is"very"important"to"optimize"and"adjust"the"collection"process"of"physical"data"and"realize"integrated"information"system"management"for"improving"data"quality.

[Key"words]"Cohort"study;"Data"quality;"Physical"examination

中国大型人群队列研究起步虽晚,但发展迅速[1-2]。在大数据和精准医学的推动下,研究规模和深度显著提升,现已涵盖自然人群、专病、母婴、职业等多个领域,截至2019年3月已有470项研究发表,其中前瞻性研究占主导[2-3]。诸如中国慢性病前瞻性研究等大型项目已取得显著科研成果[4]。同时,中国正积极构建百万级自然人群健康队列及专病、罕见病队列。这些研究不仅为疾病预防、诊断和治疗提供重要数据支持,还促进公共卫生领域的发展[2]。然而,队列研究在数据管理、质量控制和长期随访等方面仍面临挑战[5]。大型队列研究凭借其数据内容的丰富性和来源的多样性,在涉及海量人群的大样本研究中占据重要地位。而数据质量作为衡量队列建设成效的核心标准,显得尤为重要[6]。体格检查涵盖身高、体质量、腰臀围、血压等关键指标,这些数据的精确性不仅直接关系到个体医学问题的判断,还对其他医学检查的准确性产生深远影响。因此,体格检查数据的准确率对整个队列研究的质量具有决定性意义。本研究是由医院主导、依托医联体单位建立的健康检查和科研于一体的惠民服务。由于项目初期缺乏成熟的预约管理机制,导致参与体检的人数波动较大,不同时段人员分布不均,尤其在高峰时段出现人员拥挤和秩序混乱等问题[7];项目持续时间较长,工作人员流动性较大,也给项目的考核和推进带来挑战;在实际操作过程中,因对细节理解不足及中后期因重复性工作导致的耐心丧失,都可能引发操作失误。本研究拟通过分析近2年收集的体格数据,从横向和纵向两个维度控制数据的一致性、完整性、逻辑性和规范性。

1""资料与方法

1.1""研究数据来源

本研究数据源自于四川大学华西医院自然人群队列研究,具体包含2020年采集的17"420条数据与2021年采集的12"762条数据。该项目覆盖四川省内超过200个社区,收集20岁及以上年龄段、具有当地户籍或非本地户籍当地居住时间达6个月以上、近2年没有搬家或离开计划人群的相关信息。本研究经四川大学华西医院生物伦理审查委员会批准[伦理审批号:2020年审(145)号]。

1.2""检测方法及参照标准

血压与脉搏的测量采用电子血压计,并严格遵循世界卫生组织于2020年发布的《带袖套的自动无创血压测量装置操作技术规范》[8]进行。身高与体质量的测量使用身高体重仪,而腰围与臀围的测量采用软尺,并按照《中国慢性病及其危险因素监测报告2010》[9]中的操作规范执行。握力的测量使用电子握力计,并参考《捏力测量方法及影响因素研究进展》[10]中的操作规范进行。

1.3""数据评估标准

建立自然人群队列体格数据质量控制体系,参考《大型人群队列研究数据处理技术规范(T/CPMA"001-2018)》[11],结合项目中体格数据特征分析数据异常情况,并从规范性、完整性、逻辑性、准确性及一致性评估数据质量,对评估结果采用描述性统计分析。①规范性指录入数据是否符合本自然人群队列方案制定的数据规范和要求,比如录入血压“13897”“139//97”,或数据中掺入符号,均视为不规范。②完整性指数据是否存在空项、漏项,不包括特殊原因导致的空项,如因手臂创伤或术后无法测量血压的情况。③逻辑性指在一次测量中,测量前后的值或相关值不符合现实逻辑规则或数据内部逻辑冲突。如脐腰围与最小腰围的差值关系,正常情况下脐腰围应大于最小腰围,如果脐腰围小于最小腰围则视为逻辑异常。④准确性指数值超过界限值(经核实符合实际的特殊情况除外),如体质量gt;150kg或lt;35kg(体质量指数正常除外),脉搏lt;40次/min或gt;200次/min等。⑤一致性指对比同一人群2年的数据,数据是否具有可重复性。通过对比前后2年的数据评估结果,进一步优化现场流程及质控方案。

1.4""数据采集的优化措施

考虑到2020年的数据异常情况,2021年采取以下优化措施以降低数据异常率,提高数据质量。具体包括:①强化现场流程质控:在数据采集过程中加入现场质控环节,即时核查并纠正错误的操作方法,确保数据的准确性和可靠性。②实施即时数据质控:对采集到的数据进行即时质控,及时发现并处理数据中的问题,提高数据质量。③异常数据返修机制:针对发现的异常数据,建立返修机制,确保数据的准确性和完整性,为后续分析提供可靠基础。④定期总结与优化流程:定期对数据采集流程进行总结和评估,根据反馈不断优化流程,提升数据采集效率和质量。

1.5""统计学方法

采用描述性统计分析的方法对数据质量进行评估。涵盖计算数据的缺失率、异常率、不准确率等关键指标,比较采用χ2检验。数据质控采用WPS"Office"6.11.0软件,数据分析采用R语言(R"version"4.4.1)。双侧Plt;0.05时认为结果具有统计学意义。

2""结果

2.1""两年的异常数据总体情况

2020年和2021年分别有1978人、276人存在异常数据,异常数量明显下降(Plt;0.05)。与2020年相比,2021年的身高、体质量、血压及腰围异常数据显著减少(Plt;0.05),但脉搏异常数据有所增加(Plt;0.05),臀围数据差别不大(Pgt;0.05),见表1。

2.2""规范性评估

2020年和2021年分别有50人、27人存在不规范数据,两年不规范情况无显著差异(Pgt;0.05)。两年的血压、脉搏、脐腰围、最小腰围及臀围不规范情况比较差异均无统计学意义(Pgt;0.05),见表2。

2.3""完整性评估

2020年和2021年分别有31人、9人数据缺失,2021年的总体缺失情况显著减少(Plt;0.05)。2021年的血压数据的异常情况有改善,但脉搏数据的异常情况有增加(Plt;0.05),见表3。

2.4""逻辑性评估

2020年和2021年,存在逻辑性异常的数据分别为1764条(10.13%)和104条(0.81%),比较差异有统计学意义(Plt;0.001)。

2.5""准确性评估

2020年和2021年分别有154人、138人存在不准确数据,两年总体的不准确情况无显著差异(Pgt;0.05)。2021年的身高、体质量不准确数据显著减少,但脉搏的不准确数据有所增加(Plt;0.05),见表4。

2.6""一致性评估

一致性评估主要对比两年的身高和体质量数据。在身高方面,两年均有数据的共6475人,剔除异常数据后,有效人数为6469人。其中,两年身高差值大于5cm的受试者165人,异常率为2.55%。在体质量方面,剔除异常值后,有效人数为5538人。其中,两年体质量差值大于10kg的受试者51人,异常率为0.92%。

3""讨论

3.1""评估结果及原因

从数据异常的具体层面分析,2020年的主要问题聚焦于血压与腰围数据两大模块,特别是脐腰围与最小腰围的数值间存在较多逻辑性问题。2021年腰围数据的问题取得显著改善,同时身高、体质量及血压数据也有所改善,但脉搏与臀围数据仍面临挑战。

从数据异常的分类情况来看,在规范性评估中,主要问题源于血压数据格式的不规范,虽然存在一定的不规范现象,但整体比例较低。完整性评估结果显示,整体数据完整度良好,不过2021年的血压数据完整性比例相较于2020年有所下降,脉搏数据的不完整性则有所增加。逻辑性审查方面,2020年的数据逻辑性异常率较高,2021这方面有显著进步。在数据准确性层面,两年的不准确数据情况无明显差异;具体而言,与2020年相比,2021年的身高、体质量数据的不准确率有所下降,但脉搏数据的不准确率却有所上升,同时2021年新增握力检查且其中包含较多不准确数据。一致性方面,身高的一致性差距较大,还需要进一步提升。

针对上述数据异常情况,推测其可能与数据采集过程中的操作规范执行不力及责任管理体制不完善有关。从主观原因分析,现场工作人员多为兼职流动人员,对操作规范的理解不够深入,同时缺乏有效的责任管理机制[12]。从客观角度看,采集的信息系统缺乏即时的反馈机制。大型人群队列的人群构成复杂,人工反馈存在延迟,且多为远程分享,难以直观感知错误,缺乏直接且迅速的系统反馈机制以及受试者反馈层面。

3.2""方案及措施

鉴于当前数据管理中存在的问题,建议从以下几个方面进行优化:①完善一体化信息采集系统:构建一个集成的数据采集、审核、反馈、存储和输出系统,实现智能辅助随访功能[13]。该系统应包括数据采集端、审核处理端、存储分析端和数据输出端。数据采集端应面向工作人员和受试者,涵盖基线、常规随访、专科随访等分级功能。数据输出端应提供数据申请和受试者体检报告查看功能。同时,优化智能审核规则,确保及时有效反馈。②加强现场工作人员的管理与考核:在项目启动前,对工作人员进行线下培训,确保他们全面掌握数据采集和审核的相关知识,并在培训后进行实操考核,只有完全掌握的员工才能上岗[14]。建立明确的考核机制,通过奖惩制度激励工作人员,确保数据采集和录入的准确性。实施签名制度,将异常率与绩效挂钩,并对表现优秀者给予奖励。③留存原始文档:对每位受试者的体格资料,无论是纸质还是电子形式,都应妥善保存,以便在发现异常数据时能够迅速复核和核实错误环节。④增加受试者反馈渠道:为熟练使用智能手机的受试者开通线上实时反馈渠道,使他们能够及时上传测量数据,并在发现记录指标与实际值不符时立即纠正。⑤优化检查环境和流程:保持室内环境舒适,如维持适宜的温度和湿度,以减少天气变化对受试者身体和仪器测量的影响。实施分时就诊,避免拥挤和排队,减少干扰。同时,开通线上和线下预约渠道,合理规划每天的受试者数量,确保检查流程的科学性和高效性。⑥细化异常数值处理制度:对审核中发现的异常数据或离群值,首先核对原始数据,然后通过电话联系受试者进行核实。核实后的数据应有记录地进行修改。对无法核实的数据,应记录情况,并在下一次数据收集时再次验证。

通过这些措施,可有效解决现场工作人员流动性大、操作规范理解不足及信息系统缺乏及时反馈机制等问题,从而提升数据的准确性和完整性。

利益冲突:所有作者均声明不存在利益冲突。

[参考文献]

[1] 杨景丽,"黄文雅,"黄佩瑶,"等."中国队列研究建立和发展现状[J]."中国公共卫生,"2019,"35(10):"1393–1399.

[2] 王慧,"陈培战,"张作文,"等."我国人群队列研究的现状、机遇与挑战[J]."中华预防医学杂志,"2014(11):"1016–1021.

[3] 陈兴栋,"蒋艳峰,"徐萍,"等."大型人群队列遗传资源建设与利用[J]."遗传,"2021,"43(10):"980–987.

[4] 郭彧,"余灿清,"吕筠,"等."大型自然人群队列示范研究进展与成果[J]."中华流行病学杂志,"2023,"44(1):"1–6.

[5] 刘晓宇."大数据时代大型人群队列研究新趋势探讨[J]."科技视界,"2022(33):"18–20.

[6] 杜江波,"陆群,"靳光付,"等."人群队列研究的数据管理与质量控制策略[J]."中华预防医学杂志,"2018,"52(10):"1078–1081.

[7] 熊志刚,"周旖旎."分时段体检预约管理系统研究与设计[J]."中国数字医学,"2020,"15(12):"27–29,"97.

[8] World"Health"Organization."WHO"technical"specifications"for"automated"noninvasive"blood"pressure"measuring"devices"with"cuff[EB/OL]."(2020-04-20)"[2024-12-03]."https://www.who.int/publications/i/item/9789240002654.

[9] 中国疾病预防控制中心慢性非传染性疾病预防控制中心."中国慢性病及其危险因素监测报告2010[M].nbsp;北京:"军事医学科学出版社,"2012.

[10] 孙嘉琪,"徐红旗."捏力测量方法及影响因素研究进展[J]."体育科研,"2018,"39(4):"70–76.

[11] 中华预防医学会."大型人群队列研究数据处理技术规范(T/CPMA001-2018)[J]."中华流行病学杂志,"2019,"40(1):"7–11.

[12] 武笑楚,"张天瑶,"邓一平,"等."前瞻性自然人群队列研究中现场流行病学调查组织与落地模式研究进展[J]."现代临床医学,"2022,"48(3):"219–221,"225.

[13] BIAN"Y,"XIANG"Y,"TONG"B,"et"al."Artificial"intelligence-"assisted"system"in"postoperative"follow-up"of"orthopedic"patients:"Exploratory"quantitative"and"qualitative"study[J]."J"Med"Internet"Res,"2020,"22(5):"e16896.

[14] 中华预防医学会."大型人群队列现场调查管理技术规范(T/CPMA001-2019)[J]."中华流行病学杂志,"2019,"40(7):"739–747.

(收稿日期:2024–08–30)

(修回日期:2024–12–09)

猜你喜欢
数据质量体格检查
2022年山西省对口升学考生体格检查表
2021年山西省对口升学考生体格检查表
2019年山西省普通高校专升本考生体格检查表
2018年山西省普通高校专升本考生体格检查表
2017年山西省对口升学考生体格检查表
2017年山西省普通高校专升本考生体格检查表
电子商务平台数据质量控制系统及仿真模型分析
现代情报(2016年11期)2016-12-21 23:41:05
强化统计执法提高数据质量
浅析统计数据质量
中国市场(2016年40期)2016-11-28 04:58:19
金融统计数据质量管理的国际借鉴与中国实践
时代金融(2016年27期)2016-11-25 19:02:25