临床试验数据质量问题与改进措施

2015-03-11 06:54孙瑞华王雨萌杨存霞顾泽龙

中日友好医院学报 2015年4期

黄傲，孙瑞华，王雨萌，李欢，徐凯，杨存霞，顾泽龙

（1.北京中医药大学管理学院，北京100029；2.中日友好医院科研与学科建设部，北京100029）

药物临床试验是指为了评价药物的疗效和安全性，在人体（病人或健康志愿者)进行的药物系统性研究，其结论要通过对整个试验过程中采集到的研究数据加以分析来证实[1]。为了保证结论的真实可靠，完整有效高质量的试验数据是关键。但临床试验数据采集过程繁杂，容易产生错误，通常会在数据分析前由数据管理人员对数据进行核查和清理，并以疑问表（query form)的形式对问题进行解决，直到所有疑问数据都得到核实或修正后，再对数据库进行锁定交由统计人员分析[2]。本文以近期完成的10个多中心、随机、双盲临床试验项目为例，透过疑问表来分析临床试验中常见的数据质量问题，并根据数据管理实际来探讨其来源和产生原因，力求从源头上确保试验数据的完整和准确。

1 对象和方法

本研究回顾审核了某三级甲等医院药品临床研究统计分析中心近期进行的10项多中心、随机、双盲临床试验项目，其共同特点是疑问表发放次数在3轮以上，有完整的疑问表回复记录及逐次修改的数据库，可为充分数据采集及管理各环节的质量问题和产生原因提供依据。

根据该临床试验统计分析中心的疑问表标准操作规范，利用原始数据库按照人口学资料、病史及诊断、生命体征、合并用药、实验室检查、疗效评价数据、时间和日期、符合方案、不良事件10个模块的划分[2]，对疑问的分布进行频数统计，并对疑问数据按书写规范、逻辑异常、缺失值、异常值4种疑问类型进行研究分析[3，4]，探究疑问的主要来源及产生原因。

图1 疑问条目数的模块分布

2 结果分析

2.1 疑问分布

疑问条目数在各模块间的分布情况见图1，可以看出实验室检查数据的疑问数量最多，其次为疗效评价数据，再次为时间和日期数据。人口学资料与病史及诊断2个模块数量较少。这与一份病例报告表的内容构成基本符合，实验室检查、疗效数据每个访视都有涉及，所涵盖的指标多，数据量大，时间和日期数据更可以说是体现在整个试验的各个方面，而人口学资料和病史及诊断数据通常只在基线期采集，在病例报告表（case report form，CRF）中所占份额较少。

从疑问类型看，最突出的为缺失值，占疑问总数48.69%，这与于永培、朱赛楠等在《新药临床试验数据管理常见疑问类型分析》一文所得到的研究结果相一致；其次为逻辑错误，异常值也占有一定的比例，书写规范占比例最小，见图2。

2.2 疑问的主要来源

具体而言，不同类型的疑问在数据管理过程中主要包括如下几种情况：对于书写规范类的疑问，通常来源于建立原始数据库的过程中，包括数据录入人员在录入数据及一致性比对时记录的问题。主要是字迹无法辨识，一空多选及未按要求格式填写等所导致的无法录入。

缺失值的疑问量最大，几乎涉及CRF所有必填项，其中尤以与试验疗效评价、安全性评价相关的核心数据所占比重最大。常见的缺失情况有两种，一种是CRF表上的选择项及填写项，如有无合并用药、有无不良事件、实验室检查指标的判定选择、中止试验的原因选择，患者的主诉数据和需计算的数据，以及需多次测量的时点和精确到分的时间数据；另一种是未查指标，既未标明ND（not done)，也未勾选未查。

逻辑异常分为判断类逻辑异常、计算类逻辑异常、衍生类逻辑异常和日期逻辑异常4类[3]。判断类逻辑主要是指研究者依据正常值范围和临床实际情况对实验值指标的判断是否合理，符合逻辑。这一类疑问较多，如对指标有无临床意义的判断，异常值偏离正常值范围很大，却判断为无临床意义，又无解释等。计算类逻辑包括时间窗的计算、依从性的计算以及疾病改善率、量表评分等一些复合指标的计算。除去计算错误要发疑问外，对于访视超窗和依从性差的情况，由于关系到受试者是否违背方案也要通过发疑问进行一次确认，目的在于确保计算情况结果属实，从而为数据审核会上决定该病例是否应被剔除或是纳入何种分析集提供依据。衍生类逻辑主要是指CRF表中书写结构为“如选（是/否、正常/异常……），请填写”或类似的相互关联的一类数据，这类结构在各个模块均有所体现。常见疑问情况为：“是否合并用药”选择了是，而未填写合并用药列表；实验室检查中，心电图检查或妊娠检查选择了异常，而无异常描述，或选择了正常而有异常描述；“是否完成试验”选择否，而未选择中止原因等。其中较为常见的是，受试者实验室指标疗前正常或异常无临床意义，转化为疗后异常有临床意义，研究者对此既未报不良事件也无明确的解释。日期逻辑主要针对的是不同时点固有的先后顺序，如访视1必然要早于访视2；基线生化检查时间必然要早于首次发药时间；除方案规定的特殊检查如肠镜、核磁共振外，知情同意签署日期必然要早于所有试验相关日期等。

异常值主要有2类，一类是不符合试验方案的异常受试者，这部分比例虽然不大但对数据集的划分影响很大；另一类是试验中所有数值型数据的极端值，如收缩压为10mmHg、身高14m等不符合常识的情况，这类极端值通常都是需要核实的错误数据。

3 讨论

疑问表一方面是要求对试验数据予以确认并给予说明，从而为盲态审核会上数据集的确定提供依据，如访视超窗患者、依从性差的患者、不符合方案要求的患者即为此类情况；而另一个重要方面是对CRF中的缺陷数据记录进行核实完善，从而为下一步的统计分析提供真实可靠的数据。通过分析缺陷数据产生的原因，减少疑问表发放的数量，不仅能减轻研究者、临床协调员和数据管理人员的工作量，而且对于保证有效样本量、提高数据质量也具有重要意义。

3.1 CRF设计不合理

CRF设计对整个研究而言至关重要，良好的CRF设计应尽可能对数据采集点有清晰的定义，数据采集形式应尽可能简便。本研究中最主要疑问类型缺失类疑问，部分就与此有关，如本研究中有项目将时间采集点精确到分，实际上常难以操作；也有项目设计短时间内多次重复测量同一指标，这就要求患者有一定的配合度，降低了可行性。此外，过多的主观指标（如患者主诉数据）也是造成缺失的重要原因。

3.2 研究者对试验方案及SOPs依从性不高、药物临床试验质量管理规范（good clinical practice，GCP）知识掌握不充分

对于研究者而言，年龄、学历、职称、从业年限均非影响试验质量控制的决定因素，一个好的研究者最为主要的是全面的GCP知识，对研究方案的准确理解和严格执行[5]。如临床试验中常见的访视超窗问题，访视窗的计算应以基线访视日期为起点进行计算，而往往由于研究者不熟悉GCP知识，对访视超窗的受试者，以前次访视为起点确定下次访视窗，结果造成之后的访视超窗，以致该病例无法进入全分析数据集，导致有效样本量的缩小。此外，根据GCP的要求，对不良事件的描述，能明确诊断名称应填写医学诊断，而不是罗列症状，如有发热、咽痛、流涕等症状如能诊断为上呼吸道感染应记为上感。当无法明确诊断时，再分别记录每个临床症状[1]，如恶心、呕吐应按2个不良事件进行填写，这是因为不同症状持续时间不同，只有分开记录才能保证不良事件相关数据的真实有效，而这点是容易被研究者忽略的。

3.3 研究者、临床协调员及监查员未尽责

根据GCP的要求，研究者应确保将任何观察与发现均正确而完整地进行记录，对显著偏离或在临床可接受范围以外的数据加以核实，由研究者做必要的说明[1]。CRF的记录一般先由研究者填写原始病历，再由临床协调员负责抄写到CRF表上，对书写规范类疑问中常见的字迹潦草无法辨识、书写格式不合规以及一空多选、漏填所导致的缺失等低级错误，这些多与研究者与临床协调员在记录过程中不认真有关。而日期逻辑异常、笔误造成的异常值等问题，则与监查员未能认真核查或监查力度不够、未能抓住核查要点有关。

3.4 申办方及合同研究组织向数据管理人员提供信息不充分

数据管理人员对原始数据的核查主要基于申办方及合同研究组织提供的原始数据及附带的相关信息，而其中指标的计算方法、研究方案等的版本更新对于数据管理人员所发疑问的有效性显得至关重要。有时不同临床试验中心可能由于设备仪器的不同，实验室指标单位不同，未能按照CRF的单位进行记录，这需事先告知数据管理人员单位转换的公式，否则会造成数据管理工作的延误。

3．5 改进措施

对于上述临床试验中常见的数据质量问题，需要我们根据不同的疑问特点在试验研究的不同阶段加以重视。对于申办方和合同研究组织，主要应做好以下几方面的工作：CRF的设计应安排数据管理人员和统计分析人员的参与，从数据管理的角度保证CRF易于填写兼具逻辑性；重视研究开始前的启动培训，应确保各分中心负责人、研究骨干和科研管理人员参会[6]，帮助他们熟悉试验方案的设计、纳排标准、CRF的记录规范、时间窗的计算等相关的SOPs与GCP知识；重视试验过程中的监查和管理，应安排经过培训后熟悉研究方案且富有GCP知识的临床协调员与监查员，针对上文提到的易错点，结合原始记录进行核查，避免简单疑问的产生，尤其对于CRF不同指标间的逻辑关系要引起重视，确保CRF表前后记录一致且完整准确；在数据管理阶段，应保证向数据管理人员提供的信息及时、有效、完整，以避免无效疑问的发放。

对研究者而言，一方面要严格遵循SOPs和GCP的要求，试验前期严守纳排标准，避免误纳。另一方面，试验过程中可以根据方案要求预先制定好受试者联系一览表，以便提醒受试者返院检查的时间及项目[7]。认真核对受试者服药量，对依从性差的受试者找出原因，并对依从性差和访视超窗的受试者在CRF上备注说明。还需注意的是，实验室生化检查部分产生疑问最多，对于受试者生化指标根据实际情况判定与根据CRF判定标准判定不符的情况，受试者生化指标疗前正常或异常无临床意义转化为疗后异常有临床意义而未报不良事件的情况，一定要给予合理解释，以减少数据管理的工作量。

此外，采集方法的改进可以提高数据质量，根据国外学者的研究，使用电子数据采集（electronic data capture，EDC）系统可以使因数据缺失而发布疑问的百分比为0，与本研究的缺失比例48.69%相比有明显的优势[8]。其强大的逻辑核查功能可以通过录入设限及时避免常见的逻辑错误，有效加强过程监督[9]。应用EDC系统对临床试验数据进行有效的质量控制，将成为今后临床试验的发展方向。

[1] 田少雷，桑国卫.药物临床试验与GCP实用指南[M].第2版.北京：北京大学医学出版社，2010.154-165.

[2] 于永沛，朱赛楠，阎小妍，等.新药临床试验数据管理常见疑问类型分析[J].中国新药杂志，2011，20（11)：1004-1011.

[3] 赵玉婷.临床试验数据管理常见问题类型分析方法的建立[D].复旦大学，2012.

[4] 刘强，王亚锋，常甜甜.中医临床试验病例报告表中的数据记录缺陷分析[J].中国中医药信息杂志，2013，20（2)：4-5.

[5] 张文静.药物临床试验质量控制及相关因素研究[D].山东大学，2011.

[6] 郭建文，李伟峰，黄燕，等.实施大型临床试验和质量控制的方法和体会[J].广州中医药大学学报，2008，25（1)：9-12.

[7] 范彩霞，吴剑秋，寇莹莹，等.RDC Onsite-药物临床试验数据采集系统电子病例报告表常见疑问分析[J].药学与临床研究，2013，21（2)：196-198.

[8] Ivan Pavlovi，TomaKernc，Damijan Miklavi，et al.Comparison of paper-based and electronic data collection process in clinical trials：Costs simulation study[J].Contemporary Clinical Trials，2009，30（4)：300-316.

[9] 李书珍，金香兰，余学杰，等.中医临床研究中电子化数据采集过程的质量控制探讨[J].中国中医急症，2014，23（8)：1416-1417，1420.