秦煜洁 ,王琳浩 ,邓红阳 ,卢梦楠 ,米白冰 ,肖延风 ,周静
(1.西安交通大学第二附属医院小儿内科,陕西西安 710004;2.西安交通大学医学部公共卫生学院流行病与卫生统计学系,陕西西安 710061)
病例对照研究是分析流行病学最基本、最重要的研究类型之一,以确诊患者为病例,以未患该病但具有可比性的个体为对照,通过收集危险因素暴露史和实验室检查结果,比较两组间各因素的暴露比例,推断疾病的危险因素,检验疾病的病因假说[1]。然而,对于病因尚未明确的疾病,在广泛筛选机体内外环境中可疑的危险因素时,调查研究所需的问卷条目多而繁复。若采用传统纸质问卷,需要先设计制作、排版印刷,再由调查员对调查对象逐一询问、收集资料,最后建立数据库、录入数据。数据收集过程费时费力且效率较低。同时,在数据录入过程中,易因人为疏忽产生错误,降低数据质量[2-3]。
近年来,随着互联网技术的快速发展及智能手机的普及,电子数据采集(electronic data capture,EDC)开始越来越多地应用于临床研究中[4]。相较于传统纸质问卷,电子化的问卷收集方式能够节约人员和时间成本,更好地保证数据的真实性,显著提高临床研究的质量,缩短研究周期。REDCap(Research Electronic Data Capture)系统是一个开源性的基于网络的电子数据采集和管理平台,于2004年由范德堡大学Paul Harris教授团队研发[5],截至2022 年3月,已有146个国家、5 838个机构、210万用户使用。该系统具有稳定可靠、安全免费、简单易学等特点,不仅为快速创建和设计项目提供了大量定制化模板,还有大量成熟的共享工具库,供用户选择。表单设计里包含了计算字段、分支逻辑、图片视频文件上传等多种高级功能。当临床研究需要每间隔一段时间对调查对象进行一次数据采集时,比如术后依从性调查、治疗及恢复情况随访、出生队列等,平台也提供了计划进度模块和项目日历等功能。对于多中心研究,平台可通过用户权限设置,保证各中心间数据的保密性。目前,国内外已有许多应用REDCap进行数据采集和管理的临床研究[6-7]。国内亦有相关研究介绍搭建配置REDCap系统及利用该系统进行数据录入和管理等内容[8-10],而对于基于REDCap系统如何实施临床研究,仍缺乏相关文献报道。
近年来,性早熟发病率逐年上升[11],其发病可能与膳食、健康相关行为和生活环境暴露等危险因素有关[12-13]。采用纸质问卷与食物谱图相结合的传统方式对性早熟女童进行膳食营养评估,并调查多种环境干扰物日常生活的接触频率及其他相关问题,将花费临床医生与患儿家属较多时间,不利于临床诊疗工作的开展,降低临床研究效率。而采用REDCap 系统进行信息采集,患儿家属可通过智能手机等电子设备直观看到问题条目及电子化的食物分量图例,临床医生也不必一对一询问家长,极大地减轻了临床研究工作压力。本研究以基于REDCap系统进行的性早熟病例对照研究为范例,介绍该在线临床研究数据采集及管理平台的实际应用,以期为临床研究的数据采集及管理提供新的思路。
性早熟病例对照研究项目是由西安交通大学第二附属医院儿科开展,旨在探索健康相关行为和生活环境暴露等导致女童性早熟的可能危险因素。该项目从2021年6月启动,9月完成调查评估内容设计,10月开始搭建电子数据采集平台,11月完成测试并投入使用。该研究以期为预防性早熟的发生提供理论依据,为探索性早熟的发病机制提供思路。
项目设计严格遵循《赫尔辛基宣言》,已获得西安交通大学医学部伦理委员会审核批准。调查开始前,将研究目的、研究内容、实施方法、需要遵循的要求及获益等,详细告知参与者及其主要照顾者,在其完全知情的前提下,自愿参加,并签署电子知情同意书。
收集数据主要包括儿童及其家庭社会人口学资料、围生期情况、儿童休息与活动情况、儿童膳食情况、儿童环境内分泌干扰物暴露情况、儿童主要照顾者焦虑程度、儿童体格检查及辅助检查结果。
本研究项目基于西安交通大学开放研究数据平台(www.wcrcnet.cn/redcap/)上运行的汉化版REDCap系统,构建性早熟病例对照研究数据收集工具,项目整体设计流程图见图1。
图1 应用REDCap构建性早熟病例对照研究数据采集及管理平台项目的设计流程图Fig.1 Flowchart of the case-control research project of precocious puberty design based on the clinical research electronic data capture system (REDCap)
1.2.1 创建REDCap账号 首先,在西安交通大学开放研究数据平台上申请注册账号,账号激活后登陆REDCap系统,点击“新项目”,创建一个新的项目,自定义项目标题为《性早熟病例对照研究》。
1.2.2 运用REDCap设计项目表单及内容 在“项目页面和项目设计”模块下选择“项目设置”,依次定义:①“主要的项目设置”-启用“在这个项目中使用问卷调查?”和“使用定义事件的纵向数据收集?”;②“设计数据采集工具并启用调查”-“在线设计器”,进入数据采集工具定制页面,开始设计表单。点击“添加字段”或“添加字段矩阵”,开始设计具体字段或字段矩阵。字段类型包括文本框、单选、多选、是非、计算字段、滑块、签名和描述性文本(图片、音频、视频、文件附件),网页具体页面如图2所示。在计算字段中编辑计算公式,则可根据之前问题的结果自动生成变量值。如需收集的数据为日期或时间,则在“验证?”处选择“Date(Y-M-D)”或“Time(H H∶MM)”,即可在收集数据时通过拖动条块来选择具体的日期或时间。对于必须要填写的字段则在“必需的?”处选择“是”,在收集数据时若不填写该字段则无法保存提交。对于姓名、地址、身份证号等涉及被调查者隐私的信息,可在“标识符?”处选择“是”,则在导出数据或共享数据时不会被导出或共享。对于在特定情况下需要隐藏的问题,可通过定义分支逻辑,当设定条件满足时,该问题才会显示。③“启用可选模块并定制”-启用“自动记录编号”和“进度计划模块 (只允许纵向项目)”。
图2 运用REDCap设计项目表单的“添加字段”设计页面Fig.2 “Add field”page of the project list of REDCap
性早熟病例对照研究数据采集及管理平台的内容包括知情同意书、基本情况、社会人口学资料、围生期情况、休息与活动情况、膳食情况、环境内分泌干扰物暴露情况、照顾者焦虑程度、体格检查及辅助检查。休息与活动情况问卷的制定参考国内外相关量表[14-16];膳食情况评估采用半定量食物频率问卷,共包含119种食物,同时配有食物份量图例,供被调查对象参考;环境内分泌干扰物暴露情况表单内容由研究人员根据国内外相关文献制定[13,17];照顾者焦虑程度评估采用焦虑自评量表。以上部分均由入组儿童的主要照顾者通过扫描调查系统生成的二维码,在线完成填写。若调查参与者对电子设备的使用或问题的填写有疑问,可咨询研究人员指导完成。体格检查和辅助检查部分由研究者根据实际检查结果,录入数据。
1.2.3 建立项目工作组及质量控制 根据分工与需求的不同,对本研究项目中的数据采集及管理人员设置不同的权限。在主页面左侧 “应用程序”模块中的“用户权限”里,即可添加项目相关人员并设定其访问权限。包括项目设计、数据质量创建及编辑规则、调查分发、数据访问、记录删除、统计图表、数据导出、数据导入、数据比较等多种权限,且所有权限均可随着人员职责的变更而更改。在主页面左侧 “应用程序”模块中的“数据访问组”里,可将所有人员分组,组内用户创建的记录只能被特定的数据访问组访问,以便开展多中心研究。
同时,在主页面左侧“应用程序”模块中的“数据质量”中,可制定数据质量规则。平台预定义的规则包括缺失值、字段验证错误(数据类型错误和超出范围)、数字字段异常值等。研究者亦可根据自己的需求创建编辑新的数据质量控制规则,从而实现对实际收集到的数据与制定规则间的差异检查。
而在主页面左侧“数据收集”模块中的“记录状态进度统计表”中,研究人员每天登录项目平台,查看所收集到的记录每个表单的完成状态(图3),可简捷直观地掌握数据采集的进度状态,督促未完成调查或数据填写有问题的相应入组者的主要照顾者进行补充或修改相关数据,从而提高数据采集的质量。
图3 性早熟病例对照研究数据REDCap项目平台“数据收集”模块中的“记录状态进度统计表”Fig.3 Record status and progress statistics of REDCap system of the case-control research project of precocious puberty
绿色标识表示该表单已完成,黄色标识表示该表单部分完成,而红色或灰色标识表示该表单未完成(无数据保存)。
1.2.4 测试 在项目平台搭建完成后,由项目成员对电子签名、项目内表单内容、逻辑跳转、图片显示、数据导入和导出等功能进行测试,修改所发现的问题。再寻找8~10名不同年龄和文化程度的项目无关人员进行填写,根据反馈进一步完善项目平台。
上述操作完成后,即可将项目由“开发状态”转到“生产状态”,投入使用。当数据采集完成后,则可导出不同格式的数据分析与共享。
“性早熟病例对照研究”数据采集及管理平台搭建完成、测试、投入生产后,即可在主页面左侧“数据收集”模块下点击“调查分发工具”,生成调查链接或二维码。调查参与者可通过点击链接或扫描二维码,进入调查页面,根据提示依次完成知情同意书、基本情况、社会人口学资料、围生期情况、休息与活动情况、饮食情况、主食摄入情况、肉蛋奶类摄入情况、蔬菜摄入情况、水果类摄入情况、坚果零食类摄入情况、环境内分泌干扰物暴露情况、照顾者焦虑程度共13部分的表单填写。
如参与者中途中断表单填写,研究人员可在“记录状态进度统计表”中看到该参与者进度停止处出现黄色标识,点击标识后,在“调查选项”中点击“调查访问代码+二维码”,将二维码发送给该参与者,即可从进度停止处继续填写表单。研究者定期核查后台数据,当发现逻辑错误或不符合实际标准的数据,则及时联系参与者核实修改。参与者自填的表单全部完成,经核查无误后,研究者则录入相应的体格检查和辅助检查数据。
截至2022年6月,共有323名5~9岁女童纳入研究,并按照研究设计完成各项表单的填写及体格检查。所有记录经跟进后,共317名女童家长完整填写13项表单,数据填写完整率为98.14%。已纳入研究对象的基本情况如表1所示。项目运行稳定,无系统崩溃及数据遗失情况出现。
表1 所建立性早熟病例对照研究REDCap平台数据库中323名女童的基本情况Tab.1 Characteristics of 323 girls in the REDCap system of the case-control research project of precocious puberty
目前,国内用于临床研究领域的数据采集工具主要有纸质问卷和定制的电子数据采集系统。纸质问卷虽然简单方便,但在进行数据采集时存在诸多问题。在样本量较大或问卷内容过多时,纸质问卷时在数据收集和数据录入过程都需要耗费较大的人力、物力、财力。更为重要的是,填写问卷的过程中容易出现错填、漏填等情况,数据录入的过程亦可因录入人员的人为原因造成录入错误,降低数据质量。定制的电子数据采集系统通常花费较高,需要有专业团队设计、搭建、维护,不适用于各个临床科室开展的不同类型的小型临床研究。
传统的数据录入和管理工具主要有Excel电子表单、Epidata数据库、Access数据库等。应用Excel软件是目前临床研究人员使用最多的数据录入工具,但对于随访数据,特别是多次重复测量数据,单个表单较难实现数据录入和管理。Epidata数据库为医学研究人员使用最普遍的数据库,该数据库录入界面简便直观,可设置质控规则,降低录入过程中的错误。但其需要安装相应的软件包,且为开放的数据文件,对所做的修改均不能保留痕迹。
相比之下,REDCap兼具数据采集和录入管理功能,简单易学,界面友好。与传统的单机软件相比,REDCap是一款开放、免费、安全的在线数据采集系统。可支持多中心研究,通过用户权限的限定,保证了各中心间数据的私密性。对于临床流行病学研究来说,电子化的数据采集系统,明显减少了人力、物力、财力的支出。英国的一项研究对以纸张、手提电脑、短信等方式进行问卷调查和在移动设备上应用REDCap系统进行了比较,发现电子应用程序完成调查问卷所花的时间更短,数据准确性和完整性更好,受访者的可接受性更高[2]。另一项研究比较了234名人员分别在纸质问卷和REDCap上问卷的填写情况,最终结果表明,与纸张调查相比,在REDCap上填写电子化问卷具有更强的可靠性[3]。对于更为复杂的研究设计,如队列研究或随访研究,REDCap系统内置的纵向数据采集工具可轻松实现各个表单的重复数据收集。与此同时,REDCap系统自带的随机化模块可实现随机临床试验。
本研究主要介绍了基于REDCap系统搭建性早熟病例对照研究数据采集及管理平台,申请注册账号,创建研究项目,根据研究内容逐一设计表单,按研究人员的职责分配用户权限,制定并执行严格的数据质量控制规则,经多轮测试后投入使用。目前本研究仅在REDCap系统上进行性早熟横断面研究,然而,无论是中枢性性早熟女童还是部分性性早熟女童,均需间隔3个月监测其性激素水平、子宫卵巢大小及卵泡数目变化,每间隔6个月需监测1次骨龄进展,这可在后续进一步深入研究。通过REDCap进行纵向随访,将3个月或6个月作为随访时间节点,重复完成休息与活动情况、膳食及环境内分泌干扰物暴露调查,比较其生活方式的改变与血清学指标、子宫卵巢大小及卵泡数目变化、骨龄进展的相关性,从而探寻健康生活方式和药物同时干预与单一药物干预对控制性发育的疗效差异。
在REDCap系统上搭建数据采集及管理平台,进行基于网络的在线数据采集和录入管理,为性早熟病例对照研究的开展提供了技术支撑,提高了研究效率,极大地缩短了研究周期。基于REDCap系统进行电子化数据采集与管理,应在临床研究和流行病学调查中推广应用,以提高研究效率。