REDCap 在母婴干预队列数据采集及管理中的应用

2020-11-06 03:03欧阳凤秀热伊莱塔伊尔范翩翩王伟业
关键词:队列数据管理母婴

欧阳凤秀,热伊莱·塔伊尔,陈 磊,范翩翩,张 军,王伟业

1. 上海交通大学医学院附属新华医院环境与儿童健康教育部和上海市重点实验室,上海200092;2. 上海交通大学医学院附属国际和平妇幼 保健院信息科,上海200030

出生队列及母婴干预队列是探索疾病生命早期影响因素及早期干预措施的重要流行病学研究方法,是目前国际上的前沿研究领域。越来越多的成年期疾病被发现存在胎儿起源,出生队列研究往往从胎儿期甚至母亲受孕前开始,随访至出生后乃至成年;收集妊娠前/妊娠期因素,定期随访儿童生长发育、健康及疾病相关医学数据,前瞻性研究成年期疾病早期病因、发展、转归及干预措施,可提供前因后果推断证据。然而,由于出生队列研究的复杂性,对数据采集系统和数据管理平台要求较高,有其独 特性。

出生队列数据采集往往随访节点多,需要对孕妇及其子代进行随访和重复多次数据采集,时间跨度往往较长。母婴干预队列与观察性队列研究类似,但需要(随机)区组和干预。因此,研究方案和数据库结构复杂。如何高效地收集数据、生成数据库及规范化数据管理是决定队列研究质量和成败的关键之一。

电子数据采集(electronic data capture,EDC)系统是一种收集和管理临床试验数据的软件应用系统。临床研究的电子化已成为大势所趋。相比于传统纸质问卷,EDC在数据录入和管理方面具有优势,可同步收集多调查地点、多中心数据,减少后期数据处理的工作量,提高研究效率。但国际商业化EDC 系统由于语言和价格的原因,目前多用于药物临床试验项目,在科研项目中的应用受到限制。规范化的数据平台的构建是我国临床研究急需解决的普遍瓶颈问题。

REDCap (Research Electronic Data Capture) 系 统 是一个安全可靠的基于网络的EDC 在线数据采集系统。REDCap 在2004 年由美国范德堡大学研发,是一种开源性软件,对学术和非营利机构免费开放。REDCap 系统可供多用户、多地点同时在线数据输入及访问, 具有自动验证、计算字段、分支/跳转逻辑的高级功能,有权限管理和稽查留痕,数据可直接导出到常用统计软件数据格式,能够快速安装和使用,简单易学。凭借强大的数据管理能力,REDCap 系统已越来越多地用于国外临床研究项目[1-3], 体现出良好的稳定性和兼容性。国内有关REDCap 应用的文献不多,如何在临床研究中实际运用REDCap 的介绍及论文较为缺乏。

本研究采用REDCap 电子数据采集系统,以多中心母婴干预队列为示范实例,介绍REDCap 系统的搭建及其在母婴干预队列数据平台建设和数据管理中的应用。

1 资料与方法

1.1 REDCap 软件的申请、获取和安装

1.1.1 REDCap 系统软件的申请和获取 以机构身份(如新华医院或国际和平妇幼保健院)从REDCap 官方网站(http://project -REDCap.org/)下载并填写协议 “Electronic End-User License Agreement”,审核通过后,免费获取和下载REDCap 软件。

1.1.2 本地基本环境配置 REDCap 软件安装前,进行本地基本环境配置: 安装Apache,以作为Web 服务器为REDCap 提供访问点;安装PHP,REDCap 后台采用PHP语言实现; 安装MySQL 以支持REDCap 数据库的建立。安装REDCap 对服务器的配置没有硬性要求,一般认为磁盘内存最好大于100 GB。采用的服务器配置为双CPU,32 GB 内存,6*1.8 TB 硬盘容量。

1.1.3 REDCap 的安装 将下载的REDCap 源码包解压至Apache 的Web 服务器网页根目录下,将数据库相关信息填入REDCap 根目录下的database.php 中。通过浏览器访问REDCap 的安装脚本进行安装。安装过程中填写和生成一系列SQL 命令,将所有SQL 命令复制,连接到MySQL 之后执行,以创建REDCap 基本表单。SQL 命令执行完后即可通过浏览器访问和使用REDCap。

1.2 基于母婴干预队列创建REDCap 示范项目

REDCap 安装完成后,通过网络浏览器访问登录REDCap,可通过“创建新项目”选项,在REDCap 系统下创建项目“生命树”。依托在研的“中加合作——生命早期预防儿童肥胖的综合干预队列研究”(简称“生命树”项目)建立“生命树”示范性项目。该母婴干预队列项目在上海开展,是以社区为基础的一项多中心整群随机对照临床试验,探讨生命早期综合干预对预防儿童肥胖的效果,从孕前期、孕期、围生期直至婴幼儿阶段全程进行连续干预,促进健康行为,降低儿童肥胖的发病率。该项目在上海4 个区的4 家研究医院及4 个区辖区内36 家社区卫生中心进行,建设3 200 个家庭的队列,时间跨度为孕前期、孕期、产后,并随访儿童。其中孕前期、孕期及分娩的招募和随访研究在研究医院进行;分娩后,婴幼儿及儿童数据采集则主要在社区卫生服务中心由数据采集员完成。项目以问卷为基础进行流行病学调查及数据采集,不同时点需在相应的调查地点开展。

1.3 数据库设计、创建和功能测试

1.3.1 数据库设计及病例报告表单/问卷的创建 在REDCap 生成“生命树”项目后,基于项目研究设计和方案,将队列研究在孕前期、孕期、分娩、婴儿数据收集的时点和各点需调查的问卷模块列成随访图(visit map);以此为框架,设置和创建电子病历报告表单 (electronic case report form,eCRF)。CRF 是收集数据的工具,内容包括社会经济状况、健康行为习惯等模块,根据研究方案设计和决定问卷及病史摘抄拟收集的数据,用于采集研究项目需要的研究对象信息和数据,以及用于项目管理和调查研究对象依从性的支持数据。各期CRF 设计一经定稿,则在REDCap 中编写成eCRF,建立eCRF 数据录入界面。字段数量技术上没有限制,但实际运用中,以每份表格不超过1 000 个变量为宜。

1.3.2 eCRF 数据输入的实时校验功能和质控程序 建立eCRF 表单时,通过REDCap 软件添加相应的数据逻辑核查代码,限制数据的格式及类型,对日期和数值型变量设定合理范围,允许数据验证。预定义质量控制规则,以确定特定数据值是否异常。

1.3.3 测试 项目设置完成后,进行阶段性测试,通过录入数据测试各项功能,例如数据的录入、保存、修改及修改痕迹,逻辑设计,用户权限,电子签名,数据导入与导出,导出数据的分析等。项目设计通过测试阶段后,转入正式录入模式。

1.4 用户权限管理

为项目各级数据采集及管理人员创建并配置不同权限的账号。通过“项目设置”选项卡访问“用户权限”工具(REDCap 界面左上角菜单部分),管理和分配用户权限,控制用户对项目的访问。不同的用户具有不同的访问与操作权限。REDCap 系统允许在线添加及删减用户权限,最大限度保证系统安全。

2 结果

2.1 母婴干预队列数据系统及eCRF 的构建及使用

在REDCap 建立示范项目——“生命树”项目,设置了“招募初筛表” “知情同意签字确认” 及生成研究对象编号的功能。完成设计和创建妇女孕前/孕早、孕中、孕晚期,分娩及儿童随访总计13 套eCRF,用于数据的采集(图1)。数据采集员登录REDCap,点击“我的项目”,选择项目“生命树”,点击产生新记录,填写“招募初筛表”“知情同意签字确认”,产生新的研究对象编号(图1)。 查看记录状态进度统计表(图2),在显示的研究对象序号及编号中,选择并进入对象主页。截至2020 年4 月,该示范项目筛查2 352 人,纳入1 796 人,参与者定期随访,完成各期数据采集,项目招募和随访仍在进行之中。

图1 REDCap 示范项目中研究对象主页的各期问卷及调查模块Fig 1 Questionnaires and investigation modules on the home page of each study participant in the REDCap example project

图2 REDCap 示范项目中研究对象记录状态进度统计表Fig 2 Record status dashboard of study participants in the REDCap example project

eCRF 的数据输入界面,可从第一个模块(如社会经济状况)开始,逐一完成每部分填写直至完成(图3)。“生命树”项目的孕前期CRF 包括875 个字段,孕早期CRF 包括890 个字段。

图3 问卷内容及数据录入页面Fig 3 Questionnaire content/data collection page

鉴于各招募中心/研究医院在“生命树”项目正式开展前,先进行小样本预试验,数据管理中心为预试验也生成一个单独的REDCap“生命树预试验”项目。2018 年10 月,REDCap 平台“生命树项目预试验”eCRF 英文版上线使用;2019 年1 月“预试验” REDCap eCRF 中文版上线使用;2019 年2 月REDCap“生命树”项目上线使用;由数据工作组人员将纸质版调查问卷输入REDCap 系统。2019 年6 月,经充分前期准备与培训,REDCap 在线数据平台正式开放给现场调查员使用,直接远程录入并保存数据于该项目的中心服务器数据库。

2.2 多中心调查和数据采集

通过用户权限的管理,REDCap“生命树”项目可在多家研究医院和社区卫生服务中心的终端电脑通过浏览器在线数据访问、数据录入及上传。为保证数据录入准确,REDCap 每次只允许录入一个研究对象的数据,但一般不会影响速度。REDCap 系统针对研究项目的不同阶段允许具有相关权限的人员登录系统进行数据的查看、录入、更改、维护等工作,确保研究数据的安全性和保密性。REDCap 应用程序可在任何上网的电脑、智能手机和平板电脑上登录项目网页、录入数据及查看项目。

作为大型的多中心研究,各中心产生大量数据。这些数据传送到数据管理中心进行统一管理,包括查询、核对、储存及备份。示范项目的数据保存在中心服务器,但也可租赁云主机/云服务器保存和备份数据。

2.3 REDCap 系统用户权限的配置和管理

“生命树”项目数据管理中心为项目组研究人员创建REDCap 账号并配置不同的权限,给数据管理员和现场调查员开放不同的访问与处理数据的权限;并根据现场调查人员(数据采集人员)负责的任务,开放相应的权限。项目的研究医院负责孕期调查与随访,数据协调员只能查看和操作这一时期的CRF;而社区卫生服务中心负责产后儿童随访的调查员,只能访问和操作儿童期CRF。分中心用户只能操作和浏览本中心研究对象的记录,而牵头单位可以操作和浏览所有研究对象的记录。研究人员可以通过2种方式访问REDCap 项目数据库:只读访问和查看/编辑访问。避免越权误操作而致数据库结构改变或数据损失,保证了各时期数据及每个分中心数据的安全。实现了数据中心多中心研究的数据管理。

2.4 数据质量控制

“生命树”项目eCRF 表单设置了字段实时校验功能,限制了数据录入格式/类型、设置日期和数字字段的范围及数据验证、数据一致性模块。REDCap“生命树”项目eCRF 数据录入界面根据设置好的条件对该数据给出提示,对超出设置范围数据的异常值、数字型数据填入其他格式或必填项缺失数据,会提醒录入者核实,从技术上保证数据录入准确;并在字段间做逻辑关系,避免无效数据的 输入。

根据定义的“生命树”项目数据质控规则,编入了REDCap 质控程序。由项目负责人指定的项目数据管理中心对录入的数据定期执行质控程序(图4、5),在REDCap 中生成查询和发送数据疑问。点击“解决问题”中的“注释”,即可打开查询,发送数据疑问给指定数据采集员去解决/应答此查询,直至解决查询并由数据管理员关闭此查询。通过REDCap 生成和关闭查询,对数据进行数据质量控制,保证项目数据的准确性和一致性。目前,数据中心发送的数据疑问都得到了现场数据协调和采集员的应答。

REDCap 系统会以绿色标识显示表格填写完整,黄色标识显示数据未经过数据管理人员验证,红色表示表格填写不完整,方便项目管理人员寻找和查看。

REDCap 具有稽查留痕功能,记录所有操作过程。系统自动保留对数据的更改痕迹,并储存在数据库中,包含修改数据的用户、修改时间及修改目的等,从而保证数据的完整性及真实性。

图4 REDCap 示范项目的项目主页和数据质量选项Fig 4 Data quality control of REDCap example project

图5 数据质量规则列表及质控程序执行页面Fig 5 List of data quality control rules and execution page for quality control procedure

2.5 项目报表的生成和数据库导出

REDCap 具有多种方式过滤报告,例如按照某一信息升序或降序排列,也可使用逻辑算符挑选和生成满足某一条件的研究对象列表。完成后,单击保存报告按钮。报告建立好后会出现在左侧的工具栏,用户可以轻松查看报告或导出报告,可实时查看项目招募情况。REDCap 数据可导出到多种常用统计软件的数据库格式,包括SAS、Excel、STATA、R、SPSS 等,供数据共享和统计分析。

3 讨论

本研究采用REDcap 软件,以母婴干预队列为示范构建了多中心母婴队列研究的数据采集和数据管理系统。在安装与建立REDCap 系统后,创建研究项目,构建各孕期及儿童期调查和随访eCRF,配置各合作中心多个调查点数据采集员及数据管理员的不同权限,收集项目所需的数据,并进行数据质量控制。REDCap 数据可导出生成SAS、SPSS、R 等多种格式的数据文件供常用统计软件使用。数据管理团队建立的REDCap 数据采集和数据管理系统,为母婴干预队列提供有力支撑。本示范平台可推广应用于其他流行病学研究以及临床随机对照试验,使科研数据更好地标准化,促进多中心临床研究的协作和数据共享。

本次REDCap 示范项目数据平台的优点和特征:REDCap 各期随访和问卷模块的构建和排列方式巧妙,各期问卷及模块条块结构清晰,化烦琐为简单,可供其他研究借鉴。由于出生队列和母婴干预队列的研究设计复杂,各期问卷较多,数据库较一般的临床试验复杂得多。

由于REDCap 数据平台的运用及数据的电子化,研究人员可及时、全面掌握在研项目多中心招募和随访的进展及状态,及时发现问题并予以纠正,解决了以往困顿于纸质版数据录入滞后的问题。在数据采集、管理和质量控制上,由于REDCap 在eCRF 加入了实时逻辑核查,调查员面对面调查研究对象、采集和录入数据时,发现可疑数据可当场及时核实确认,提高效率,从源头上控制数据质量;在数据疑问查询阶段,REDCap 网络在线的应用系统,使数据中心的数据管理人员与项目多中心的数据采集/协调人员的远程沟通更为便捷,数据清理可直接在电子数据库进行,提高数据清理的效率,提高研究效率。

由于REDCap 系统具有数据安全、可免费使用、可多用户多地点同时输入及访问、数据可直接导出到常用统计软件的优点,目前已广泛用于各种类型的研究[1]。REDCap 系统能够快速安装和使用,简单易学[4]。REDCap系统也逐渐被国内研究项目所采用,但研究项目规模往往有限[5-8]。国外不少研究机构或大学申请REDCap 账号后,由计算机专业人员建立平台,供本机构的项目使用。有研究[9]分析了REDCap 用于巴西出生队列研究的优缺点。

本项目采用REDCap 建立数据采集系统,进行在线数据收集和数据质量控制,为母婴干预队列的数据平台和管理提供了有力支撑。这一流程和方法可推广运用于其他流行病学人群研究,有助于提高研究效率和保证数据质量。

参·考·文·献

[1] Witsell DL, Schulz KA, Moore K, et al. Implementation and testing of research infrastructure for practice-based research in hearing and communication disorders[J]. Otolaryngol Head Neck Surg, 2011,145(4): 565-571.

[2] Lavigne J, Sharr C, Ozonoff A, et al. National down syndrome patient database: insights from the development of a multi-center registry study[J]. Am J Med Genet A, 2015,167A(11): 2520-2526.

[3] Morinville VD, Lowe ME, Ahuja M, et al. Design and implementation of INSPPIRE[J]. J Pediatr Gastroenterol Nutr, 2014, 59(3): 360-364.

[4] Klipin M, Mare I, Hazelhurst S, et al. The process of installing REDCap, a web based database supporting biomedical research: the first year[J]. Appl Clin Inform, 2014, 5(4): 916-929.

[5] Pang XQ, Kozlowski N, Wu SL, et al. Construction and management of ARDS/sepsis registry with REDCap[J]. J Thorac Dis, 2014, 6(9): 1293-1299.

[6] Ren RR, Sun G, Yang YS, et al. Chinese physicians' perceptions of fecal microbiota transplantation[J]. World J Gastroenterol, 2016, 22(19): 4757-4765.

[7] 侯倩, 江真, 刘卿, 等. REDCap 数据库在嗓音外科临床研究中的初步应用[J]. 中国耳鼻咽喉颅底外科杂志,2017, 23(4): 338-341.

[8] 邹炼, 胡金有, 刘湘乡,等. REDCap 软件在放疗质控中的应用[J]. 中国医疗器械杂志, 2017, 41 (4): 248-250.

[9] Blumenberg C, Barros AJ. Electronic data collection in epidemiological research. The use of REDCap in the Pelotas birth cohorts[J]. Appl Clin Inform, 2016, 7(3): 672-681.

猜你喜欢
队列数据管理母婴
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
队列队形体育教案
队列里的小秘密
基于多队列切换的SDN拥塞控制*
在队列里
东方幸福 国际母婴月子会所 高端顾客的专享服务平台
喜忧参半的母婴产品“海淘热”
数据挖掘在学生成绩数据管理中的应用研究