李真 郭娜
(北京协和医院 1.外科;2.护理部 北京 100730)
护士是医疗卫生系统中占比最高的群体[1]。在各类执业环境中,护士均面临着多种职业损伤等风险因素。对护士健康状况的监测和干预是近年来研究关注的热点[2-3]。队列研究是应用较为广泛的流行病学研究方法,通过对人群进行随访和纵向观察,评估暴露和终点的关系,可揭示病因、评价预防效果、揭示疾病的自然史、掌握人口健康状况、引导实验设计,将知识转化为临床和人群早期诊断和干预策略,从而提高疾病的防治水平,降低社会卫生负担[4-6]。国外最早的关注护士群体的队列研究是由美国学者于1976年发起的护士健康研究(nurses' health study,NHS)[7],NHS是国际著名大型队列研究之一,现在已经进入第3代,入组总人数超过27万人。该队列研究的系列成果在明确护士健康风险因素以及提出公共健康政策建议等方面发挥了重要作用[7-9]。本文旨在介绍NHS的设计理念、实施方案和发展方向等内容,并总结相关的经验及启示,以期为国内护理领域队列研究设计与实施提供参考。
20世纪60年代初,口服避孕药上市后的相关不良反应受到学者的广泛关注。1976年,哈佛大学公共卫生学院Frank Speizer[10]在美国国家卫生研究院(National Institutes of Health,NIH)的支持下,从美国人口最多的11个州中招募护士建立起NHS原始队列(NHSⅠ)。随着时间的推移,新一代女性呈现出不同的人群特点,Walter Willett等于1989年建立第2代护士健康研究(NHS II)[11]。旨在研究比原始队列更年轻的人群中口服避孕药、饮食和生活方式等风险因素的长期影响。2010年,Bao等[11]发起了第3代护士健康研究(NHS Ⅲ),纳入了不同种族背景的护士。目前,NHS已经发表了 1 200 多篇关于吸烟、身体活动、肥胖、激素治疗、内源性激素、饮食因素和许多疾病的关联的研究文章[12],研究成果对公众、卫生从业人员、卫生政策制定者等不同群体均产生了较大的影响。
美国NHS采用经典的前瞻性队列研究设计方法,通过招募护士建立起队列,并定期进行随访,收集队列人群的暴露因素和健康相关结局等动态信息,进而为明确暴露和结局之间的关联提供支持。
2.1基线招募途径与方法 (1)NHSⅠ通过邮寄信件的方式招募30~55岁已婚注册护士。1972年,研究团队在得到11个州护理委员会的批准后,从美国护士协会获得符合标准的护士信息,然后进行3次邮寄基线调查问卷。如果受访护士对基线调查问卷做出回应,即可加入队列。队列纳入的样本量为121 700人,入组护士接受2年1次的追踪随访。(2)NHS Ⅱ的样本人群来自美国14个州的25~42岁女性,1989年,调查人员联系到能够提供性别、出生日期或年龄信息的州护理委员会,招募策略同样是邮寄信件,不同的是只邮寄1次信件,收到邮件后完成问卷调查的护士即被纳入队列,以确保招募到最有可能在整个研究过程中持续参与的护士。最终共有116 430名护士纳入队列中。(3)NHS Ⅲ是第1个完全基于网络的NHS,样本人群为19~49岁女性,招募范围在前2代的基础上进一步扩大,不仅包括注册护士,还包括持照操作护士 (licensed practical nurse,LPN) 和持照职业护士(licensed vocational nurse ,LVN)。此外,还纳入了加拿大受试者以及男护士群体。受访者每6个月完成1次基于网络的问卷调查。NHS目标的招募样本量是10万人,截止2021年12月31日,队列招募的报名仍然开放。
2.2数据采集内容及工具 NHS基于问卷进行数据收集,研究人员开发并应用了一系列评估各种因素的测量工具。研究涉及的变量类别较为广泛[11],包括多种传统风险因素(人口学资料、饮食、生活方式等)的重复测量,这些数据可以通过结合生化和遗传数据,为病因学和转化研究提供强有力的支撑。护士健康队列研究测量变量列表包括:工作状态,轮班工作、吸烟暴露状况、癌症、心脏病等或其他疾病的家族史、生活方式、生育史与更年期、邻居特征、处方药及非处方药物、环境暴露、癌症和其他筛查结果、精神健康、休闲时间体力活动,久坐时间、社交网络等。
2.2.1饮食状况 饮食与疾病关系的流行病学研究中,饮食评估最常依赖于自我报告的定量食物频率问卷,其目的是评估长期饮食摄入量。由于饮食包括多种相互作用的成分,并且随着时间的推移不断变化,使得在大型人群中进行饮食定量测量极具挑战性。NHS研究人员开发了半定量食物频率问卷(semi-quantitative food frequency questionnaires,SFFQ) 进行饮食评估。问卷包含有关食物通常份量的信息(例如,询问“一杯牛奶”而不是“牛奶”)。从1980年开始,NHS每2~4年将1份经过验证的SFFQ纳入调查问卷集中。SFFQ也从1984年的61项扩展到116项,1991年扩展到131项。研究团队中还纳入了营养师,其职责是维护SFFQ中食品营养成分的完整准确数据库,更新随时间变化的食物营养成分,并研究新产品或重新配方产品的营养成分。考虑到SFFQ 容易受到随机和系统误差的影响,研究者先后开展多个子研究,以便于将问卷测量的有效性与其他客观评估方法(如多周称重饮食记录、营养生物标志物)的有效性进行比较,以提高饮食与疾病关联结果的有效性[13]。SFFQ的有效性已经过广泛评估[11],其低成本、易于理解填写和有效性较高等特点,使其成为全球流行病学家工具包中的标准工具。
2.2.2体力活动状况 NHS使用Paffenbarger 体力活动问卷修订版对随访对象的身体活动状况进行测量。参与者报告过去一年中进行特定活动(例如慢跑)每周平均花费的时间,这些特定活动代表对总体活动状况最重要的贡献者。为确保测量结果的真实可靠,研究人员同样开展了一系列研究对活动量表进行了验证[11]。
2.2.3结局信息 获取准确的结局信息是流行性学研究进行关联分析和因果推断的重要前提。NHS参与者每2年在调查问卷中报告1次新诊断的疾病。当随访对象有新的疾病报告时,研究者均向随访对象申请获得审查医疗记录和收集病理标本的许可。获得许可后,研究团队向医院发送邮件,并由对问卷数据设盲的医生审查所有医疗记录,以确认随访对象自我报告的疾病信息是否准确。研究人员还系统地检索了国家死亡指数和国家肿瘤登记处数据,获取所有列出的死亡原因,一定程度上减少了获得死亡证明的需要。此外,结局测量问卷中还纳入了生活质量量表、乐观量表等患者主观报告结局信息,有助于对研究对象的主观健康和幸福感进行深入研究[15]。
2.2.4生物样本 NHS原始队列和NHS Ⅱ中采集了丰富的生物标本资源,包括血液、尿液、脚趾甲、口腔细胞、粪便和唾液等。参与者将相应的标本邮寄至项目组的中心实验室进行处理和分析[16]。NHS所重复采集的生物样本大大拓宽了生理指标与疾病状况的关系的研究范围。例如肿瘤组织可以和相应的生活方式数据和血液样本进行关联分析,有助于评估与肿瘤行为、治疗反应和生存相关的外源因素和肿瘤分子特征之间的相互作用[11,17-18]。此外,生物样本还有助于研究人员探索病因因素和特定肿瘤分子亚型之间的联系,可以为个体化治疗方法提供重要支持。
2.3随访管理 如何保持随访的依从性是大型队列研究面临的重要挑战。护士健康知识水平较高,有助于实现较高的随访率。此外,研究人员也制定了一系列策略提升随访应答率,包括与参与者保持一定频率的联络与互动、向无回复者发送手写信函以及一年一度的参与者通讯等。NHS的随访应答率始终维持在较高的水平。在2年1次的随访周期中,每个周期都记录了约90%的响应率,约94%的原始参与者持续参与研究[19]。
2.4数据管理和统计分析 NHS数据保存在由服务器、存储系统和备份系统组成专用设备中。系统每天进行离线备份和异地永久存储。NHS设有专门的统计组(包括数据管理专家、程序员等),负责开发并维护应用程序、数据库、实验室信息管理系统和NHS网站。数据分析主要是在研究人员的监督下由经过培训人员进行。项目组提供计算机系统的用户手册、统计分析的指导文档和示例计算机程序[11]。为确保调查人员之间使用最新的统计方法进行一致、正确的分析,项目组开发了一系列NHS数据的分析程序包(如SAS宏等)。
2.5数据开放获取与协作 NHS所有调查问卷、生物样本收集的详细信息以及外部用户指南均可在公共网站上获得。项目组成立了外部咨询委员会,以促进数据共享。需要进行科研协作的外部人员需准备1份简短的提案,交由NHS研究小组审查,以验证与正在进行的工作没有重叠。请求获得批准后,项目组将向外部研究人员提供数据和安全密码,以便于访问取消标识的数据文件,并由专人负责跟进科研协作事宜。
随着社会环境的变化和医疗卫生领域技术的更新与迭代,NHS的设计方案和内容也在不断完善,以适应新的变化,目前主要的发展方向如下。
3.1扩大研究领域 健康老龄化相关的心理社会问题受到越来越多的重视。NHS结合对早期生活暴露的研究,可以探索从儿童和青少年开始预防癌症和其他慢性病。此外,技术和统计的进步使研究者能够将多种类型的生物数据(如DNA、表观遗传学、代谢组学)与行为数据(如饮食和生活方式因素)联系起来,从而为研究疾病发生和进展的潜在机制提供了可能路径[20]。
3.2提升研究深度 在NHS 2年1次问卷调查的同时,研究人员越来越多地在亚组子研究中收集详细信息[11]。子研究是研究者及时解决研究问题的有效方法,例如:(1)参加听力保护研究(Conservation of Hearing Study,CHEARS)的NHS参与者完成了重复补充问卷调查和临床听力测试,以调查听力损失的风险因素;(2)认知功能研究:NHS II的一个亚组参与者完成定期的基于网络的认知功能测试,从而为未来早期认知下降风险因素的研究提供重要信息。
3.3启动新的研究 NHS不断增长的数据资源有助于通过随访人群建立最新一代的研究。1996 年,NHS II中部分妇女的子女参加了新的研究,称为今日成长研究(Growing Up Today Study,GUTS)[21],GUTS由 27 802名年龄在7~9岁儿童和青少年组成。收集的信息包括饮食摄入、体重变化、运动水平、物质和酒精使用、身体形象和环境因素等,这些信息有助于研究年轻人群中更为常见的疾病,如哮喘、皮肤癌、饮食失调和运动损伤[22]。此外,GUTS研究还有助于利用儿童及其母亲的数据进行跨代研究[22]。
队列研究是探索病因和疾病防治知识发现的最有效工具之一[24]。NHS研究经过半个多世纪的实施与发展,积累了丰富的实施经验。相比之下,我国护士队列研究起步较晚、规模较小、研究分散、项目执行期短且缺乏长期稳定支持。自2016年科技部首次对队列研究专门立项以来,我国队列研究的种类和数量急剧增加[25]。 美国护士队列研究的相关设计经验可供我国相关研究参考。(1)资料收集方面:可充分利用各种类型的信息化手段辅助数据采集。例如可借鉴NHS中的问卷扫描自动转换数据库系统,不仅可以将纸质问卷电子化保存,而且可以大大减少人为误差。还可根据研究目的,采集多种生物标志、图像、环境因素、参与者自我报告的电子健康数据等变量信息,为探索不同类型变量之间的关联、调整混杂和验证测量工具的有效性提供有效支撑。(2)人群代表性方面:要注重招募现有研究代表性不足的人群,以确保研究结果反映研究源人群的多样性。我国幅员辽阔,在构建人群队列的过程中,要充分考虑民族、年龄、性别、收入、教育程度和地理位置等因素。(3)维持随访方面:可参考NHS实施的随访管理方法,采用多种策略提升随访对象的依从性,如采取电话随访、结局事件被动监测等多种方法作为补充手段来提高随访率。(4)数据管理和分析方面:可借鉴该研究项目的管理模式,通过多重形式加强数据存储的安全性。建立专门的统计分析小组,确保数据管理的科学性和一致性。(5)队列的更新与迭代方面:NHS能够对公共卫生重要性问题的关注不断演变,不断改进暴露测量,并更新到队列随访中。我国相关的队列研究也应该适应不断变化的卫生问题,在不同的卫生条件和环境中继续深入探索,并根据需要启动子研究和新研究。(6)多学科团队协作方面:NHS由多学科团队协作完成,特别是在流行病学、医学和生物统计学等方面具有显著的优势,并且团队还能够融合学生、研究员和科学家等不同层级学术人员共同合作。未来我国的相关队列研究也应注重组建多学科团队,弥补单一学科研究的短板,汇集了来自基础、临床和预防医学等多学科的队伍,应用不同学科的方法和技术,从问卷调查、数据录入、样品存储、结果查询到随访和结局事件发现,融入计算机和数据库等技术,确保队列研究整个过程严谨科学。
综上所述,大型队列研究作为医学研究的宝贵资源,在揭示健康与疾病的病因、发病机制,改善疾病预后,减轻疾病负担等方面发挥着巨大作用。在我国护理领域队列建设中,可参考美国护士健康队列建设的经验,并考虑我国国情现状,完善适合我国国情的队列研究设计方案,有助于进一步推进护士队列研究建设,为促进护理人员职业健康、疾病防治策略制定提供新的证据。