中美韩健康与营养调查数据库建设与应用研究

2023-11-14 07:32:08韦葵葵巩浩雯刘玉秀王妍刘梦丹张曼婷虞茜惠
中国全科医学 2024年3期
关键词:节点

韦葵葵,巩浩雯,刘玉秀,,*,王妍,刘梦丹,张曼婷,虞茜惠

1.210002 江苏省南京市,南京医科大学金陵临床医学院重症医学科

2.510515 广东省广州市,南方医科大学公共卫生学院生物统计学系

3.211166 江苏省南京市,南京医科大学公共卫生学院生物统计学系

国民健康与营养状况是衡量一个国家卫生保健、经济社会发展和人口素质的重要指标。从20 世纪60 年代开始,世界上先后有多个国家定期开展国民健康与营养专项调查,构建了相应的公共数据库,及时发布国民健康与营养状况报告,并据此制定和修改社会政策和标准,以改善国民健康和营养状况[1-3]。其中,健康与营养调查数据库建设较为系统规范的国家有中国、美国、韩国等。本文介绍了中美韩3 个国家健康与营养调查数据库的建设发展情况,并进行对比分析,重点对应用3 个数据库发表文献的情况进行可视化分析,为推动医学公共数据资源的广泛应用提供方法和路径。

1 中美韩健康与营养调查项目介绍

1.1 数据库建设

中国健康与营养调查(China Health and Nutrition Survey,CHNS)项目是由美国北卡罗来纳大学教堂山分校人口中心与中国疾病预防控制中心营养所联合开展的队列研究[4]。CHNS 是一个不断更新的动态队列[5],旨在了解中国的社会、经济、人口变化及其如何影响整个生命周期的健康状况,为新时期相关政策的制定、修改和完善提供科学依据[6]。CHNS 涵盖了中国居民在个人、家庭和社区层面的信息,为开展研究提供了全面的数据支持[7]。CHNS 是中国第一个基于个人和家庭的大规模调查数据库[8],来自世界各地的学者均可以免费注册账号并访问,其官方网址:https://www.cpc.unc.edu/projects/china。

美国国家健康与营养调查(National Health and Nutrition Examination Survey,NHANES)是一项连续的基于人群的横断面调查,其独特之处在于其结合了健康访谈和健康检查[9]。NHANES 的主要目的是通过结合健康访谈、健康检查和营养调查,以评估美国成人和儿童的健康和营养状况[10]。NHANES 数据库向全世界研究者免费开放,用于解决未来的医疗、环境和公共卫生等问题,并为政府制定公共卫生政策和卫生服务计划提供科学依据[11]。NHANES 官方网址:https://www.cdc.gov/nchs/nhanes/index.htm。

韩国国家健康与营养调查(Korea National Health and Nutrition Examination Survey,KNHANES)是一个公开的、连续的横断面监测系统,旨在对韩国人口的健康状况、健康行为、食物和营养消耗进行全国性统计,进而评估本国居民的健康和营养状况。KNHANES 项目通过健康访谈、健康检查和营养调查3 部分获取代表性的国民信息,为制定和更改本国卫生政策和计划提供数据基础[12-13]。KNHANES 官方网址:https://knhanes.kdca.go.kr/。

1.2 历史追溯

各国健康与营养调查项目均具有悠久历史。我国的CHNS 项目始于1989 年,但并非连续的年度调查,其调查间隔为2~4 年,目前已经进行了11 次,2019 年调查数据仍在整理中,尚未公开发布。自1960 年初以来,美国疾病预防控制中心健康与营养调查司进行了一系列健康与营养调查,从1971 年到1994 年,NHANES项目定期进行,为更好了解国民健康与营养状况,自1999 年起,其调整为两年一个周期的连续性调查[14]。KNHANES 项目始于1998 年,1998、2001、2005 年前3 阶段的调查并非连续的年度调查,后为了提高统计数据的及时性,从2007 年开始,改变为连续性的年度调查,从而产生及时可靠的全国年度统计数据,为国家发布年度调查报告提供科学基础[15]。

1.3 抽样方法

在CHNS 项目中,不同地区参与者的地理环境、经济发展水平、人口结构、卫生条件、膳食结构和公共资源等存在一定差异,因此CHNS 采用多阶段分层整群随机抽样。在2015 年的调查中,主要抽样单位有360 个,约7 200 个家庭,共计30 000 余人[2,16-17]。

NHANES 项目和KNHANES 项目均采用复杂的多阶段概率抽样的方法来选择代表本国居民的参与者。NHANES 项目由4 个抽样阶段组成,每年计划抽取5 000 人。此外,NHANES 项目还对某些人口亚组(如:西班牙裔、非西班牙裔黑人、非黑人亚裔等)进行过度抽样,以提高特定亚组人群健康状况估计的可靠性和准确性[18-19]。KNHANES 抽样设计分为3 阶段,每年计划抽取10 000 人,应答率约为80%。表1 比较了CHNS、NHANES 和KNHANES 项目抽样方法。

表1 CHNS、NHANES、KNHANES 项目抽样方法比较Table 1 Comparison of sampling methods for CHNS,NHANES,KNHANES projects

1.4 调查内容

各国健康与营养调查内容并非完全一致,但整体调查框架相似,大致分为3 部分:健康访谈、健康检查和营养调查[20]。考虑到疾病流行程度和危险因素暴露在不同年龄段有一定差异,因此健康访谈问卷的内容根据不同年龄段有所调整。健康检查是由经过培训的专业医疗工作者进行。膳食调查采用24 h 膳食回顾法收集相关饮食信息[13]。CHNS、NHANES 和KNHANES 调查内容汇总见表2。为弥补NHANES 和KNHANES 横断面研究的局限性,提高健康与营养数据的利用率,美国和韩国将其与国家统计局死亡原因数据相链接,为研究发病和死亡的危险因素提供数据支撑。CHNS、NHANES及KNHANES 的官方网站涵盖了更多研究细节,且动态更新研究内容,相关调查数据集可在其官网便捷获取[21-23]。

表2 CHNS、NHANES 及KNHANES 项目调查内容汇总Table 2 Summary of CHNS,NHANES,and KNHANES contents

此外,美国NHANES 项目于2020 年3 月—2021 年6 月暂停调查,现已重新启动,在新一轮的调查中增加了新型冠状病毒感染(COVID-19)相关调查内容(如既往感染状况、严重程度、疫苗接种、抗原检测等信息)[24]。目前2021—2022 年调查数据仍在整理当中,尚不能公开获取。

2 数据库应用分析

2.1 发文量分析

本文通过Web of Science(WOS)数据库进行主题检索,检索词如下:TS=("National Health and Nutrition Examination Survey" OR "NHANES")、TS=("China Health and Nutrition Survey" OR "CHNS")、TS=("Korea National Health and Nutrition Examination Survey" OR "KNHANES"),得到历年来基于各数据库发文量。图1 显示了利用2012—2021 年发文量绘制CHNS、NHANES、KNHANES 数据库发文趋势。可见,近10年来,基于CHNS、NHANES、KNHANES 数据库的发文量均呈现显著的逐年上升趋势。其中,基于CHNS和KNHANES 的发文量相近,至2021 年达到300 余篇,而基于NHANES 的发文量更加突出,是CHNS 和KNHANES 发文量5 倍以上,2021 年达到1 700 篇。

图1 2012—2021 年CHNS、NHANES、KNHANES 项目发文趋势Figure 1 Trends in publication volume of CHNS,NHANES,and KNHANES from 2012 to 2021

2.2 研究热点分析

为了解利用CHNS、NHANES、KNHANES 数据库发表文献的研究热点,本研究借助计量分析软件CiteSpace[25-26], 围 绕 基 于CHNS、NHANES、KNHANES 数据库发表论文的关键词进行可视化分析。用WOS 核心合集数据库检索近5 年发表文献,检索策略同上,排除不相关文献,最后整合所有文献[27]。在2018 年1 月—2022 年10 月,基于CHNS、NHANES、KNHANES 数据库的发表文献,分别为1 133、6 912、1 330 篇,利用CiteSpace 软件对发表文章的关键词进行可视化分析,得到3 个数据库研究热点关键词共现图(图2~4)。从研究热点关键词共现图中可以看出3 个数据库重点研究内容相似,“obesity”“risk”“prevalence”“cardiovascular disease”“physical activity”“hyperten sion”“association”“health”“adult”“depression”“mortality”等关键词节点较大,节点越大提示上述关键词出现频率越高。为了使图形更加美观,本研究选择彩色的圆圈代表各关键词,圆圈大小反映关键词出现频次的高低,连线粗细代表各关键词之间的关联强度。该结果反映了当前健康与营养调查乃至更大范围公共卫生领域的研究热点,可为研究者开展基于数据库的研究提供思路。

图2 2018—2022 年CHNS 研究热点关键词共现图Figure 2 Keyword co-occurrence mapping based on research hotspots of CHNS from 2018 to 2022

CHNS、NHANES 和KNHANES 3 个数据库的研究热点也有一定差别。NHANES 和KNHANES 可以链接本国死亡原因数据,因而针对死亡率(mortality)的研究更广泛[28-29]。3 个数据库均有关于心理健康的调查,NHANES 和KNHANES 中有抑郁量表评分,因此在研究热点关键词共现图中,出现抑郁(depression)关键词,且节点较大(图3、4),提示有较多研究者开展此方面的研究[30-31]。CHNS 项目包含关于压力和心理状况的调查,但无抑郁量表评分,因此在CHNS 研究热点关键词共现图中未观察到抑郁(depression)节点(图2)。

图3 2018—2022 年NHANES 研究热点关键词共现图Figure 3 Keyword co-occurrence mapping based on research hotspots of NHANES from 2018 to 2022

图4 2018—2022 年KNHANES 研究热点关键词共现图Figure 4 Keyword co-occurrence mapping based on research hotspots of KNHANES from 2018 to 2022

3 讨论

本研究将国内外健康与营养调查数据库进行系统梳理,为研究者单独或联合应用不同国家健康与营养调查公共数据库开展研究提供了方法和路径。既往也有学者对单个健康与营养调查数据库进行介绍,但未针对多个国家健康与营养调查公共数据库进行系统的、全面的对比分析。

基于中美韩3 个国家健康与营养调查数据库的二次研究发文量较少,且二次研究多为研究者对数据库基本情况、变化内容的介绍,因此在汇总各数据库近10 年的发文量分析中,没有将原始研究和二次研究发文量的趋势分开描述,而是将原始研究和二次研究发文量汇总,进而得到2012—2021 年各数据库的发文趋势。

CHNS 项目有其自身独特之处,其是一项前瞻性的队列研究,收集了社会学、经济学等方面的信息,且更符合我国的基本情况。最新的CHNS 有许多新的突破,包括计算机辅助营养调查系统的升级与完善;研究内容上更加丰富,如增加了中老年人认知功能筛查,但仍需向NHANES、KNHANES 学习。首先,NHANES、KNHANES 调查均由经过培训的专职调查人员开展,且大部分的调查项目在移动检测中心(Mobile Examination Centers,MEC)进行,可较好控制误差。其次,NHANES、KNHANES 项目均为连续性的年度调查,数据发布及时。最后,NHANES、KNHANES 项目可以与本国卫生统计中心的死亡数据相链接,弥补其作为横断面研究的局限性。

CHNS 和KNHANES 项目的年发文量相近,但与NHANES 年发文量相比有较大差距。究其原因:(1)NHANES 数据库信息发布更及时、更规范。(2)NHANES 数据库历史悠久且调查内容在不断丰富,为研究者累积了更全面、时间跨度更长的数据资源。(3)NHANES 数据库是在以英语为母语的美国开展的,英语作为世界上应用最广泛的语言,各国研究者更容易掌握NHANES 项目内容。但与此同时,CHNS 和KNHANES也在不断调整优化各自的调查内容与流程,便于更多研究者应用。

本研究首先对CHNS、NHANES 和KNHANES 的建设现状、历史追溯、抽样方法、调查内容等进行系统梳理和对比分析,接着对基于中、美、韩健康与营养调查数据库发文情况进行计量分析,有助于更多研究者系统了解和广泛应用上述3 个公共数据库,最后利用CiteSpace 软件对基于3 个数据库的热点研究内容进行可视化分析,便于研究者了解该类数据库的热点内容,期望为研究者开展相关研究提供路径,更好地促进科学证据产出。

本研究仍存在局限性,仅汇总了中、美、韩3 个国家的健康与营养调查公共数据库,仍有其他国家因未公开或未开展该类调查,故没有被纳入本研究。此外,在数据库应用分析中,发文量是利用Web of Science 核心合集检索得到的文献,并非利用相应数据库发表的全部文献,但可代表基于健康与营养调查数据库发文趋势,对比较不同国家数据库发文量的差异具有重要的参考意义。

针对公开数据库未来的创建和利用提出以下建议:(1)开展针对研究者的培训教育。当前利用中、美、韩3 个国家健康与营养调查数据库取得了许多具有国际影响力的重要成果,但对3 个数据库的应用仍是不充分的,未来可以开展针对研究者的培训教育,扩大研究者对健康与营养调查的了解,进而激发更多研究者挖掘公共数据库中的数据,开展基于数据库的科学研究。(2)创建全球健康与营养公共平台。当前南加州大学已经建立全球健康与老龄化网站(https://g2aging.org/)。该网站汇聚了世界上多个国家健康与老龄化相关数据,为全球开展老龄化研究提供了便捷。未来希望更多国家开放其健康与营养调查数据,建立全球健康与营养调查公共平台,进而便于研究者多维度应用各国健康与营养调查数据,为科学研究、循证支持提供更加强有力的证据。(3)调整调查内容,优化调查过程。调查内容应随着疾病患病率和对人群健康危害程度进行调整,且不同国家数据库间要相互学习,取长补短。调查过程更加科学,调查技术更加先进,进而得到更加真实、可靠的数据。

作者贡献:韦葵葵负责全文的构思与设计,文献收集、整理和论文初稿撰写;巩浩雯负责结果的分析、解释及可视化分析;刘玉秀提出研究思路,设计论文框架,对文章整体负责;王妍、刘梦丹负责审阅和修改文章;张曼婷、虞茜惠负责提供软件技术支持。

本文无利益冲突。

猜你喜欢
节点
Formation of advanced glycation end products in raw and subsequently boiled broiler muscle: biological variation and effects of postmortem ageing and storage
CM节点控制在船舶上的应用
Analysis of the characteristics of electronic equipment usage distance for common users
基于AutoCAD的门窗节点图快速构建
概念格的一种并行构造算法
结合概率路由的机会网络自私节点检测算法
MP2P网络基于动态分组的超级节点选取
复用段单节点失效造成业务时隙错连处理
中央红军长征主要节点述要
红土地(2016年10期)2016-01-28 08:15:46
抓住人才培养的关键节点
中国卫生(2015年12期)2015-11-10 05:13:34