断点回归在公共卫生领域的应用

2023-07-01 07:30于胜男高琦郑良石圆陈奕瑾李秀君

中国防痨杂志 2023年7期

于胜男高琦郑良石圆陈奕瑾李秀君

多年来,医学领域探索和发展了各种研究方法。随机对照试验(random control trails,RCT)依然是金标准[1],验证干预措施有效性最为可靠。然而在实际运用时,常常因为经费等问题使得RCT难以开展[2]。为此,学者们提出了各种“准实验方法”以探究因果效应。1960年,Thistlethwaite和Campbell[3]为探究高考成绩对未来就业的影响,提出了断点回归(regression discontinuity,RD);与双重差分法和工具变量法相比,RD的因果推断能力与RCT更接近,在干预效果评价时能提供较为有力的证据[4-6]。

20世纪90年代以来,RD在经济学领域得到了广泛的应用,进入了蓬勃发展的时期,逐渐应用于医学领域,特别是卫生经济学领域,但在公共卫生领域应用发展较为缓慢[7]。近年来,RD越来越多地应用于空气污染的治理效果[8-9],疫苗有效率的影响因素[10]、新型冠状病毒感染流行期间城市封锁带来的影响[11-13]等问题的探究。本文主要介绍RD的思想、应用及其在公共卫生领域的应用现状。

一、RD的思想

(一)基本思想

RD的基本思想是,存在一个连续的分配变量x,一个干预变量t和一个结局变量y,其中,干预变量t受到变量x分配,当x超过或低于某个临界值时,干预变量t发生改变,这个临界值即为断点c。如果结局变量y在断点c处跳跃,而y与x之间存在连续性关系,其他协变量在断点c处也是连续的,那么y的改变就可能归因于干预变量t的改变[14]。x可以是时间变量,此时c为某一时间点,称为时间断点回归[15]。

RD可通过比较断点c两侧的差别来估计干预对结局的影响,进行干预效果评价[16]。RD因果推断基于反事实原理,断点两侧除了是否受到干预外其他条件相同,对照组观测不到的内容可以看作处理组观测到的内容的反事实,从而进行因果推断。例如,临床上D-二聚体检测结果高于临界值(一般为500 ng/ml)的疑似肺栓塞患者更有可能接受CT肺血管造影检查(computed tomography pulmonary angiogram,CTPA),而造影剂给药最重要的危害之一是急性肾损伤。在控制患者的年龄、性别等因素后,D-二聚体略高于或低于500 ng/ml的患者的其他因素应该基本上是相同的,因此,RD可以用来研究血管造影检查和肾功能变化之间的关系[17]。

根据断点处分配规则的不同,RD可分为两种类型:(1)精确断点回归 (sharp regression discontinuity,SRD):断点前后接受干预的概率分别为0和1。(2)模糊断点回归 (fuzzy regression discontinuity,FRD):断点前后接受干预的概率从a改变为b(0

(二)局部近似随机化思想

值得注意的是,断点两侧的研究对象总体上存在差异,但RD主要关注的是临界值附近的可比性,越接近临界值时,两侧差异就越小。因此,可以通过比较断点左侧和右侧某个区间内结果之间的平均差异来衡量因果效应。在这个区间内,两侧差异可以忽略,类似于RCT中的随机化,但仅限于临界值附近的区域,这个区域定义为带宽b。这就是RD的局部近似随机化思想。

二、RD的应用

(一)SRD的推理

当干预变量t完全依赖于分配变量x,假设xi小于断点c时,ti=0,xi大于断点c时,ti=1,对应的结果变量t分别为yi(0)和yi(1)。

RCT通过平均因果效应(average casual effect,ACE)来估计因果效应。在SRD中,考虑到局部近似随机化,在带宽b内可以计算干预效应(treatment effect)[18]:

①

也可以表示为断点两侧差值的期望值:

ACESRD=E[yi(1)-yi(0)|xi=c]

②

在实践中估计ACESRD时,允许断点两侧斜率不同,常用的线性模型如下所示:

yi=β0+β1ti+β2(xi-c)+β3ti(xi-c)

③

公式③中,ti=1表示接受干预,β1即为ACESRD,β2即为没有干预时的斜率,β3为分配变量与干预变量交互项的系数,允许断点两侧有不同的斜率。模型中还可以纳入高阶项和其他协变量。

(二)FRD的推理

FRD类似于依从性不完全的RCT,是否干预并不完全依赖于分配变量。分配变量未超过临界值时,有一定概率存在干预,当分配变量超过临界值时,接受干预的概率发生改变。

参考SRD中干预效应的计算公式,在FRD中,ACESRD被定义为意向治疗(intent-to-treat,ITT)效应,即为ITTFRD。由于是否干预只有一定的概率受到分配变量的控制,还受到其他因素的影响,只有部分依从了分配变量的分配,即为“依从者(complier)”,因此,其干预效应可称作“依从者平均因果效应(complier average causal effect,CACEFRD)”[18],计算公式为:

④

即为:

在公式④中,当分母等于1时,干预完全由分配变量决定,此时即为SRD。当分母等于0时,即临界值两侧干预概率没有改变时CACEFRD是无意义的,也就无法构成RD。

在实际应用中,FRD可以使用与SRD相同的回归模型,一般可以用两阶段最小二乘法来完成[18]。

(三)RD应用步骤

1.判断是否存在断点:绘制结果变量y与分配变量x之间的散点图,观察y是否在断点处发生改变。图1为采用模拟数据,应用Stata软件绘制。设置x(0,1)为分配变量,设置断点c为0.5,t为干预变量,设置协变量z。结局变量y设置为:

注图1A为不存在断点时的分配变量x与结局变量y间的散点图;图1B为干预变量t受到分配变量x控制,存在断点时,分配变量x与结局变量y间的散点图

y=3t+12t(x-0.5)+6(x-0.5)+3z+2

如图1A所示,当t始终为0,即干预变量不存在时,无断点。而当t受到x值分配时(x<0.5t=0,x≥0.5t=1),存在断点,如图1B所示。

由图1B可以看出,当样本量较大时,散点图可能不够直观,不易观察到跳跃现象。因此,可以如图2B所示添加拟合线,通过观察两侧拟合线的差异来推测是否有跳跃发生。在实际应用中,还可以添加更高阶的拟合线以观察断点处的变化。

注图2A同图1B,为存在断点时分配变量x与结局变量y间的散点图;图2B表示分配变量x与结局变量y间添加拟合线的散点图

2.判断RD的类型:根据断点处干预概率的改变,判断该研究属于SRD或FRD。可通过专业知识,根据分配变量与干预变量之间的逻辑关系进行判断,也可结合分配变量x与干预变量t之间的散点图进行判断。

3.建立模型进行因果效应估计:既可以仅使用接近临界值的数据,即带宽内的数据,进行局部线性回归,也可以使用完整的数据集建立回归模型。在实际应用中,一般会同时采纳两种方法。使用局部线性回归时,统计学软件可提供最佳带宽。当使用完整的数据集时,可以将高次多项的模型与简单的线性模型进行比较。

干预效应的局部线性估计结果理论上可以分为4种情形[1]。图3为应用Stata软件中的rdcv包进行局部线性回归绘制。

注图3A表示不存在断点的情形;图3B表示结局变量y在断点处跳跃且干预变量t与分配变量x存在交互作用的情形;图3C为存在断点,结局变量y在断点处跳跃的情形;图3D表示结局变量y未发生跳跃但干预变量t与分配变量x存在交互作用的情形

第一种如图3A,没有明显的干预效果,干预措施t与结果变量y之间可能没有因果效应。图3C显示了RD的基本思想,只有一个主要的干预效果,在断点处有明显跳跃。图3D从断点两侧的回归线斜率变化中可以看出干预变量t与分配变量x的交互作用效应是明显的,这意味着在干预组中,干预效果随着分配变量高于临界值的增加而增加,但断点处未发生明显的跳跃。图3B是图3C和图3D的组合,交互效应和干预效果同时存在。

三、公共卫生领域RD应用现状

RD作为干预效应推断的常用方法,在公共卫生领域的应用逐渐增多,尤其是空气质量的影响因素及相关政策的干预效果,以及疫苗有效性等方面。新型冠状病毒感染暴发以来,RD也越来越多地应用于探究疫情给公众健康和个人行为带来的影响。

(一)空气质量研究

RD常用于探索各种政策、制度对空气质量的改善情况。例如,在一项探索环境治理改善空气质量的研究中,Jiang等[19]应用RD发现,中国政府实行的“蓝天保卫战三年行动计划”有效改善了空气质量,这一研究结论为发展中国家制定切实可行的环境污染控制政策提供了新的思路。RD在探索相关政策对能源消费、环境支出与空气质量关系的影响时也十分适用[8-9]。Zhang等[20]以中国北京和天津地区为例探索“机动车限行”对空气质量的影响,RD发现限行主要是减少了汽车尾气排放,对空气污染的改善是有限的。另一项以中国北京、天津、河北(京津冀)地区为例的研究应用RD发现“联防联控”区域的扩大有利于空气质量的改善[21]。

此外,在探索空气质量、空气污染对公众健康和个人行为产生的影响时,RD也是常用的方法之一。加拿大多伦多的一项研究应用RD探究了空气质量警报计划对人群健康的影响,发现采用这项计划可能会促进一些呼吸道疾病发病率的降低[22]。Fan等[23]应用RD估计了冬季燃煤供暖对空气污染和公众健康的影响,发现燃煤供暖会排放大量空气污染物,空气质量指数升高,人群死亡率也有所增高。

RD既可探究空气质量对人群健康的影响,又可分析各项政策对空气污染的改善程度,进而有助于公共卫生政策的制定与实施,对于空气质量的改善具有一定意义。

(二)疫苗有效性评价

公共卫生领域中,流行病学专家们的一个重要目标是评估疾病的预防和控制策略,包括疫苗和疫苗接种计划的影响。RD可以灵活运用于疫苗保护效果评价,尤其是临床试验难以进行或无法进行的研究[10,24]。

有学者以人乳头瘤病毒疫苗接种计划为案例,对RD评估疫苗有效性的因果推断能力进行了研究[25]。在一项应用几种准实验方法评价新型冠状病毒感染疫苗效果研究中,发现RD等准实验方法可能会提供更准确的新型冠状病毒感染疫苗有效性估计[26]。RD还可应用于对疫苗带来的其他影响的估计。一项应用RD的观察性研究发现,以老年人为重点的流感疫苗接种策略对于降低老年人群的发病率和死亡率的干预效果可能十分有限[27]。

综上,疫苗接种是重要的公共卫生干预措施之一,RD应用于量化疫苗效力和针对特定疾病的有效性具有重要的公共卫生意义。

在现代社会的新形势下，森林保护工作的重要性不言而喻。面对森林保护所带来的巨大利益，我们更应该坚定信心，努力做好森林保护工作，让森林发挥出巨大的作用。并且我们还要随时关注森林保护过程中存在的问题，并且要对这些问题提出相应的解决措施，还要注意让森林保护工作落到实处，真正的为我国的环境保护做出相应的贡献。

(三)新型冠状病毒感染研究

新型冠状病毒感染疫情在全球流行以来,各个国家、地区采取各种措施以应对疫情流行,包括居家隔离、佩戴口罩、保持社交距离等,在时间序列上自然构成了断点。因此,许多国内外学者应用RD来探究新型冠状病毒感染及相关防控措施带来的影响。

Brodeur等[11]和Bakolis等[28]应用RD发现新型冠状病毒感染疫情期间城市封锁等措施可能会对人群心理健康产生影响。而有些学者则应用RD探究了新型冠状病毒感染疫情期间不同地区的空气质量变化[12-13],新型冠状病毒感染以外其他疾病的发病率和死亡率的变化等[29]。此外,RD还可应用于探究新型冠状病毒感染疫情期间健康需求和医疗服务是否发生了改变[30]。

新型冠状病毒感染的流行在时间序列上自然形成断点,环境的变化、人群心理健康的变化、其他疾病流行特征的变化都可以考虑运用RD进行探究。

(四)卫生服务与政策研究

RD在卫生服务与政策研究领域也有着广泛的应用,其可应用于教育等因素对孕产妇保健的影响[31],全科医生连续性护理中断对医疗保健利用的影响[32]等。在政策研究方面,除前文所述空气质量相关研究应用外,药物使用指南对青少年吸毒“累犯”的影响[33],养老金[34]和退休[35]等因素对老年人医疗服务利用的影响均可运用RD进行探索。

较多卫生服务与政策研究会使用时序数据,一般可将时间(日期、月份或年龄)设置为分配变量,政策实施的时间点设置为断点[15]。

(五)结核病研究

近年来,RD在公共卫生领域的应用逐渐增多。作为一种应用较为简单的准实验方法,RD未来可以更多地应用于公共卫生领域的多个方面。在肺结核研究领域,RD可用于探究新型冠状病毒感染疫情发生对肺结核发病的影响,疫情后时代肺结核患者的心理健康变化等。以新型冠状病毒感染对某地区肺结核发病的影响为例,可将发病率设为y,日期或月份或年份设为x,新型冠状病毒感染开始传播的时间点设为断点c,并需要考虑季节等因素,可设为协变量,具体可参考类似研究[29]。此外,RD还可更多应用于肺结核防治相关政策的评估与制定、肺结核患者心理健康状况的评估与改善等方面。

四、RD的优点与局限性

RD作为一种准实验方法,应用条件相对简单,能较好地节约人力和物力资源。RD主要关注断点附近的干预效果,可以为各种制度决策和阈值划定提供依据。RD能更真实地反映变量之间的因果关系,能较大程度降低混杂的影响[7]。

当然,RD也存在一些局限性。RD需要较大的样本量来获得足够的统计效能。Hilton Boon等[36]发现,许多应用RD的研究具有较大的样本量,因此,可能忽视了其低样本量时统计效能较低的缺点。此外,RD的应用需要满足较多假设,并应确保没有任何外部因素操纵分配和研究结果。因此,RD更适用于具有较大样本量的研究[37],且进行稳健性检验和敏感性分析是很有必要的。

综上所述,公共卫生领域内RD的应用可能比以前认识到的要更加广泛,RD在公共卫生领域具有较强的适用性,有着较大的应用潜力。

利益冲突所有作者均声明不存在利益冲突

作者贡献于胜男:实施研究、起草文章;高琦、郑良、石圆和陈奕瑾:修改文章;李秀君:对文章的知识性内容作批评性审阅、指导