多层模型在农村居民医疗服务利用影响因素分析中的应用

2013-09-07 09:01卫生部卫生发展研究中心100191付晓光
中国卫生统计 2013年3期
关键词:农村居民变异个体

卫生部卫生发展研究中心(100191) 付晓光

多层模型在农村居民医疗服务利用影响因素分析中的应用

卫生部卫生发展研究中心(100191) 付晓光

目的 应用多层模型技术分析新农合监测地区农村居民医疗服务利用的影响因素。方法 运用多层分类模型方法,从个体层次和家庭层次两个方面分析影响农村居民医疗服务利用的主要因素,关注由于家庭成员聚类引起的样本非独立性分析群内差异和群间差异。结果 性别、年龄等个体因素,以及家庭收入、家庭规模、医疗保障等家庭因素是影响农村居民医疗服务利用的主要因素,且家庭因素的解释程度在25%左右。结论 农村居民医疗服务利用影响因素中个体特征影响程度更高。

新型农村合作医疗医疗服务利用多层模型

根据2008年第四次国家卫生服务调查结果,我国农村居民的两周就诊率和住院率分别达到了15.2%,和6.8%,应就诊未就诊比例和应住院未住院比例均较2003年第三次国家卫生服务调查时有所下降,但是仍有35%的两周内新发病例未就诊,20%的病人经医生诊断需住院而未住院〔1〕。影响农村居民医疗服务利用因素除了政策、经济发展与卫生资源分配等宏观因素影响之外,还有农村居民个体特征、家庭特征等微观层面因素,本研究将利用2010年卫生部新型农村合作医疗监测地区的入户调查数据,分析影响我国中西部地区农村居民就医的微观层面因素,以期对宏观政策的制定和调整提供支持。

资料与方法

1.研究数据

本文的研究数据来源于卫生部新型农村合作医疗监测系统16个监测县2010年的家庭调查数据。该项调查通过问卷访谈完成,抽样设计采用分层多阶抽样,每县的各乡镇按农民人均纯收入排序(兼顾地理条件)分层后选取高、中、低3个乡(镇),每个入样乡镇的所辖行政村再按农民人均纯收入排序分层,抽取高、中、低3个行政村,每村按照村民花名册随机抽取33户,接受入户调查,剔除缺失数据后,本文的研究数据有效样本为17 702个。

根据调查设计,农村居民的医疗服务利用情况由两个变量反映:即“12个月内是否住院”和“两周内患病是否就诊(住院患者不回答此项)”,本文将其合并生成一个新变量作为因变量,即是否有过就医行为,因其为二分类变量,故本文采用多层分类模型进行回归分析。

以往文献对医疗服务利用影响因素的研究,集中在人口学特征、社会经济因素、健康状况、时间价值、医疗保险覆盖,家庭收入、家庭规模、家庭医保覆盖等因素作为自变量进行分析和评价〔2-4〕。本文基于数据情况与多层模型的需要共选取了性别、年龄、民族、婚姻状况、受教育程度、与户主关系、是否购买商业(人寿)保险,以及家庭人口数、上年家庭纯收入、是否参加新农合、是否为救助家庭等11个自变量。

表1 研究变量及描述性统计

2.分析方法

多层模型(multilevel model)技术的基本原理是将因变量的变异分解为同一群体内的个体差异和不同群体间的群间差异,通过分解变异来分析群内和群间因素的影响,通过对标准误差的调节使分析结果更准确〔5〕。本文的研究数据中涉及了家庭人口数、家庭成员构成、家庭收入等聚类性质的家庭层次变量,和年龄、性别、受教育水平等家庭成员的个体层次变量,本文将运用多层分类模型中的随机截距模型,消除个体样本之间的非独立性,分析群内(个体层次)影响程度和群间(家庭层次)影响程度的差异。

本文使用stata12.0建立数据库并进行数据分析,先后使用logistic回归模型、无条件平均模型和随机截距模型进行比较分析。

主要结果

1.无条件平均模型

无条件平均模型也称空模型,即不含任何自变量的回归分析,其方程式为:

yij代表第j个家庭第i个人的就医行为;γ00代表总平均值或总截距,是固定参数;δ0j是代表家庭层次的随机变量,指第j个家庭的截距到总截距的距离,是多层模型存在的标志;εij是代表个体层次的随机变量,指第j个家庭的第i个人到第j个家庭截距的偏离。空模型结果将提供三方面信息:一是群间变异对因变量总体变异的显著性,即是否有必要使用多层模型;二是群体特征对因变量的影响程度,即通过群间关联度系数ρ来反映;三是反映自变量对因变量的解释能力〔6〕。

表2中的无条件平均模型分析结果表明,群间变异系数(0.86)远大于其标准误,说明农村居民医疗服务利用与否一定程度上是与其家庭特征有关的,群间关联度系数0.18意味着因变量的变异中有18%是由家庭特征解释的。虽然家庭层次的变异较个体层次弱一些,仍有必要建立随机截距模型,具体分析各自变量的解释能力。

2.随机截距模型

(1)模型建立

随机截距模型假定因变量的截距随群体而异,但各群体的回归斜率是一样的,因此不同群体间是缺乏互动的,其基本方程式如下:

其中,G1j是指群体特征即家庭特征,γ01是群体特征的系数;χ1ij是指个体特征,γ10是个体特征的系数,代表农村居民个体特征对其就医行为的影响,但其作用并不因家庭特征而异〔6〕。

(2)模型适应情况

如前所述,本文选择了11个自变量来分析农村居民医疗服务利用的影响因素。其中,性别、年龄、民族、婚姻状况、受教育程度、与户主关系、是否购买商业(人寿)保险反映的是农村居民个体特征的变量;家庭人口数、上年家庭纯收入、是否参加新农合、是否为救助家庭反映的是农村居民家庭特征的变量。利用随机截距模型,可以分解家庭层次特征和个体层次特征的变异对因变量的影响和解释程度。表2列出了随机截距模型的模型适应情况,在加入家庭层次变量后,模型中群间变异缩小,约有11%的变异来自家庭层次的变异,纳入的四个家庭层次自变量对因变量的解释比例约有25%左右,说明仍有一些家庭层次的因素未纳入的模型中来解释因变量的变异。AIC和BIC的值也有减少,说明随机截距模型的适应情况更好。

表2 空模型及多层模型结果

(2)影响因素分析

根据随机截距模型分析结果,在控制了其他变量的前提下,对个体和家庭层次变量的分析果有一些是与以往研究、经验判断的结果是十分类似的(见表4)。

从性别角度看,男性就医的概率是女性的53%,这不仅与不同性别的就医意愿和行为有关,也是与近年来农村地区鼓励孕产妇住院分娩,女性的住院率高于男性有关;从不同年龄组看,与未成年人口(0~14岁)相比,劳动人口(15~64岁)就医的概率较低、老年人口的就医概率更高,这和劳动人口的时间价值较高,看病就医需要花费时间,相应损失经济效益有关;少数民族的就医概率也高于汉族,少数民族地区地广人稀,医疗资源有限,患病后很难到非医疗机构获得药品,因此自我医疗较少,到村卫生室和乡镇卫生院的看病比例更高;与未婚的人群相比,在婚和离婚丧偶人群就医概率更高;家庭中的地位也对就医有一定的影响,户主就医的概率是非户主的1.63倍,这是和农村家庭结构密切相关的,一般来说户主都是家中的领导者或是家中经济来源的主要贡献者,因此户主在患病后更容易就医治疗或是更容易被其他家庭成员催促就医治疗;此外,购买了商业保险、获得医疗救助的人群更容易去就医。

但是,也有一些社会经济变量出现了与经验判断不同的结果,如受教育程度。经验的判断是受教育程度较高的人群更具备预防保健意识,在身体不适时会很敏感并选择就医。然而,笔者认为,预防保健意识和疾病经济负担固然是影响医疗服务利用的重要因素,但是人们的健康水平才是决定其是否发生就医行为的主要因素。表3列出了不同受教育水平人群两周内患病类型的差异,受教育程度越高,两周内患病的比重越低,两周患病的样本中高中及以上的人群仅占6.66%,同时受教育程度较高的人群中急性病例的比重高于慢性病例。可见,受教育程度较高的人群患病率较低,且慢性病患病率较低,因此,其就医的概率可能要低于受教育程度较低的人群,社会经济地位虽然影响就医行为的发生,同时个人身体状况(患病类型)更是就医行为产生的重要影响因素。

表3 两周患病类型与受教育水平

3.与logistic回归模型比较

同样的自变量纳入logistic回归模型,在不考虑群间和群内变异影响的情况下,logistic回归模型中一些自变量的影响程度和显著性水平发生了变化。

首先是各自变量系数和标准误的变化。虽然是相同的自变量纳入模型,但其系数和标准误均有所变化,说明通过随机截距模型的建立,区分研究对象群间和群内的差异,调节了自变量的系数和标准误差,这在一定程度上提高了估计的准确性,降低了犯一类错误的可能性。

表4 logistic回归模型与随机截距模型比较

其次是一些自变量的影响程度出现了变化。如“是否参加新农合”,在logistic回归模型中的分析结果认为,是否参加新农合对其就医行为是有统计学差异的,参加新农合的农村居民就医概率是未参加者的1.62倍;但是在随机截距模型中,是否参加新农合与否对农村居民个体就医行为的影响已没有显著性,这是因为随机截距模型能够纠正因聚类引起的样本非独立性,新农合作为以户为单位参加的医疗保障制度,已基本覆盖了全体农村居民,有效样本中个体的参合率也达到了约99%,医疗保障制度的变异对就医行为的变异已影响甚微。

讨 论

为了避免家庭成员行为的聚类效应,本文利用多层分类模型对是否有就医行为进行了多层分析,与无条件平均模型相比,随机截距模型中家庭层次变异的随机效果有所降低,且模型的解释能力更强,AIC与BIC值均有明显的降低,因此加入分层变量进行多层模型分析是非常有必要的;与不考虑聚类效应所作的一般logistic回归模型相比,多层分类模型中的各自变量解释程度发生了变化,标准误也相应有所调整,这与纳入了家庭层次变量有关,样本非独立性的纠正使得分析结果更为合理。因此,在分析那些样本间关联度很大的数据时,可以考虑引入分层模型,提高置信水平,系统地分析不同层次变量对因变量变异的影响。

此外,本文对农村居民家庭调查数据的分析结果表明,农村居民个体特征对其医疗服务利用的影响较家庭特征更强一些,而这些个体特征(如性别、年龄、民族、受教育程度等影响因素)本质上反映的是个体的健康状况;在家庭层次特征方面,由于新农合的参合率保持较高水平、未参合人数较少,且农村居民的医疗服务需求在过去几年中的逐步释放,因此医疗保障对是否利用医疗服务的影响程度已经非常小。

1.卫生部统计信息中心.2008中国卫生服务调查研究:第四次家庭健康询问调查分析报告.中国协和医科大学出版社,第1版,2009年.

2.张耀光,张拓红,高军,徐玲.城市不在业者卫生服务利用及影响因素分析.中国卫生统计,2007,24(2):149 -154.

3.宋艳艳,孙振球,曾小敏.非条件logistic回归对城市居民门诊卫生服务利用与影响因素的分析.中国卫生统计,2002,19(3):159-160.

4.左延莉,胡善联等.新型农村合作医疗试点卫生服务利用的影响因素分析.中国卫生资源,2006,9(5):223 -225.

5.杨菊华.多层模型在社会科学领域的应用.中国人口科学,2006(3):44-51.

6.郭志刚,等(译).分层线性模型:应用与数据分析方法.社会科学文献出版社,2007.

(责任编辑:刘壮)

猜你喜欢
农村居民变异个体
住在养老院,他们过得好吗?——陕西农村居民养老情况调查
云南富民县农村居民高血压的变化趋势及与肥胖指标的关系
变异危机
变异
关注个体防护装备
明确“因材施教” 促进个体发展
变异的蚊子
How Cats See the World
做强农村居民的健康防线
俄罗斯农村居民就业、收入状况