乡城流动与我国城乡居民的自评健康
——使用锚点情境法评估回答异质性的影响⋆

2018-08-29 09:21
西北人口 2018年5期
关键词:分界点锚点被访者

吴 菲

(复旦大学社会学系,上海200433)

“健康移民”现象是国际迁移与健康研究领域广为证实的一个发现:即整体上,迁移人口比流出地和流入地人口更健康[1-2]。已有研究将迁移人口更高的健康水平归因为两种主要机制:(1)“健康迁移选择”机制强调迁移本身是基于健康水平的正向选择过程,与流出地的其他人相比,越健康的人群越可能做出迁移决策[3-4];(2)“疾病回迁”机制①又称为“大马哈鱼假设”:借鉴大马哈鱼的洄游特征,形象比拟移民因疾病回迁的状况。强调健康恶化的移民更可能迁回流出地[5]。过去三十年,中国经历了规模巨大的乡城流动,对社会和人口结构造成了深远的影响[6]。根据最新官方数据,2016年我国流动人口数量已达2.47亿,约占总人口的18%[7]。大规模的流动人口聚集在城市,来自于环境变化及个人生活方式的转变带来的健康挑战已成为学界和公共管理界长久以来的关注点[8-9]。

一、我国乡城流动对健康的影响:挑战及问题

(一)不同健康测量带来的挑战

乡城流动人口是否相对更健康?已有一部分研究证实了跨国迁移中发现的“健康移民”现象同样适用于我国内部的乡城迁移[10-13]。例如陈涓发现与北京本地城镇居民相比,农村户口的外来流动人口的自评健康水平显著更高[11]。基于全国代表性样本的分析也显示与农村居民相比,乡城流动者的自评健康水平更高[14]。而近期一些基于长期追踪数据的研究则为“健康选择”及“疾病回迁”两个机制提供了更直接的经验证据:自评健康越好的农民越倾向于迁移,且迁移距离越远;而自评健康状况恶化的乡城移民更有可能回迁至离家乡

*本研究初稿曾在2017年中国社会学年会社会分层与流动论坛上宣读,作者感谢与会的师友给予的建设性意见,特别感谢密歇根大学人口研究中心徐宏伟博士慷慨分享锚点情境估计的do-file,以及郝大海教授对于作者学习锚点情境法的热情鼓励,文责自负。更近的地方[15-16]。

然而,一旦采取多种健康指标测量时,研究结果就开始变得复杂。有研究采取包括自评健康、自报疾病史以及体测指标等多种健康测量来比较不同迁移群体的健康差异,结果发现尽管乡城流动人口的主观健康水平均显著高于农村留守人员,但这一差异在“是否有高血压”及“是否肥胖”等客观指标上却不显著[17]。另一些研究考察了自评健康以及一系列自报疾病测量,发现与农村非流动居民相比,乡城流动者尽管在“患慢性病”、“残疾”以及“患妇科/男科疾病”的比率上都显著更高,但其自评健康水平却与前者没有显著差异,甚至在“有工伤”的比例上比前者更高[18]。

不仅如此,当考察的对象变为具体的疾病而非整体的自评健康时,“健康移民”的假设就很难得到支持。与城镇居民相比,流动人口患呼吸道感染、性病及肺结核等传染疾病的比率显著更高[9][19-21]、受工伤及职业相关伤害的可能性显著更高[22-23]、母婴健康的各项指标都显著更低[24]。

(二)健康测量的主观异质性问题

如何统和来自不同领域的发现?究竟中国的乡城移民与流入地和流出地人口相比,是否更健康?在健康迁移选择和疾病回迁两个假设之外,本文提出主观回答异质性假设,即不同迁移群体在将客观健康状况转化为统一的主观健康测量时可能会采取不同的标准,由此导致主客观健康指标与迁移地位关系的不一致。

主观健康测量的回答异质性问题长久以来已被学者所注意:一方面,不同人群对同一概念含义的理解不同,例如在进行自我总体健康评价时,女性比男性在评价时更多考虑情绪方面的健康水平[25];西班牙裔比白人更多考虑社会及心理健康[26]。另一方面,即使对所测量的健康概念的内涵理解一致,不同群体对于统一的回答选项所代表的实际水平也可能有不同的判断[27]。

第一种异质性问题可以透过更详尽地界定题目含义来缓解,而第二种异质性问题,也称为类别变量的项目功能差异(Differential Item Function⁃ing,DIF),由于涉及主观评判的差异性,因而更难处理[28]。锚点情境法(Anchoring Vignette Method)作为一种测量并纠正回答类别异质性的有效方法,在近十几年被广泛应用于公共卫生领域和社会科学领域[27][29-33]。

迄今为止,大量探索我国乡城人口流动与健康的人口学及社会学研究所依赖的健康测量都是主观自评指标[11-13][15][34-35],因而,评估不同迁移群体在自评健康上的回答异质性对于呈现群体间实质性的健康差异具有不可忽视的意义。

本文以广为使用的整体自评健康(General Self-rated Health)为例,使用全国代表性数据,借助锚点情境法,在中国乡城人口流动背景下重新检验“健康移民”现象,尝试回答不同迁移群体之间的健康差异在多大程度上体现了回答异质性的问题。

二、自评健康的回答异质性及锚点情境法

本文中,回答异质性被定义为两个潜在水平一致的个体,给出不一致的主观评判的现象[36]。除了医学测量所得的健康指标外,社会科学家广泛使用的主观健康指标常会面临回答异质性的挑战。无论是使用李克特量表的自评健康、抑郁、身体功能,还是二分量表的慢性病或身体伤病的确认,都要求被访者将自己感知到的身体状况转译为统一的回答项目,而转译过程却往往会因被访者的特征而有所差异,于是就可能出现尽管实际健康水平一致,自评健康却有所不同的回答异质性状况。

以常用的五分自评健康为例,假设对于个体i,存在一个连续的、单一维度的潜在健康水平Y*i。因为无法观察到Y*i,于是我们用自评健康题目S来测量,请被访者评价自己的健康水平,答案从1“非常不健康”到5“非常健康”,最终得到的观测值是一个取值范围1-5的整数Yis。个人遵循以下公式将潜在的Y*i转译为Yis:

普通的潜在分类模型会假定所有被访者采用同样的分界点(thresholds),表现在Logit/Probit等模型中所有分界点值为常数,然而实际中不同人群会因为各种原因而采取不同的分界点,从而低估或高估自己的实际健康水平。

图1 以常见的自评健康五分李克特量表为例,展示了回答异质性的一种情况。左侧箭头竖轴代表潜在健康水平,越向上代表越健康。与A相比,

图1 五分类自评健康的回答类别异质性

B在每一类别都采取了更高的分界点(即τBk>τAk,k=1,2,3,4),假设A与B的实际健康水平都位于S1的位置,但由于分界点的差异,A的自评健康为SA1“非常健康“,而B回答的自评健康却为SB1“健康”。显然,图中所展示的由不同分界点带来的回答异质性若不进行处理,则会使所发现的群体间自评健康的差异充满噪音,使得其可信性受到威胁。目前测量及纠正自评健康回答异质性有两种方法,其一是获得尽可能客观的健康测量,计算自评健康与客观健康指标间的差值,作为回答异质[17]。另一种方法就是近十几年来兴起的锚点情境法[28]。通过请被访者同时评判个人和情境中主人公的健康水平,借用多层次定序Pro⁃bit模 型(Hierarchical Ordered Probit Model,HOPIT),允许自评健康的每一个分界点随被访者的一些特征而变化,从而达到纠正回答异质性问题的目的。图2在图1的基础上展示了锚点情境法的基本原理。如前所示,因为某些原因,B比A在评判自身健康时更加“悲观”,表现在其采取了更高的分界点标准,因而,尽管潜在健康水平一致,B给出的自评健康水平却比A更低(SA>SB);同样,这种“悲观”也体现在对两个锚点情境中主人公(甲和乙)健康水平的评价上,尽管锚点情境的健康水平在设计上被假定对于A和B是相同的,但B对甲和乙健康水平的评分也比A更低(甲A>甲B,乙A>乙B)。尽管如此,A与B都正确地给出了情境设计所期待的排序,甲比乙更健康。基于此,第三个轴将B的情境得分“拉到”A得分的同样水平,得出不受回答异质性影响的观察。B的自评健康高于甲(SB>甲B),而A则处于甲乙之间(乙B>SA>甲B),因此B比A更健康。

如上所述,锚点情境要有效运作,需要满足两个测量条件:(1)情境等价性(vignette equvalence),即所有被访者对于同一个情境所反映的潜在水平都有同等认识,任何潜在水平的差异都仅归结为随机测量误差[28];(2)回答一致性(response consis⁃tency),指被访者在评价自身状况和锚点情境中主人公状况时采取同样的分界点[28,37,38]。

三、数据与变量测量

(一)数据简介

本文使用的数据是2014年中国劳动力动态调查(China Labor-force Dynamics Survey,CLDS),该数据是由中山大学社会调查中心收集的跨学科大型追踪调查。CLDS2014的样本覆盖了中国29个省市(除港澳台、西藏、海南外),调查对象为样本家庭户中的全部劳动力①包括年龄15~64岁的家庭成员,以及65岁以上但访问时仍有工作的家庭同住成员。。该调查采取了多阶段、多层次与劳动力规模成比例的概率的抽样方法,最终收集了包括401个社区,14 214个家庭中的23 594个劳动个体样本。本文使用的是CLDS2014中的两组关于自评健康的锚点情境测量、被访者的自评健康、疾病史、迁移历史以及社会经济人口等基本信息。我们将模型所涉及的任何变量存在缺失的个案进行逐条删除后,得到的分析样本量为19 871。

图2 使用锚点情境评分来纠正自评健康的回答类别异质性

(二)变量测量

为了同时检验“健康迁移选择”假设及“疾病回迁”假设,本文将比较四类迁移群体的自评健康水平。此外,在上述比较的基础上,借助锚点情境对已有发现进行调整,观察在纠正回答异质性后,已有研究中的发现是否仍然存在。

迁移地位:使用被访者的当前户口、长期居住地(居住时间超过6个月)、是否有过外出务工(跨县流动半年以上)经历三个变量构建以下4个迁移群体:(1)乡城流动人口:指户口性质为农业,长期居住地为城镇的被访者;(2)农村留守居民:指户口性质为农业,长期居住地为农村且从未有过外出务工经历的被访者;(3)返乡移民:指户口性质为农业,曾经有过外出务工经历,但目前长期居住地为农村的被访者;(4)城镇居民:指户口性质为非农,且长期居住地为城镇的被访者。分析样本中,乡城流动人口占比14%,农村留守居民占比42%,返乡移民占比15%,城镇人口占比29%。

自评健康:被访者被要求评估自己的健康状况如何,答案使用的是5分李克特量表,从1(非常健康)到5(非常不健康),为了方便解释,我们进行了反转编码,得分越高代表越健康。

自报健康状况指标:为了对锚点情境法的测量假设之一—回答一致性进行检验,我们还纳入了若干较为客观自报健康指标,包括:(1)未患慢性病(1=未曾患有任何以下慢性疾病:结核、哮喘、慢性阻塞性肺病、高血压、冠心病、中风/脑梗、肝炎、糖尿病、遗传病、癌症,0=其他);(2)近期未有伤病(1=被访者上两周未有过伤病,0=其他);(3)近期未有身体疼痛(1=被访者上一月从未有过身体疼痛,0=其他);(4)非肥胖(1=BMI<28,0=其他)。

其他控制变量:包括在已有研究中被证实与迁移地位和健康都有显著相关的变量:教育年限、2013年家庭年收入(取对数)、婚姻状况(1=已婚,0=其他)、年龄及性别;健康行为变量,包括抽烟(1=当前抽烟,0=其他)、饮酒(1=当前饮酒,0=其他)、身体锻炼(1=当前有规律锻炼,0=其他)。最后,考虑到我国健康水平及人口流动的地域性差异,我们将被访者现居省份归为东中西区域,在模型中进行控制。

表1 展示了分析样本的主要特征在不同迁移群体中的分布。从自评健康来看,有70%的乡城流动人口认为自己当前“健康”或“非常健康”,而回答同样项目的比例对于农村留守人口仅为64%,对返乡移民为63%。这种差异从一定程度上体现了“健康移民”的现象。各种社会经济人口指标上,不同迁移群体也体现出显著的差异。尽管乡城移民的平均教育年限和平均家庭收入都低于城镇人口,但却显著高于农村留守人口和返乡移民。此外,乡城移民与他们的农村同伴比起来更可能单身、更年轻。在健康风险行为上,我们发现返乡移民比起其他群体更可能抽烟、喝酒及进行更少的规律锻炼。当然,以上观察仅基于单变量描述,为了排除其他相关因素的影响,我们在下文将进行多元变量分析。

表1 分析样本主要特征的基本统计值(N=19 871)

四、锚点情境测量及核心假设检验

锚点情境测量:CLDS2014除了收集被访者的自评健康外,还请他们对两个情境中的主人公的健康水平进行了评价①为了降低操作成本,这两道情境题目仅由随机抽出的25%被访者回答。根据已有研究结果,通过对基于20%-30%的被访者的情境回答进行外推(extrapolation),能得出与全样本情境回答基本一致的调整结果(Xu and Xie,2016)。。情境题目如下:

导语:现在我给您说几个有不同程度健康问题的人。我想知道您怎么评价他们的健康状况。请您想象这些人和您具有相同的年龄。

情境一:赵刚/王丽走200米路毫无困难。但走完一公里或爬完几层楼后,会觉得累。他/她的日常活动没有问题,比如从市场上买完菜拎回家。他/她每月都有一次头痛,吃药之后会有所缓解。头痛时,他/她能继续做日常工作,您认为,赵刚/王丽的健康状况如何?

情境二:李斌/张兰腿肿得很厉害。因为感到腿沉重,所以在家走动都很费劲。他/她的膝盖、肘部、腰部和手指都有疼痛,而且疼个不停。他/她吃药以后会减轻,但走路、拎东西和举东西仍然吃力,您认为李斌/张兰的健康状况如何?

对于情境的回答类别与自评健康一致,也是5分的李克特量表,从1(非常健康)到5(非常不健康),同样为了解释方便,我们进行了反转编码,得分越高代表越健康。以上两个情境的简短描述中涉及到健康的两个主要维度:行动能力和疼痛水平,按照设计,情境一比情境二主人公更健康。在实际操作中,导引语会请被访者想象主人公和自己拥有同样的年龄,在情境出现时使用和被访者同性别的名字,这些操作的目标都是为了促进回答一致性,即使被访者在进行自评和对情境评价时使用同样的标准。

如前所述,锚点情境法有效运作需满足情境等价性和回答一致性两个测量假设。接下来,我们对这两个假设进行正式的检验。第一步,先考察是否所有被访者对于情境一和情境二有一致的认识。根据已有研究[27][28][33],表2列出了两个情境健康水平得分的百分比。整体而言,被访者能够较清楚地识别情境一的健康水平相较情境二更高,有超过60%的人评价情境一主人公的健康水平为“一般”或更高,而对于情境二,仅有不到24%的人认为其反映的健康水平为“一般”或更高。这种整体顺序比较的方式的优点是简便直观,但由于未能反映个体层面评判顺序与预期相合的程度,只能作为情境等价性假设的初步检验。我们因此进一步检验个人特征是否会显著影响其对于两个情境的评分顺序[39]。以个人对两情境的评分顺序是否满足设计顺序为因变量(1=情境1评分大于情境2;0=情境1评分小于等于情境2),个人经济及人口特征作为自变量,拟合Logit模型,结果如表3所示。除了返乡移民相对于乡城流动人口更可能给出与情境设计顺序相合的评分,以及东部居民比西部居民的评分顺序更可能与设计一致外,个人的其他特征均对于两个情境评分的顺序是否与预期相合没有显著影响。这说明情境等价性假设部分被证实。为了避免估计结果受那些不符合情境等价性假设个案的影响,我们采用已有研究的方法,在下文涉及锚点情境的分析中仅使用那些顺序相合的个案[33][40]②有64.6%的被访者给出了顺序相合的评分,进入下文分析。。

表2 自评健康锚点情境评分分布:CLDS2014(N=5 966)

第二步,借用问卷收集的更为客观的自报健康状况指标,我们检验回答一致性假设是否成立。回答一致性假设要求被访者在评价自我健康和情境主人公健康时采用同样的分界点,即一个“悲观”的自评者,同样也是一个“悲观”的评价他人者。遵循已有研究的做法[30],我们考察在控制一系列较为客观的自报健康指标后,情境评分与自评健康评分的相关度。如表4所示,在控制一系列自报健康状况后,情景评分越高,个人自评健康得分也显著地越高。这说明被访者倾向于使用类似的标准来评价情境和自我状况,因而回答一致性假设得到验证。在对两个锚点情境的测量假设进行检验后,我们将进入主要结果部分,借助锚点情境得分来考察已有研究中发现的迁移地位对自评健康的影响是否受回答异质性的影响。

表3 被访者个人特征对锚点情境顺序相合的影响:Logit估计(N=5 025)

表4 情境评分及自报健康指标对自评健康的影响:序数Probit估计(N=5 966)

五、结果

(一)基线模型:乡城移民更健康?

首先,本文的第一个目的是考察在未考虑回答异质性之前,乡城流动人口是否更加健康?这也是已有关注城乡迁移与健康的文献的核心模型[10,17,18]。以五分自评健康作为因变量,我们共拟合了三个序数Probit嵌套模型:(1)模型1仅包含迁移地位一组变量,考察乡城迁移对自评健康的总效应;(2)模型2在模型1的基础上增加了被访者的社会经济人口特征,以及居住地分类,考察迁移地位的效应有多少是通过个人特征解释的;(3)模型3在模型2的基础上再增加了被访者的健康风险行为。结果如表5所示,模型1同时证实了“健康迁移选择”机制和“疾病回迁”机制:作为参照组的乡城流动人口的自评健康要比农村留守人口和返乡移民都显著地更高;然而,在模型2加入了被访者社会经济人口特征后,农村留守人口相对于乡城流动人口的健康劣势消失,说明留守人口比乡城移民自评健康更低主要是由于前者年龄更大、教育水平更低、家庭年收入更低。相反,即使增加了一系列的个人特征控制,返乡移民相对于乡城流动人口的自评健康仍然显著地更低;(4)模型3在2的基础上又增添了健康风险行为变量,结果与模型2基本一致。需要注意的是,表5的三个模型都假定所有被访者在自评健康时采取了一致的分界点,体现在表下部的四个分界点为常数。然而,如前文所述,不同群体常因社会、经济、甚至是心理等因素会采取不同的分界点,这种面对统一量表而体现出来的回答异质性会混淆实质性的发现。所以,本文接下来借助锚点情境评分,以模型3为基准来测量并纠正自评健康的回答异质性。

(二)测量回答异质性:不同迁移群体的自评健康分界点一样么?

在满足情境等价性和回答一致性的前提下,任何在情境评判上的异质性都可以归结为被访者的回答异质性。由此,表6展示了检验迁移地位及被访者个人特征对分界点异质性的影响。在未调整回答异质性前,采取更高(更低)的分界点将会使被访者低估(高估)其本身实际的健康水平。在非平行移动假设条件下,不同迁移地位的被访者体现了一定的回答异质性。具体而言,相对于乡城流动人口,返乡移民在最低端两个分界点采取更高的标准,因而倾向于低估其真实的健康水平。此外,随着教育年限的增高,被访者也越可能发生分界点向上位移的情况。这与已有研究的 发 现一 致[29][33]。当前有规律锻炼身体的被访者相比于其他人的自评健康分界点显著地向上位移,因而会低估同样水平的真实健康状况。同样,居住在中部和东部的被访者也比西部地区被访者更加“悲观”,采取更高的分界点。其他统计上不显著的系数说明被访者的在这些特征上不存在回答类别异质性。尽管如此,因为不同迁移群体显示出一定程度的回答异质性,就说明仅基于对自评健康的回归结果可能会得出受回答异质性影响的有偏估计。因而,我们需要考察在纠正回答异质性后的迁移地位的健康效应。

表5 迁移地位对自评健康的影响:序数Probit估计(N=19 871)

表6 由锚点情境估计的分界点:非平行移动假设下的序数Probit估计(N=3 254)

(三)纠正回答异质性:迁移地位对自评健康的影响

HOPIT模型通过允许自评健康的每个分界点随个人特征而变化来纠正回答异质性的影响。将表6计算得到的自评健康分界点在各个群体的变化纳入后,我们得出了与传统模型不同的结论。表7第一列展示的是表5的模型3,即使用传统方法的发现:在控制了被访者的社会经济人口特征及健康风险行为后,只有返乡移民的自评健康比乡城流动人口更低。第二列是纠正了回答异质性的结果,返乡移民相对于乡城流动人口的负向效应明显缩小并变得不再显著。这说明之前发现“返乡移民比乡城流动人口的健康更差”的现象可能并非是对疾病回迁假设的验证,而是由于前者比起后者在自评健康时更可能采取更高分界点,因而低估其实际健康水平的结果。

在纠正了这种回答异质性后,返乡移民与乡城流动人口之间的自评健康水平不再有显著差异。其他调整前后发生显著变化的变量还包括教育年限、婚姻状况、锻炼以及居住区域。我们看到,因为更高教育、常锻炼以及居住在中部和东部的被访者在回答自评健康时都倾向于采取更高的分界点,由此低估实际健康水平,从而造成了系数的有偏估计。如果未纠正上述回答异质性,教育年限、已婚、规律锻炼以及居住在东部和中部地区对自评健康的正向效应将会被低估。因此,基于锚点情境法的HOPIT模型能够较为有效地帮助纠正不同群体在自评健康时的回答异质性,从而得到更准确的迁移地位对自评健康的估计。

表7 个人特征对自评健康的影响:序数Probit估计及HOPIT估计(N=19 871)

六、结论及讨论

我国的乡城移民作为有史以来规模最大的人口迁移现象产生了多方面的社会影响。其中,最为学界和政策界关注的是迁移经历对个人身心健康的影响。然而,大量基于自评健康等主观健康测量的研究因为受回答异质性的影响,仍未能对迁移地位对健康的实质性影响作出可信的结论[6]。基于跨国迁移的研究揭示了“健康移民”的现象,指出在健康迁移选择和疾病回迁两种机制共同作用下,移民比起流入地和流出地人口都要更健康。然而,就我国的乡城迁移与健康的关系而言,结果却并不一致。主要差异体现在采用自评健康的研究和客观健康测量的研究上。本文提出主观回答异质性作为解释机制,特别是在针对自评健康的测量上,不同迁移群体可能因为各种社会或心理原因采取显著有差异的分界点,从而造成自评健康指标的群际不可比性,混淆了迁移与自评健康指标之间的关系。

本文借助锚点情境法,通过对全国代表性的CLDS2014数据进行分析,展示了不同迁移群体的确在面对统一的自评健康回答时采取了不同的分界点,从而影响了实际的发现。具体而言,返乡移民相对于乡城流动人口在评价自身健康状况时采取更高的分界点,从而倾向于低估其实际的健康水平。因此,在纠正这种回答异质性后,原本发现的返乡移民相对于乡城流动人口对自评健康的显著负向效应极大缩小,变得不再显著。除此以外,我们还发现回答异质性问题也在不同程度上影响了教育、是否规律锻炼以及居住地区等变量对于自评健康的效应。

客观的体测健康指标由于成本高,技术要求严格,很难广泛应用于社会人口调查中。然而,社会科学家常采用的主观健康指标却可能存在回答异质性的问题,因而所得出的结论仍有待检验。锚点情境法作为一种简便易行,成本经济的方法为研究者纠正及处理回答异质性提供了良机。当然,该方法的测量假设检验以及具体情境的编制等方面仍然有很大发展空间,本文只是一个初步尝试,进一步探索不同迁移群体在自评健康时为何会产生回答异质性,以及这种回答上的偏误对于研究及政策上的意涵有赖于学界更多的智识及努力。✿

猜你喜欢
分界点锚点被访者
被访者驱动抽样法在中国退役运动员群体调查中的应用
基于NR覆盖的NSA锚点优选策略研究
关注特殊值,巧解一类导数压轴题
5G手机无法在室分NSA站点驻留案例分析
5G NSA锚点的选择策略
人物新闻采访报道应用情感引导的策略分析
怎样确定含参二次函数问题中分类讨论的“分界点”
5G NSA组网下锚点站的选择策略优化
找分界点思想在一类导数题中的应用
一个保洁员的生活