普通话能力对流动人口健康的影响:来自CGSS的经验证据

2020-05-28 01:30刘国辉单宝刚张卫国
关键词:回归系数普通话农民工

刘国辉 单宝刚 张卫国

一、问题的提出

健康是人类安身立命之本,影响着劳动者的劳动力市场表现,对于城市外来流动人口特别是农民工而言,尤为重要。但是现实生活中,农民工的健康状况并不乐观。在当前提倡“全民健康”社会背景下,农民工健康问题愈发突出,不仅涉及公共卫生,俨然成为一个亟待解决的社会问题。

关于农民工健康,大量文献围绕其影响因素而展开,取得了不少成果。综合来看,相关的讨论涉及了教育、社会资本、工作时长、工作类型、居住条件、工作环境、家庭交流、社会交往等诸多方面。如,黄乾利用上海、天津等五个城市的调查数据,发现教育及社会资本会对农民工健康产生积极影响(1)黄乾:《教育与社会资本对城市农民工健康的影响研究》,《人口与经济》2010第2期。。李珍珍、陈琳利用江苏和浙江农民工的调查数据,发现性别、教育、工作时长、工作类型、家庭负担等会对农民工健康产生影响(2)李珍珍、陈琳:《农民工健康状况影响因素分析》,《南方人口》2010第4期。。此外,也有研究表明,居住条件、工作环境、家庭交流、社会交往等同样能够影响农民工的健康状况(3)俞林伟:《居住条件、工作环境对新生代农民工健康的影响》,《浙江社会科学》2016第5期。。

总之,作为一个较为新颖的切入点,从语言能力的角度来研究思考流动人口健康正日益得到国外研究人员的关注。国内方面,相关研究往往是把语言和健康作为两个独立事物,对它们在农民工城市融入中所扮演的角色和作用进行分别讨论,关于语言能力与健康水平关系的研究还十分少见。

基于2013年中国综合社会调查的微观数据,研究了普通话能力对流动人口(农民工)健康的影响及其群体差异。研究发现,普通话能力与农民工健康水平存在着显著的正相关关系,同时二者关系存在着异质性。在克服了可能存在的内生性问题后,上述结论依然稳健。本文可能的贡献在于:第一,通过识别农民工的普通话能力与其健康水平之间的关系,增强政府和相关部门对语言能力经济社会效应的认识,为解决农民工健康问题提供较为新颖的切入点;第二,研究考察农民工群体的普通话能力和健康水平关系的异质性,可以更加精准地维护农民工的健康权益,有助于实现健康的人口城市化;第三,从提升农民工语言能力、提高健康水平等角度为推动流动人口的社会融入提供借鉴,有利于解决农民工流动过程中出现的农民工难题,对推动农民工社会融入、建设和谐经济社会也具有重要的现实意义。

二、模型、变量与数据

(一)模型构建与变量选择

以农民工健康作为被解释变量,农民工普通话能力作为核心解释变量,将影响健康的其他因素作为控制变量引入模型,由此建立计量模型对普通话能力与农民工健康的关系进行实证分析。

Healthi=β0+β1mandarini+λXi+εi

(1)

其中,Healthi为农民工的身体健康情况,i表示个体,mandarini代表个体的普通话能力,Xi是影响农民工健康的一系列控制变量,εi为误差项。

被解释变量:农民工健康水平。在CGSS 2013问卷中,体现健康水平的问题为“您觉得您目前的身体健康状况是怎样的”,因此借鉴以往研究的通用做法,选取自评健康作为衡量农民工健康的标准。

核心解释变量:农民工普通话能力。具体从听和说(“普通话听辨”[ML]和“普通话表达”[MS])两个方面进行衡量。普通话听辨和表达能够基本反映特定个体普通话的真实水平,良好的普通话能力既需要能听懂、理解对,也需要能说出口、表达正确。在CGSS 2013调查中,通过向被调查者询问“您觉得自己听普通话的能力是什么水平”和“您觉得自己说普通话的能力是什么水平”,让其根据自己的普通话听说水平进行评级,评分越高表明其普通话水平越高。

控制变量主要包括工作特征变量及个体特征变量等。工作特征变量主要包括工作时长、工作年限、劳动收入等。工作时长是指每周累计工作的时间,工作年限则指截至被访日累计参加工作的年数,工作时间越久、工作年限越长,更容易引发劳累,也加大了职业病及其他伤害发生的可能性,同时累积的工作压力也可能越大。劳动收入是指通过工作等途径获得的全年劳动收入情况,收入的高低能够影响是否有足够的经济基础获得医疗援助及保健等。为了控制个体特征可能对健康水平产生的影响,本文还引入了性别、年龄、婚姻情况、受教育年限等个体特征变量。其中,性别、年龄、婚姻情况是较为常见的个体特征变量,指标上的差异会影响健康水平的差异。受教育年限能够反映被访者的教育程度,而教育程度能够对农民工的健康情况产生影响(8)黄乾:《教育与社会资本对城市农民工健康的影响研究》,《人口与经济》2010第2期。。

需要指出,CGSS 2013问卷中关于健康的问题选项包括“很不健康”“比较不健康”“一般”“比较健康”“很健康”五个层级,是离散变量且存在明显的由低到高排序。因此,在具体的计量回归上,我们按照经验采用了有序的Probit模型来估计普通话能力和健康关系。

(二)数据及描述性统计

数据选取自中国综合社会调查项目课题组公开发布的2013年微观调查(CGSS 2013)。在样本主体的选取上,我们参考既有文献的做法,将“农民工”的定义为:十八周岁以上、六十五周岁以下,具有农村户口、在城市从事非农工作的“广义农民工”群体。在对缺失值进行筛选和剔除后,本文累计有效的农民工样本数量为1613个。

各变量的描述性统计如表1所示。可以发现,对于被解释变量(被访农民工自评健康)的均值为4.129,直观数据反映多数农民工认为自己处于相对健康的状态。从普通话听辨和表达水平来看,样本中的农民工认为自己的普通话听辨水平优于普通话表达水平,其均值分别为3.864和3.235。整体而言,多数农民工认为自己的普通话能力一般,仍有较大的提升空间。从个体特征变量统计来看,样本中的农民工群体多数为男性,这也与农民工从事的工作性质密切相关。年龄平均值在39.219岁,大多数已婚,绝大多数为汉族农民工。受教育年限平均值为9.18,相当于初中毕业水平,受教育程度较差。

表1 变量定义及描述性统计

续表1

变量变量说明均值标准差最大值最小值婚姻未婚=1;其他=00.1190.32410民族汉族=1;其他=00.9210.26810受教育年限年9.1803.237190工作特征:工作时长每周工作时长(小时)56.43017.0411122工作年限累计工作年数(年)12.1069.288471劳动收入对“全年总收入”作对数处理10.0130.77411.6956.684

注:CGSS 2013问卷关于受教育程度问题的选项为当前最高教育程度(从“未接受过教育”到“研究生及以上”),我们对其分别赋值相应的受教育年限。

三、实证结果与分析

(一)普通话能力对农民工健康的影响

1.基于有序Probit模型的基准回归结果。表2汇报了基于有序Probit模型普通话能力对农民工健康影响的初步结果。我们使用了嵌套模型形式在方程中依次加入个人基本特征和工作特征等控制变量,第1-3列为普通话听辨的结果,第4-6列为普通话表达的结果。可以看出,各组方程中年龄与农民工健康显著地负相关,说明年龄越大的农民工身体健康状况越差。年龄的增大会带来身体机能的下降,加重各项疾病的发生率,这符合人们普遍的生理规律。

在不加入工作特征、职业、行业和地区变量之前,性别、受教育年限对健康变量亦有影响(见第2、5列),但加入上述变量之后,性别、受教育年限,回归系数变得不显著,这说明性别、受教育年限对农民工健康的影响可能是通过工作特征(如劳动收入)等其他渠道产生的。具体的工作特征方面(见第3、6列),周工作时长和工作年限的回归系数符号为负,虽然统计上不显著,但说明工作时间越长,农民工健康有下降的趋势。全年劳动收入的回归系数显著为正(1%的统计水平上显著),说明收入越高,农民工接受医疗救助和医疗保障的可能性相对较大,同时也会加大对健康的重视程度,越有利于维系健康。

在本文最为关心的语言能力方面,可以看到在依次加入控制变量之后,普通话听辨和表达的回归系数相应地有所下降,但它们对农民工自评健康的影响在各个方程中都显著为正(均在1%统计水平上显著)。因此,有证据表明农民工的普通话听辨和表达能力均能够对其身体健康情况产生积极作用,即普通话听辨和表达能力越好的农民工,其身体健康状况也表现得更好,这也与国外既有文献的研究成果相吻合。

表2普通话能力对农民工健康的影响(有序Probit模型的估计结果)

续表2

解释变量(1)(2)(3)(4)(5)(6)(7)个体基本特征性别0.1061*(1.85)0.0909(1.50)0.1048*(1.80)0.0615(0.96)0.1031(1.55)年龄0.0160***(5.16)0.0149***(4.04)0.0162***(5.12)0.0142***(3.82)0.0145***(3.82)婚姻0.128(1.29)0.131(1.25)0.1318(1.33)0.127(1.26)0.128(1.22)民族0.227**(2.23)0.187*(1.82)0.214**(2.11)0.173*(1.69)0.187*(1.82)受教育年限0.0163*(1.73)0.0133(1.23)0.0205**(2.13)0.0124(1.19)0.0112(1.02)工作特征周工作时长0.0017(1.03)0.0015(0.95)0.0017(1.04)工作年限0.0047(1.26)0.0044(1.18)0.0048(1.30)全年劳动收入0.133***(3.01)0.139***(3.15)0.130***(2.94)其他职业控制控制控制行业控制控制控制地区控制控制控制N1613161316131613161316131613

注:括号内为t值,*、**、***分别表示在10%、5%、1%的水平上显著。

第7列汇报了一个比较有趣的现象。当普通话听辨和表达同时放入模型时,二者的回归系数较之前又有明显的下降,但是只有普通话听辨的回归系数统计上是显著的,而普通话表达的系数变得不再显著。这意味着相对于普通话表达而言,普通话听辨在维系农民工健康水平过程中扮演着更重要角色。可能的解释是:农民工的工作性质决定了他们大多数时间更需要听从管理指令,很少发表自己的看法,那么他们极有可能把这种语言习惯带到了求医问药的健康管理过程中,导致听辨对其健康的影响会更明显。无论怎样,以上实证结果表明:农民工的普通话能力对其自评健康水平具有显著的影响。

2.考虑内生性问题的工具变量回归。上文中我们采用了有序的Probit模型考察了普通话能力对农民工健康的影响,但回归中有可能存在着一定的内生性问题,其来源与方程中可能的遗漏变量、测量误差以及语言能力和健康之间反向因果关系等问题相关,进而导致回归结果存在偏误。为克服上述问题,最有效的方法是工具变量估计。不过,计量研究中合适的工具变量普遍难找,对于语言与健康关系研究更是如此。

表3普通话能力对农民工健康的影响(有序probit IV的估计结果)

续表3

解释变量(1)(2)(3)个体基本特征性别0.1033 (1.56)0.0988 (1.50)0.1062 (1.60)年龄0.0147*** (3.88)0.0137*** (3.60)0.0134*** (3.55)婚姻0.140 (1.34)0.140 (1.33)0.137 (1.30)民族0.139 (1.13)0.154 (1.24)0.139 (1.12)受教育年限0.0100 (0.89)0.0106 (0.94)0.0084 (0.74)工作特征周工作时长0.0016 (0.96)0.0014 (0.85)0.0016 (0.96)工作年限0.0045 (1.25)0.0041 (1.11)0.0047 (1.27)全年劳动收入0.130***( 2.95)0.136*** (3.09)0.128*** (2.90)其他职业控制控制控制行业控制控制控制地区控制控制控制corr(e.ML,e.Health)0.0060.043corr(e.MS,e.Health)0.0010.005N161316131613

注:方程1中Ⅳ为同一地市级层面除受访者自身之外其他农民工普通话会听的平均水平和农民工个人的听英语的能力;方程2中Ⅳ为同一地市级层面除受访者自身之外其他农民工普通话会说的平均水平和农民工个人的说英语的能力;方程3中的Ⅳ包含了方程2和4的Ⅳ。括号内为t值,*、**、***分别表示在10%、5%、1%的水平上显著。

一般而言,工具变量的选取需至少满足以下三个条件:第一,它要与所替代的随机解释变量(即模型中的内生变量)高度相关;第二,要与被解释变量不相关;第三,要与模型中其他解释变量以及随机误差项不相关。按照这一原则,我们首先选取了农民工听英语和说英语的个人能力水平分别作为其普通话听辨和表达的工具变量。具体原因如下:第一,英语能力和所替代的解释变量——普通话能力密切相关。它们都是语言能力,都需要后天习得而来,很大程度上体现了劳动者的认知能力,二者具有很强的相关性。这符合工具变量选取的第一个条件。第二,英语能力与被解释变量——农民工健康水平无关。虽然有研究表明英语能力在我国具有较高的经济回报(9)刘国辉、张卫国:《中国城镇居民英语能力的经济回报率研究》,《云南师范大学学报(哲学社会科学版)》2015年第6期。,可以提高劳动者的工资收入,但一般作用于非农民工样本。由于农民工的工作性质、居住环境等因素,农民工在工作和生活中几乎使用不到英语,英语能力对农民工的收入和健康不会产生影响。我们利用本文样本数据对农民工英语听、说能力和健康关系进行了估计,发现英语听说能力的回归系数均不显著。这与我们的判断基本一致,即没有证据表明农民工英语听说能力与其健康存在关联。这与前面第二个条件相一致。第三,英语能力与模型中的其他解释变量以及随机误差项无关。因此,将农民工听英语和说英语的能力作为其普通话听辨和表达的工具变量满足工具变量选取的基本条件。

其次,借鉴了使用更高层级的变量作为低层级变量的工具变量的思路,与赵颖的研究相类似(10)赵颖:《语言能力对劳动者收入贡献的测度分析》,《经济学动态》2016第1期。,我们把同一地市级层面除自身外其他农民工语言能力的平均水平作为工具变量。它也基本满足上述所列举的工具变量选取的三个条件。具体地,首先我们将普通话听话和表达“一般”以下定义为不会听和不会说,之上定义为会听和会说。然后,将同一地市级层面除受访者自身之外其他农民工普通话会听的平均水平作为普通话听辨的工具变量,将同一地市级层面除受访者自身之外其他农民工普通话会说的平均水平作为普通话表达的工具变量。

针对不同的因变量形式,内生自变量的工具变量回归有多种形式(如,因变量为连续变量的二阶段最小二乘法,因变量为0和1离散变量的Logit/Probit工具变量估计,等等),但是本文因变量为有序的离散变量,上述传统工具变量回归方法均无法正确地估计出其结果。为解决这一问题,我们采用了含有内生协变量的有序Probit估计方法(ordered probit with endogenous covariates,以下简称有序Probit Ⅳ估计。具体见Stata软件第15版的扩展回归模块[ERM])。该方法同时汇报了一阶段回归方程残差项和主方程残差项相关性的估计结果。根据Stata官方的帮助说明文件,当两个方程残差项相关性的估计结果的p值统计上显著(小于0.1),即接受“回归方程存在内生变量”的原假设,同时说明所使用的工具变量及方程回归结果有效,由内生性问题造成的主方程估计偏误得到纠正。

表3汇报了采用有序Probit Ⅳ估计的工具变量回归结果。我们看到表格下方一阶段方程残差项与主方程残差项相关性的p值均小于0.1,说明我们的工具变量回归结果有效。分别对照表2第3、6、7列的有序Probit模型回归结果,可以看出使用工具变量前后普通话听辨和表达的估计系数在符号方向和统计显著度上基本保持不变。唯一的差别在于,工具变量法得到的系数较之前的回归结果稍稍偏大。出现此种结果的原因可能在于,回归中一些向下的衰减偏误超过了那些因遗漏变量或者反向因果造成的向上偏误。事实上,这种情况并非个案,此现象出现于国内外劳动经济研究的众多文献中(11)Chiswick B., Miller P., The Economics of Language: International Analyses, London: Routledge, 2007.。这也说明我们之前使用有序Probit模型估计出来的结果可能偏低。

(二)普通话对农民工健康影响的群体差异

值得注意的是,农民工群体具有较强的异质性,那么语言对农民工健康的影响会随着农民工群体的异质性而变化吗?为更好地把握农民工语言能力和健康水平的关系,有必要对普通话对农民工健康影响的群体性差异做出进一步的考察。

1.男女农民工的差异。社会语言学认为,语言学习具有性别差异。这种差异不只在第二语言(外语)的学习上,也存在于对母语的学习、理解和使用上。一般来说,女性的语言能力往往要强于男性。我们对本文男女样本事先做了统计,也确实如此。女性农民工普通话听辨和表达能力的均值比男性均值分别高出0.11和0.21。因此,我们首先对男女农民工普通话能力与健康关系进行了分析。这里采取了与前文相同的模型和方法,对男女农民工样本进行了分别回归,结果见表4。第1-2列为普通话听辨的结果;第3-4列为普通话表达的结果;第5-6列为普通话听辨和表达同时放入方程的结果。其中,有序Probit Ⅳ估计结果的一阶段方程残差项与主方程残差项相关性的P值均小于0.1,说明本表工具变量回归结果是有效的。

续表4

注:本表各个方程均包含了表3模型中的所有变量,第2、4、6列方程所使用的工具变量也与表3中相同。限于篇幅,这里只给出了普通话能力的回归系数。括号内为t值,*、**、***分别表示在10%、5%、1%的水平上显著。

从表4可以看出:第一,无论是普通话听辨还是普通话表达,总体上它们对男女农民工健康都产生一定的影响。简单地从回归系数上看,普通话听辨对女性农民工健康的影响大于男性农民工。然而,普通话表达则恰好相反,它对男性农民工健康的影响大于女性(见第4列有序Probit Ⅳ估计结果)。这种现象可能的解释是,绝大多数农民工在城市中经济社会地位低下,社会网络和交际渠道狭窄,对外交流的机会少。而相对于城市居民,农民工思想保守,男主外、女主内的传统观念让女性农民工与外界的交流更少。即使外界有交流,相对于男性,女性农民工更多的是陪同和倾听,说的机会也很少。在这种情形下,女性农民工听普通话的能力显得格外重要。同理,相对于女性,男性农民工说普通话的能力尤显重要。因此,女性农民工普通话听辨能力和男性农民工普通话表达能力成为“稀缺”资源,它们对健康的影响自然增大。

表4第6列有序Probit Ⅳ回归结果进一步证实了上述推断。当普通话听辨和表达同时放入方程时,女性农民工样本普通话听辨的回归系数大于男性农民工样本的系数(均在1%的统计水平上显著),但她们普通话表达的回归系数统计上不显著,而男性农民工普通话表达的回归系数则是显著的(5%的统计水平),这说明拥有较强普通话表达能力的男性农民工和拥有较强普通话听辨能力的女性农民工更容易融入城市生活之中,更加适应身份和地域的转变,也更容易接受到良好的医疗保障和救助。

续表5

解释变量(1)有序Probit(2)有序Probit Ⅳ(3)有序Probit(4)有序Probit Ⅳ(5)有序Probit(6)有序Probit Ⅳcorr(e.MS,e.Health)0.0960.202N107510751075107510751075Panel B:新生代民工普通话听辨0.291***(4.66)0.541**(2.11)0.278***(4.62)0.350**(2.02)普通话表达0.278***(3.94)0.364**(2.31)0.054(0.91)0.182*(1.71)corr(e.ML,e.Health)0.0000.000corr(e.MS,e.Health)0.0010.000N538538538538538538

注:关于变量说明,同表4。括号内为t值,*、**、***分别表示在10%、5%、1%的水平上显著。

2.新生代和老一代农民工的差异。年龄是影响健康的一个重要因素。我们需要对不同年龄层次的农民工普通话能力与其健康关系进行考察。但是受本文有效样本量的限制,如果将年龄按以往研究那样分为18-29岁、30-39岁、40-49岁、50岁及以上等不同的年龄组,一些分组中样本量过小,将不具有统计上的意义。随着时代发展和环境变化,农民工群体发生代际更替和内部分化,出现了“新生代农民工”和“老一代农民工”两个群体,农民工的代际差异问题也日益成为研究的热点之一。因此,我们退而求其次,将农民工的年龄异质性分为新生代农民工和老一代农民工。根据当前学术界的共识,以1980年为限,此前出生的农民工被视为“老一代农民工”,此后出生的则为“新生代农民工”(12)王春光:《新生代农村流动人口的社会认同与城乡融合的关系》,《社会学研究》2001第3期。。代际差异是客观存在的,由于出生年代和社会背景的不同,不同的代际群体无论是价值观,还是态度反应、行为偏好,都存在一定的差异。研究新老农民工群体在语言能力和健康水平上的代际差异,可以更好把握农民工在社会融入中的特点和发展趋势。表5汇报了新老农民工子样本的回归结果。

我们看到,无论是有序Probit模型估计,还是有序Provbit Ⅳ估计(其一阶段方程残差项与主方程残差项相关性的p值均小于0.1,工具变量回归结果有效),结果都显示普通话能力(听辨和表达)对新老农民工健康产生显著性影响。同时,各个方程中新生代农民工普通话听辨和表达的回归系数都超过老一代农民工的系数。特别地,在将普通话听辨和普通话表达放入同一方程的有序Probit Ⅳ估计结果中(见表5第6列Panel B),新生代农民普通话表达回归系数也是显著的。这与表4女性分样本的回归结果相类似。前面提到,新生代农民工出生于1980年之后,他们较老一代农民工接受了更好的普通话普及教育。在日常生活中新生代农民工会更容易或更熟练地运用普通话来扩大交际网络,可以利用自己的普通话优势接受更好的医疗,进而获得更好的身体健康水平。这进一步验证了普通话能力越高,农民工健康状况越好。

四、关于普通话与农民工健康关系的逻辑讨论

前面我们发现,有证据表明普通话能力更好的农民工会拥有更好的健康状态。那么,其背后有怎样的机理或传导路径?这里有必要做进一步的讨论。

我们知道,语言是人们交流思想、表达情感,维系生产生活最基本的工具,它在流动人口的社会融入中发挥着不可忽视的作用。在国外较为成熟的移民社会融入研究及语言经济学研究中,语言常常被视为决定劳动者就业、工资收入及社会经济地位的重要因素之一。那么,语言对流动人口健康产生影响,很大程度上要归因于语言的交际作用和人力资本价值。

五、结论

利用CGSS 2013的微观数据,采用有序的Probit模型回归和含有内生协变量的有序Probit估计方法,研究考察了普通话能力对农民工健康的影响。我们发现,在控制了性别、年龄、民族、受教育年限、工作经验、劳动收入以及职业、行业和地区等个体及区域层面因素后,普通话能力(听辨和表达)与农民工健康水平之间存在着正相关关系。在分样本回归中,我们还发现在增强自身健康方面,听普通话的能力对于女性农民工贡献更大,而说普通话的能力对于男性农民工的贡献更大;同时,有证据表明相对于老一代农民工,新生代农民工能更好地利用普通话优势获得更佳的健康。在克服了可能存在的内生性问题后,结论依然稳健。

在当前人口流动性愈发增强的背景下,克服语言障碍对于加强农民工健康服务具有重要的现实意义。普通话作为国家的通用语言,与其他方言和少数民族语言相比,具有更强的交际作用和人力资本价值,可以通过帮助农民工改善医患沟通、扩大社会关系网络、提高经济社会地位以及减少压力与歧视等提高他们的健康水平。当前我国脱贫攻坚正进入决胜时刻,国家积极倡导包括语言扶贫、健康扶贫在内的全方位扶贫举措,从这个意义上讲,个体劳动者要增强语言能力意识,有关管理部门要树立语言服务健康的意识,国家则有必要继续强化普通话推广和相关培训工作,充分发挥语言的经济社会价值,服务健康,服务经济社会发展。

猜你喜欢
回归系数普通话农民工
2021年就地过年农民工达8 700多万
“点对点”帮2万名农民工返岗
以农民工欠薪案“两清零”倒逼发案量下降
我是中国娃爱讲普通话
基于生产函数模型的地区经济发展影响因素分析
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
农民工眼中的大树
17
城镇居民收入差距主要因素回归分析