王 桥,张展新
(中国社会科学院 人口与劳动经济研究所,北京 100028)
近年来,在人口老龄化和城市化提速、养老服务业加快发展的背景下,有关城市养老服务的研究文献不断增长,其中很多使用定量方法,通过抽样调查获取数据。这一势头总体来看是好的。城市是老年人口聚集的地方,在老龄化和城镇化的背景下,城市的老人比例还会增长。城市的社会化养老服务资源也更为集中,代表着养老服务业的发展方向。因此,加强城市养老意愿定量研究的意义重大。从理论上说,量化分析能够增强养老意愿研究的科学性。从实践角度来看,基于抽样调查的研究成果能够为城市养老服务政策的设计与改进提供重要的辅助信息。高质量的城市养老意愿定量研究还可以提供一个比较研究的平台,促进这一领域的地方性学术与政策研究的交流。
但是到目前为止,城市老人养老意愿的定量研究尚未很好地发挥其应有的学术和政策功能。主要原因是,相当多的定量研究所依托的抽样调查设计存在明显的缺陷。一是调查样本的代表性问题。一些调查完全没有考虑随机性,因此所获得的样本质量不高;一些调查使用整群抽样方法,不能保证老年样本的随机性。这都使得样本代表性差,统计分析的结果不够可靠。二是调查研究的总体缺位。除了少量研究,大部分抽样调查没有明确地界定和描述总体。这样,即使抽样遵循了一些规范性要求,也难以摆脱两点不足:样本生成的统计量不能用于估计对应的总体参数;样本分析导出一些因果性关系,但可直接推断的具有这样因果性关系的空间范围不明。上述两大问题限制了这一方向定量研究的学术价值和政策意义,特别是降低了对城市政府养老服务决策的参考意义。
本文以这两类问题为切入点,将城市老年人口抽样调查设计和机构养老意愿因素分析结合起来展开研究。首先,详细解析抽样调查的样本代表性和研究总体缺位的问题;在此基础上,提出一个以中心(主)城区为研究总体的城市老年人养老服务调查设计思路;接下来,描述和讨论长春中心城四区抽样调查数据;最后,依托该数据,聚焦老年人入住机构养老意愿的影响因素,进行Logistic回归分析。
老年人口抽样调查已经成为养老意愿研究的最具普遍性的数据来源。有一些基于全国性抽样调查数据的养老意愿文献*姜向群等:《影响我国养老机构发展的多因素分析》,《人口与经济》,2011年第4期。*聂爱霞等:《老年人养老意愿影响因素研究——基于2011年中国社会状况调查数据分析》,《中国行政管理》,2015年第2期。*山娜等:《老年人眼中的养老院:现状与出路——基于老年人需求层次和社会分层理论》,《调研世界》,2016年第9期。*张郧,黄晓瑞:《机构养老服务需求影响因素的实证研究》,《统计与决策》,2016年第4期。。但是,更多研究使用了地方性调查数据,以城市老年人口抽样调查数据为主。城市调查数据包括来自一省或两省的多城市调查*戴卫东:《老年长期护理需求及其影响因素分析——基于苏皖两省调查的比较研究》,《人口研究》,2011年第4期。*田北海,王彩云:《城乡老年人社会养老服务需求特征及其影响因素——基于对家庭养老替代机制的分析》,《中国农村观察》,2014年第4期。*张瑞玲:《城市老年人机构养老意愿研究——基于河南省12个地市的调查》,《调研世界》,2015年第12期。,单个城市的抽样调查更多*焦亚波:《上海市老年人养老意愿及其影响因素》,《中国老年学杂志》,2010年第19期。*肖云等:《高龄老人入住养老机构意愿的影响因素研究——以重庆市主城九区为例》,《西北人口》,2012年第2期。*何英等:《贵州省城市居民养老机构入住意愿及影响因素》,《中国老年学杂志》,2013年第21期。*李敏:《社区居家养老意愿的影响因素研究》,《人口与发展》,2014年第2期。*张争艳,王化波:《珠海市老年人口养老意愿及影响因素分析》,《人口学刊》,2016年第1期。*蔡婷等:《厦门市老年人文化程度对养老意愿的影响》,《中国老年学杂志》,2016年第15期。。还有少量在城市的一个市辖区的调查*张文娟,魏蒙:《城市老年人的机构养老意愿及影响因素研究——以北京市西城区为例》,《人口与经济》,2014年第6期。*张鹏:《家庭照料能力与机构养老意愿实证分析——基于苏州市相城区52373位老人的调查》,《当代经济》,2016年第16期。。从现有文献来看,城市老年人养老意愿定量研究主要关注老年人的基本情况、健康状况、家庭条件、社会经济地位等因素的影响,但实证研究的结果差异很大。例如,有学者考察了城市老年人机构养老影响因素的文献,发现不同研究的结论“存在诸多的冲突和矛盾”*张文娟,魏蒙:《城市老年人的机构养老意愿及影响因素研究——以北京市西城区为例》,《人口与经济》,2014年第6期。。这不利于不同研究的对话与研究成果的整合。造成这种局面的原因很多,例如上述学者注意到,社区环境等因素没有引入调查研究。但是,研究发现之间的差异如此之大,一些老年人口抽样调查设计不规范、调查数据没有达到统计推断的基本要求可能是主要原因。
一个问题是,相当多老年人口调查样本的代表性差。可能在研究设计时规范性不足,一些调查没有报告所使用的抽样方法。有的研究使用“滚雪球”式或其他类型的非随机抽样方法来获得调查数据。有些调查使用整群抽样方法,获得少量社区数据;但是,由于城市辖区和社区的异质性,整群抽样方法不能保证老年样本的随机性。样本的代表性差,不仅反映在抽样方法上;一个直接证据是,在老年人口性别结构指标上,样本均值严重偏离总体均值。在一个城市,老年人口性别比的一般规律是低于100,即女性老年人略多于男性老年人,而且高龄组的性别比更低。根据2010年人口普查数据,全国60岁及以上的老年人口性别比为96.1,北京略低于这一水平,为91.2*测算使用的相关数据来自《中国2010年人口普查资料(上册)》,北京:中国统计出版社,2012年版。。但是,个别调查的老年人口样本性别比远远大于100。例如,一项重庆市调查数据的80岁及以上高龄老年人样本中,女性只占42.1%。与此形成对照,一些调查的老年人口样本性别比则过低。例如,在西安获取的一项调查数据中,60岁及以上老年人口样本性别比只有75;一项厦门市调查数据中,60岁及以上老年人口样本性别比低于60;济南的一项调查数据中,老年人口样本性别比只有53。用这样的数据推断城市老年人口性别比,无论是城市的一个区还是更大的空间,都会产生明显的偏误。
另一问题是,多数抽样调查没有明确的研究总体。抽样调查设计的首要问题是界定研究总体。明确研究总体,才能设计合理的抽样方案,以评估其代表性,对数据分析结果进行科学的统计推断。就城市老人抽样调查而言,需要事先明确,研究所涉及的空间范围是整个城市,还是城市某一区域的老年人口?对此,使用城市调查数据的多数研究没有明确、严谨的表述。某些研究者或许认为这无关紧要。有的城市老年人口研究在介绍所使用的调查数据时,一开始就引用该城市的市域指标,似乎把市域当作总体。但实际上,在大多数情况下,一项城市调查不可能以整个城市市域为研究总体,因为这有调查成本过高和其他问题。
上述调查设计问题限制了城市养老意愿研究的政策影响力。老年人口调查数据应该从两方面影响地方决策。一是用样本统计量来推断总体参数,提供全面可靠的城市老年人口信息。二是分析样本的统计相关性,进而推断总体中的因果关系。具体到养老意愿,就是要用样本来推断,总体中影响养老意愿各种因素的作用方向与程度。在样本代表性差、研究总体不明的情况下,单纯依赖对调查数据的统计描述或分析,所获得的结果可能背离现实。
样本代表性差和研究总体缺位这两个问题,后一个似乎不如前一个明显,但实际上更具有基础性。获得高质量的调查样本,研究总体的明确界定是基本前提。城市研究总体的界定既不能忽略,也不可简单化。原因是,这涉及到复杂的城市体制,关乎抽样调查的科学性和可操作性。
在中国,“城市”通常是一个包括城乡的行政区划,而不是完全城市化的区域。中国城市的空间范围是什么,这可以有不同的术语和解释,包括市域、市区、城区、中心(主)城区。市域是指一个城市政府的全部行政辖区,包括城市的建成区和农村区域。一个典型的地级市市域包含市区、县域和县级市市域,市区由全部市辖区构成。与市域、市区、县域这样的行政区划不同,城区是统计上的一个概念*2006年12月发布的《统计上划分城乡的规定》中,关于城区的条款是:“城区是指在市辖区和不设区的市,区、市政府驻地的实际建设连接到的居民委员会所辖区域和其他区域”。参见国家统计局网站:http://www.stats.gov.cn/statsinfo/auto2073/201310/t20131031_450613.html。。特别需要指出,国务院于2014年发出通知,新的城市规模划分标准以城区常住人口为统计口径*《国务院关于调整城市规模划分标准的通知》(国发〔2014〕51号)。参见国务院网站:http://www.gov.cn/gongbao/content/2014/content_2779012.htm。。这就是说,一个城市的规模等级并不涉及所辖市域的全部人口数,而是由市区中的城区常住人口决定的*计算地级市城区的常住人口,应该不包括代管的县级市城区常住人口,否则县级市就无法单独计算其城市规模。。中心城区或主城区是城市规划中使用的概念,通常出现在各个城市的总体规划之中,指包含了市政府驻地、集中体现城市政治、经济、文化功能、集中连片的核心区域*在各个城市的总体规划中,“中心城区”和“主城区”都有使用,但以前者为多。。由于其城市形态的完整性和主导性,在各个城市的总体规划中,中心城区或主城区往往被视为独立的最高城镇等级。一个城市中,已经建成的中心城区或主城区的面积一般要小于城区面积,原因是后者可能包括核心区之外的小块、零散城区。综上所述,在一个地级市或地级以上城市,存在着这样的递进包含关系:
市域⊃市区⊃城区⊃中心(主)城区
下面,以长春市为例做一说明。按照2008年公布的《长春市城市总体规划(2010-2020年)》*参见道客巴巴网:http://www.doc88.com/p-955217471692.html。,市域范围为长春市行政辖区范围,包括长春市区和榆树、农安、德惠、九台4个县(市),面积20604平方公里,2008年总人口数为752.5万*九台市于2014年12月改为九台区,即成为长春市区的一部分。。长春市区面积3616平方公里,人口360.8万(2008)*此时,市区由朝阳区、二道区、绿园区、宽城区、南关区和远离中心城区的双阳区六个市辖区组成。。规划的中心城区指长春市的五区(朝阳、二道、绿园、宽城、南关)范围内49个街道和其他一些零星的地区,总面积610平方公里*按照最新的城区定义,长春市的城区在市区之内,但包含着中心城区。。图1和图2分别是长春行政区划图和标有中心城区的长春市城市总体规划图。
图1 长春行政区划图 资料来源:百度图片https://image.baidu.com/
图2 长春市城市总体规划图资料来源:百度文库https://wenku.baidu.com/view/46c8a4ddce2f0066f53322ca.html
按照上述关于中国城市界定的一般性讨论和长春市实例,城市老人养老意愿调查的研究总体选择可以有多个,包括市域、市区、城区、中心(主)城区和单个的市辖区。一个城市的老年人口调查,单纯从可操作性来看,在一个市辖区做抽样最好,但是单个市区的“特色”可能影响研究结论的一般性。抽样调查覆盖整个市域或市区,调查成本会很高,还有一个区分城乡的问题。相比之下,以中心(主)城区为研究总体是一个更为可行的选择。原因如下:
第一,由于集中体现了城市的政治、经济、文化功能,中心(主)城区具有综合性和主导性,是研究制定老年人口政策、配置老年服务资源的主要平台。
第二,中心(主)城区通常包括大面积的旧城,是城市老年人口集中居住的区域,可以获得代表性老年样本。
这是在中心(主)城区展开老年人口调查的一个独特理由。比较两类特殊的调查对象:城市就业人口和外来人口。城市的就业人口调查有必要考虑各种类型的开发区,而这类开发区往往位于中心(主)城区的周边;城市外来人口调查需要覆盖这一群体聚居的城郊村落或农村工业化新城,这类地区很可能在中心(主)城区之外。
第三,由于集中连片,中心(主)城区的抽样调查成本相对较小。
一个城市的城区除了中心(主)城区,还有与城市中心较远的市辖区城区。如果城市调查覆盖全部城区,将大大提高调查成本。
第四,由于代表了城市老年人口和老年服务业的主体特征,不同城市的中心(主)城区具有可比性,获得的数据支持老年人口的城市比较研究。
最后一点隐含着这样的意义:与单一的市辖区调查比较,中心(主)城区调查具有城市比较这一优越性。
中国社会科学院人口与劳动经济研究所“我国养老服务体系与政策研究——吉林省长春市调查研究”课题组于2016年8月-10月,在东北师范大学人文学院以及当地有关机构的配合下,在长春市中心城区组织了老年人口抽样调查。该抽样调查的第一步是,根据调研目标和可利用资源,界定研究总体。首先,获取长春中心城四区(朝阳、二道、绿园、宽城)常住老年人口的汇总数据(细划到社区)。作为中心城5区之一的南关区没有获得相关的基础数据,因此该区没有纳入调查研究。然后,做四城区社区的选取:只选择街道的居委员会社区,排除镇和个别街道下辖的行政村。最后,界定本研究的总体:中心城四区184个社区60岁及以上常住老年人,总计22.44万。
中心城四区老年人口汇总数据(基于调查实际覆盖范围计算)显示了的两项重要结果。第一,中心城四区人口老龄化水平存在明显差异(表1),二道、绿园相对“年轻”。第二,中心城四区所辖社区的老龄化率差异非常大。朝阳区常住老年人口比重最大的社区为34.57%,最小为11.60%;二道区常住老年人口比重最大的社区为15.30%,最小为7.16%;绿园区常住老年人口比重最大的社区为17.78%,最小为2.77%;宽城常住老年人口比重最大的社区为21.99%,最小为2.77%。这是两个简单的描述性结果,但可以引申出两点重要的研究启示:第一,在单个城市辖区做老年人口调查,其研究结果可能带有一定的特殊性,所获取的数据不能直接做城市层面的统计推断;第二,在少数城市社区来获取老年人口样本,数据的代表性问题可能会更为严重,以至于导出完全偏离城市主体特征的结果。
表1中心城四区常住人口、老年人口及百分比、老龄化率
城区常住人口老年人口百分比老龄化率(%)朝阳区5702748941739.815.68二道区3084403113113.910.09绿园区5457604964522.19.10宽城区4236455427424.212.81总 计1848119224440100.012.14
表2中心城四区老年样本分布
城区频率百分比累计百分比朝阳区2004040二道区601252绿园区1202476宽城区12024100总 计500100
长春中心城四区抽样调查的第二步是选取城市老人个人样本。我们使用PPS方法,从184个社区中,抽选25个调查社区,每个调查社区随机选取20位老人,最后形成500个等概率随机样本的调查数据(抽中概率2.23‰)。调查样本的区际分布如表2所示。按照表1和表2的比对,中心城四区老年人口总体和样本的区际分布非常接近。
在中心城四区总样本中,本市非农、本市农业、外地非农、外地农业的老人总体比例分别约为74%、18%、8%、4%。但是,分区样本均值显示了很大的差异,个别区获取的全是本市非农样本。一个可能的原因是,在长春市,基层社区的老年人统计方法不同:一些社区只有本地户籍人口的老人名单,而其他社区的大都统计了常住老年人口。鉴于调查数据全样本可能存在偏差,我们将把描述和分析的重点放在本市非农户籍的老人样本(接近全样本的3/4)上面,推断长春市本地城市老人的机构养老意愿。这样的研究聚焦,还有关于稳定性的考量:本地城市老人过去在长春工作,现在住本市,将来也要在本地养老,因此他们的养老意愿具有稳定性,其影响因素更容易观测。
本调查通过不同的提问方式,获得两种机构养老意愿。
一是单选项提问获得的养老意愿。问卷问题为“您是否愿意选择老年服务机构”。本市非农户籍受访老人中,36.6%受访者回答“愿意”。
二是多选项下的养老意愿。问卷问题为“您认为比较理想的养老方式是那种?”答案选择为六项:(1)自己或与配偶单独居住生活;(2)与儿女共同居住;(3)社区日间照料;(4)与孙子女共同居住生活;(5)入住养老机构;(6)其他。本市非农户籍受访老人的9.98%选择第五项,即向往入住养老机构。
问卷问题的不同操作获得的养老意愿差别很大。单选项养老意愿可能带有更多的随意性。多选项养老意愿的测定给出了多个答案,供受访者比较、选择,在这种条件下,回答“入住养老机构”应该更为真实反映老人的心愿。另外,从其他养老意愿研究的成果比较来看,36.6%的机构养老意愿明显太高,而10%的机构养老意愿比例与大部分其他调查结果接近。
因此,在回归分析中,将同时以单选项测定的养老意愿和多选项测定的养老意愿为因变量建立模型,但以多选项机构养老意愿分析重点。
参照现有研究,我们选择四类自变量。第一,个人特征,包括性别、婚姻和学历。第二,家庭特征,包括居住状况和子女数。第三,自评健康状况。第四,社会经济状况,包括养老金水平、养老金类型和退休前的职业地位。这些变量都采取分类变量的形式,最终转换为虚拟变量,以进入回归分析模型。表3报告了自变量的类别和基本统计描述。本表显示,男性和女性样本比较接近;测算的样本性别比为98.9。
表3 自变量统计描述
注:国家机关、党群组织、企事业单位负责人和专业技术人员为中高端职业,其余(办事人员、商业服务业人员、工人及其他)为低端职业。
表4报告了对样本机构养老意愿的Logistic回归分析结果。模型一以单选项测定的机构养老意愿为因变量;模型二以多选项测定的机构养老意愿为因变量。表3列出的所有自变量纳入回归模型。同时,还把中心城四区转换成四个虚拟变量,作为控制变量纳入回归。
表4 机构养老意愿的Logistic回归系数
注:***p<0.001,**p<0.01,*p<0.05
表4列出了每个回归模型的两种伪确定系数(-2LL和Cox & Snell R2)。模型二的-2LL值明显小于模型一的对应值;模型二的Cox & Snell R2取值明显大于模型一的相应取值。两个比较都说明,模型二与模型一相比,其拟合情况明显更好。另外,在模型一中,绝大部分自变量的回归系数都不具有统计显著性,包括受教育程度、居住方式等;而在其他研究文献中已经发现,这些变量对于选择入住养老机构具有一定的解释力。如此鲜明的对比,间接支持这样一个判断:与多选项测定的机构养老意愿相比,单选项养老意愿的随意性较大,不适合用于养老意愿的测定与研究。
下面讨论模型二的各类回归系数。表4显示,在个人因素这一组变量中,性别、婚姻和年龄的回归系数都不具有统计显著性。有的研究发现是,与低龄老人相比,高龄老年人愿意选择机构养老的可能性明显要低;但是,表4显示,不同年龄组的老年人在选择机构养老上没有显著差异。受教育程度的回归系数具有统计显著性:相对于小学以下的学历,获得小学以上教育老人组选择机构养老的可能性都要高,而且这些老人组之间并没有表现出大的差异。有研究发现,与文盲老人对比,受正式教育的老年人选择养老机构的可能性高,但没有明显的递进关系*张文娟,魏蒙:《城市老年人的机构养老意愿及影响因素研究——以北京市西城区为例》,《人口与经济》,2014年第6期。。这一研究所使用的是北京市西城区(中心城区的一个区)的代表性老年样本,获得的结果可以直接推断该区老人的学历与机构养老意愿之间的因果关系。本研究使用长春中心城四区的代表性样本,获得了与其非常接近的结果。因此,这是一个比较可靠的一般性结论。对此,一个可能的解释是,教育对于选择养老机构的帮助,是提供基本认知,而非更为复杂、划分为不同层次的知识。
按照表4所示,在家庭因素方面,居住方式对养老意愿的影响是:与处于独居状态的老人相比,与子女或孙子女同住显著降低了选择养老机构的可能性,但与配偶同住并无不同的意义。这说明,老年人更重视享受“天伦之乐”。另一方面,与无子女老人相比,多子女老人选择机构养老的可能性不是少了,而是多了。有研究发现,子女越多,提供家庭照料的能力越强,老人更愿意选择在家里养老*张鹏:《家庭照料能力与机构养老意愿实证分析——基于苏州市相城区52373位老人的调查》,《当代经济》,2016年第16期。。本文的发现并不支持这种观点*该研究所使用的数据是在一个城区获得的普查数据,该城区绝大多数老年人为农村户口。因此,这应当是一个新近城市化的区域,该结果可能有农村社区的特殊性影响。。
表4关于个人自报健康的发现是,与健康老人相比,尚能自理的老人选择机构养老的可能性低;但是,部分自理和不能自理并没有带来什么变化。因此,自报健康对于机构养老意愿没有确定的影响方向。这方面的现有研究提供的结果也是多样的。基于北京市西城区调查的研究发现是,身体状况相对差的老人,选择机构养老的可能性较小*张文娟,魏蒙:《城市老年人的机构养老意愿及影响因素研究——以北京市西城区为例》,《人口与经济》,2014年第6期。。但是,这一研究将老年人做“非失能”和“失能”简单两分,其发现具有某种独特性。在这方面,需要更多的具有可比性的研究结果。
表4还显示,经济社会状况,无论是用养老金水平和养老金类型来测量,还是用退休前职业地位来测量,都没有显示出对选择养老机构的影响。这并不是说,收入水平等经济社会地位因素对于养老意愿无关紧要。一个可能的原因是,我们的抽样调查只涉及一般性、意向性的机构养老意愿,并没有考察受访者对不同价位养老机构的实际需求。面对养老意向的一般性询问,有的老人未必有多少理性的计算;本文用不同提问方式观察机构养老意愿,得到差异很大的结果,就间接说明了这一点。如果能够在调查问卷中测度对不同层次养老机构实际需求,有可能发现,收入水平、职业地位等因素有实质性的影响。
上述来自调查样本的结构关于各种因素的分析结果,无论是有显著影响的因素还是没有显著影响的因素,都是对中心城四区本地城市老人总体养老意愿影响因素的直接推断。本调查样本没有覆盖南关区,这是长春市五个中心城区中,唯一缺失的区。虽然没有做到抽样的全覆盖,但是,考虑到已经有四个区的样本,统计分析的结果应该可以用于间接估计长春市整个中心城区本地老人机构养老选择的主要影响因素。
现有的城市老年人口养老意愿定量研究多把重心放在调查数据的统计分析上面,关于抽样调查设计的讨论不多。大部分研究似乎都认为,所使用数据质量不影响分析结果。本文从定量研究的数据问题辨析入手,对于研究总体界定、样本选取和数据分析给予了同等的重视,进行综合探索。我们首先揭示了抽样调查的数据代表性差和总体缺位这两大问题,做了关于城市老年人口调查总体的研讨,剖析、比较了不同的“城市”概念,论证了以中心(主)城区为总体的优越性和可行性。随后,在长春市中心城四区界定了研究总体,获取了等概率样本。在此基础上,对本地城市老年人口样本的机构养老意愿进行了Logistic回归分析。这样,完成了一次关于城市老年人口养老意愿的“全程式”定量研究。
统计原理中的一个基本常识是,抽样调查的主要目的是用样本统计量来推断、概括总体。因此要求,调查样本要具有代表性,统计推断不能超出总体范围。如果样本的代表性差、总体不明,来自样本的统计分析结果可能本身存在偏误,或者推断的范围不准。这样,统计分析的价值和意义就降低了。但是,在城市养老意愿定量研究中,这恰恰是不可忽视的问题。要提高研究质量,增大影响力,必须加强定量研究的前期工作。本研究注重调查总体的界定和样本的选取。由于基础数据获取的困难,我们的研究总体没有覆盖整个长春中心城区,这是一个不足。但是,毕竟建立了调查总体与随机样本之间的对应关系,在前期研究的规范性方面有所贡献。
使用总体明确的城市调查样本统计分析,其结果也有明确的推断范围,可以建构养老意愿城市比较研究的平台,促进分析结果的整合。本文的Logistic回归分析直接推断了长春中心城四区的本地城市老人机构养老意愿的影响因素。分析结果的比较对象,应该是调查总体明确界定、样本质量高的定量研究发现。正是通过这样的比较,对于学历的作用有了初步的共识。比较也显示了一些分歧之处。由于前期工作的粗放型和其他原因,在城市养老意愿文献中,一些“发现”有这样或那样的问题、缺陷,因此目前可比性的研究结果还不多。这呼唤着城市养老意愿定量研究的改进和提升。