张良勇 闫晓铭 魏超男
(河北经贸大学数学与统计学学院,河北 石家庄 050061)
随着收入和消费水平的提高,人们对健康服务的需求越来越高,特别是许多中高收入人群对健康管理、健康促进和健康咨询方面的需求越来越多。2013年国务院发布《关于促进健康服务业发展的若干意见》(以下简称《意见》)提出,各地要把发展健康服务业放在重要位置,要在切实保障人民群众基本医疗卫生服务需求的基础上,充分调动社会力量的积极性和创造性,着力扩大供给、创新发展模式、提高消费能力,促进基本和非基本健康服务协调发展。为贯彻落实《意见》,全国各地相继出台了相关实施意见。利用各省区市出台并实施具体方案五年后的健康服务业数据,对全国各省区市健康服务业发展水平进行深入研究,提出科学合理的建议,是促进我国健康服务业蓬勃发展的关键。
健康服务业是涵盖医疗服务及其他与医疗相关行业的综合性产业,这一概念最早由美国学者Engel(1999)[1]提出。DeVol和 Koepp(2003)[2]首次提出“健康集”概念,用来反映美国城市健康医疗产业的空间集聚程度。陈建伟(2013)[3]认为健康服务业主要包括医疗服务、健康管理与促进、健康保险以及相关服务四大板块,四大板块的良性互动是健康服务业发展的关键。邢伟(2014)[4]认为健康服务业和健康制造业共同组成健康服务业。肖月和赵琨等(2014)[5]在构建经济收益分析模型时,对健康服务业的不同层级进行划分,并测算了健康服务业的发展规模,认为未来整个青岛地区的支柱性产业之一是健康服务业。韩德民和卢九星等(2017)[6]以健康服务业的概念和发展特征为切入点,对我国健康服务业的发展现状和目标定位进行讨论。姜庆丹和张思文(2021)[7]等立足辽宁中医药健康产业发展现状和区位特征,分析辽宁中医药健康产业发展面临的新机遇和区位优势,提出中医药健康产业规模化、专业化、标准化、集群化、多元化水平尚待提高。从上述文献可以看出,多数学者对健康服务业的分析采用文献整理、调研、访谈等定性研究的方法,而对健康服务业发展水平的定量分析研究较少。
基于此,运用因子分析和聚类分析对全国31个省区市的健康服务业发展水平进行统计分析。因子分析是一种降维、简化数据的技术,即将大量的变量或样本进行分类,使其可以用几个综合指标来表示。聚类分析是通过数据建模简化数据的一种方法,其目的是通过把原来的对象分成相似的组,来获得数据的某种内在规律。
本文借鉴健康服务业相关文献以及其他类型的服务业发展水平评价体系,结合全国健康服务业的实际情况,选取具有代表性和科学性的指标,建立较为合理的健康服务业评价指标体系,对全国31个省区市健康服务业水平进行研究和分析,找出存在的不足,并提出合理的建议。
结合《意见》中给出的健康服务业定义以及其发展的实际情况,并参考信息服务业,科学研究、技术服务业等服务业发展水平指标体系,确立健康服务业评价指标体系。选取发展基础、产业规模、发展投入、产业投入产出四个维度构建评价指标体系。共选取20个指标,如表1所示。
表1 健康服务业发展水平评价指标体系
本文使用2019年数据,数据主要来源于《中国统计年鉴》《中国第三产业统计年鉴》《中国卫生统计年鉴》,缺失值及异常值通过取平均值获得。
使用SPSS25.0对数据进行处理和分析,并计算出综合因子得分,从而对我国健康服务业发展水平进行分析。
1.适用性检验
首先进行KMO检验和Bartlett’s球形检验,利用SPSS软件的相关运算,结果如表2所示。
表2 KMO和Bartlett's检验
根据表2可知,KMO检验的结果为0.774。根据度量标准,大于0.5。Bartlett’s球形度检验中P值为0.000<0.01,说明指标间具有较强的相关性。所选数据可以通过因子分析对全国健康服务业发展水平进行评价。
表3为公因子方差表,其中提取栏为各因子未旋转的公因子方差,除卫生总费用占GDP比重外,其余值均大于0.7,说明每个指标的信息量提取都较高。
表3 公因子方差
2.公因子个数确定
使用主成分分析法进行因子提取,根据表4可知,共提取出三个公因子,方差贡献率分别为48.094%、26.801%、10.841%,累计贡献率为85.736%,大于85%,说明公因子可以很好地反映样本信息。
表4 总方差解释
3.公因子命名
从表5可以看出,公因子 F1在 X2、X5、X7、X8、X9、X10、X13、X14、X17、X18、X19、X20上的因子载荷系数较大,主要反映健康服务业产业规模及发展效益水平,将其命名为规模效益因子。公因子 F2在 X1、X3、X4、X6、X12、X15、X16上的因子载荷系数较大,主要反映健康服务业发展的基础环境,将其命名为发展环境因子。公因子F3在X11的因子载荷系数较大,主要反映基本医疗保险覆盖程度,将其命名为保险覆盖因子。
表5 旋转后的成分矩阵
4.公因子得分
根据表6计算健康服务业发展水平各因子得分,公因子 F1,F2,F3表达式分别为:
表6 成分得分系数矩阵
计算综合得分时分别选择三个公因子自身的方差贡献率为权重,并对权重进行单位化。因此,构建因子分析综合评价函数为:
根据公式计算出全国各地区因子得分及排名情况如表7所示。从规模效益因子看,排名前五的分别为江西、上海、重庆、天津、山西,分布在中东部地区。发展环境因子排名前五的分别为北京、浙江、江苏、湖南、上海,主要分布在东部、南部沿海地区。贵州紧随其后排名第6,而贵州的规模效益因子排名19,处于中下位置。这说明虽然从全国范围看贵州的健康服务业发展并不优秀,但该产业的发展基础环境较好,未来有很大提升空间。从保险覆盖因子看,排名前五的分别是北京、天津、吉林、新疆、山西,主要位于北部地区。新疆虽然位于西北地区,但其各因子排名较为均衡且不低,保险覆盖因子排名更是居第4位,可以看出新疆的健康服务业发展水平一直稳步提升。从综合因子得分看,排名前十的地区存在重视健康服务业规模及投入产出,轻视健康服务业发展的基础环境以及城镇社会保险覆盖面提高的问题。而西北地区健康服务业发展水平处于劣势。同时,云南和青海的发展基础环境排名虽位于中游,但其在规模效益以及社会保险覆盖面方面较其他省区市有明显不足。
表7 我国健康服务业因子得分和排名
(续表)
以全国31个省区市三个公因子及综合因子的得分作为变量进行系统聚类,结果如图1所示。
图1 谱系图
将我国健康服务业发展水平分为4类,记为A、B、C、D。其中A类包含6个,B类包含7个,C类包含10个,D类包含8个。具体结果如表8所示。
表8 聚类结果
对聚类结果进行单因素方差分析,结果如表9所示。其中p值均小于0.05,均显著。
表9 类均值
对所得结果进行个案汇总,得到表10。
表10 个案摘要
根据表8和表10的结果,健康服务业发展水平最高的均位于沿海地区,突出特点为发展环境因子得分最高,保险覆盖因子得分极低。第二梯队主要位于中部地区,突出特点为规模效益因子和保险覆盖因子得分最高且相差不大,而发展环境因子得分较低。第三梯队主要位于东北和西南地区,突出特点为保险覆盖因子得分较高。第四梯队主要位于西部地区,突出特点为三个公因子得分均低于平均水平。
通过两种分析方法,可以看出我国健康服务业发展水平较好的地区主要集中在沿海地区。其发展环境因子排名第一,主要是由于沿海地区交通便利,经济发展快,对健康服务业基础环境建设的关注较其他省区市在时间上更超前,对健康服务业的投资力度更大。而这些地区的居民,其生活水平较高,对健康的追求更高,因此健康服务业的产出也更多。而发展水平位于中上游的省区市更加关注健康服务业的投入产出而忽视了基础环境建设的重要性,其发展环境因子得分均低于平均水平。发展水平位于下游的省区市,其公因子得分均低于平均水平,其中发展环境因子得分较其他两个因子得分较高。可以看出这些地区对基础环境建设有所关注,但仍然不够。根据上文分析可以看出,加大健康服务业的投入产出是提高健康服务业发展水平的关键。
因此,对于健康服务业的发展,投入产出是关键。政府应加大支持力度,发挥政府的推动作用,完善健康服务业财政扶持政策。对于发展水平比较差的地区,可以适当增加对健康服务业的投入,并发布适合本地健康服务业发展的政策意见,以提高其行业产出,促进健康服务业科学稳定发展。健康服务业发展较好的地区应将关注点转移到健康服务业基础环境建设上来,培养和引进优秀人才,提高基层卫生行业人员待遇;加强信息化建设,构建互联网医疗云平台,普及电子病历。