基于Logistic回归模型的浙江省健康医保卡用户基本特征的实证分析

2022-03-23 08:04赵辰瑄孔翔严冰悦王志
宁波工程学院学报 2022年1期
关键词:医保卡学历人群

赵辰瑄,孔翔,严冰悦,王志

(宁波工程学院 理学院,浙江 宁波 315211)

0 引言

健康医保卡是一个由电子健康卡和电子社保卡互绑互认、融合而成,集纳了多项看病就医功能的二维码。作为浙江省“最多跑一次”改革医疗卫生公共服务领域延伸、推进政府数字化转型的重要举措。它的出现消除了医院之间的信息壁垒,改变了省市级医保、一卡通相互分离,患者在不同医院就诊时需要分别建档,“多卡并存、互不通用”的现状。

Logistic回归是一个著名的线性分类算法,利用Logistic回归可以将线性回归问题很好地转化成一个线性二分类问题。它通过函数将因变量Y对应一个概率P,然后将其结果间接转化成一个连续变量,从而可以显著降低犯第一类错误的概率,对于用来判别二分类变量问题有良好的效果。由于其算法的简单和高效,Logistic回归模型在实际中应用非常广泛,主要用于各类相关问题的分类和预测。

时至今日,健康医保卡已覆盖浙江省所有11市559家医疗机构,全省领卡人数已超过2 000万,累计用卡近500万次,给居民的日常生活带来了极大的便利。但与其同时,健康医保卡仍存在城乡发展不均衡,老龄人口普及率较低的问题[1]。为使健康医保卡能得到更好的宣传利用,文章通过建立Logistic回归模型对健康医保卡用户的基本特征进行综合分析。关于健康医保卡的发展情况和Logistic模型的更多介绍可参见文献[2-6]。

1 基本特征研究假设

1.1 性别差异与健康医保卡选择倾向

社会性别理论表明,男女两性不仅存在着生理方面的差异,而且在心理发展的许多方面也同样客观地存在着一些差异。比如在情感表达方面,多数女性比男性要含蓄、细腻一些;在性格方面,女性的细致耐心更是一种风格,它体现在情感、认知等各个方面。而男性在其行为中所表露的冲动性与攻击性似乎又更明显一些[7]。因此性别的差异有可能会对健康医保卡的选择倾向产生影响。前期调查的结论也印证了这个观点,被调查者中女性使用过健康医保卡的比例明显高于男性,她们在日常生活中接触健康医保卡的机会更多也更愿意将它推荐给身边的朋友。由此提出以下假设:

H1:性格差异对于是否为健康医保卡用户有着显著的影响。

1.2 年龄差异与健康医保卡选择倾向

年龄分层(Age Stratification)是指社会依据年龄将人口分隔成若干层次并相应规定各年龄层的角色、权利、义务和机会等的过程。年龄分层理论认为,年龄是决定人行为的重要变量,可能限制个体扮演某些角色的能力,决定个体角色类型和可以得到的选择权。年龄将人口分隔为若干年龄层,每个年龄层都有与其相适应的一组角色、权利、机会、责任和义务。社会对各年龄层个体的角色期望亦不尽相同。通过前期的调查发现,中青年是持有“健康医保卡”的主力军,这一类人能在第一时间了解到相关政策的发展和推广,而18岁以下和60岁以上的群体受限于所处环境和对于电子产品的熟悉程度,无法及时跟紧潮流。因而年龄的不同的确使居民对健康医保卡的选择倾向产生了差异。由此提出以下假设:

H2:年龄差异对于是否为健康医保卡用户有着显著的影响。

1.3 月收入差异与健康医保卡选择倾向

凯恩斯的绝对收入理论认为,在短期中,收入与消费是相关的,即消费取决于收入,消费与收入之间的关系也就是消费倾向。同时,随着收入的增加消费也将增加,但消费的增长低于收入的增长,消费增量在收入增量中所占的比重是递减的。相对收入理论则认为,消费者在相对地位上的变化将导致其收入用于消费的部分上升,而不论其绝对收入有否变化,它理论强调消费者的两种心理行为,即攀比效应和示范效应。因此有理由怀疑收入的差异会影响对于健康医保卡的选择倾向。前期的调查结果显示,月收入在6 000~20 000元的被调查者会更多的申办健康医保卡,健康医保卡所具备的功能也较符合这类人群的需求。而月收入在6 000元以下的人群的空闲时间较少,不会花费很多的时间在关注健康医保卡上,月收入在20 000元以上的人群由于收入较高进而健康护理层次也会相应的提高,健康医保卡的功能难以吸引这类人群。由此提出以下假设:

H3:月收入差异对于是否为健康医保卡用户有着显著的影响。

1.4 学历差异与健康医保卡选择倾向

布鲁纳学习理论认为,学习的实质是一个人把同类事物联系起来,并把它们组织成赋予它们意义的结构。学习就是认知结构的组织和重新组织。知识的学习就是在学生的头脑中形成各学科知识的知识结构。这种知识结构是由学科知识中的基本概念、基本思想或原理组成的。知识结构的结构形式是通过人的编码系统的编码方式构成的,并可通过3种再现模式表现出来。学历的高低会影响一个人的认知水平好坏,学历的差异会产生对于健康医保卡的不同看法。通过前期调查可以发现,本科学历及以上的被调查者对于健康医保卡的认可度较高,它们能够迅速接受并使用这一新兴事物,在生活中合理利用给自身带来便捷。而高中及以下学历的被调查者对于健康医保卡仍需要一个适应的过程。由此提出以下假设:

H4:学历差异对于是否为健康医保卡用户有着显著的影响。

2 数据搜集与变量设计

2.1 数据搜集

本次调研采用分区域与分层相结合的随机抽样方法选取调查样本,按照浙江省行政区划选取下辖所有11个市作为样本总体区域,包括:杭州市、宁波市、温州市、绍兴市、嘉兴市、湖州市、金华市、丽水市、衢州市、舟山市、台州市。为保证样本的合理性和代表性,根据不同地级市的常住人口数量(2020)确定层权,将理论样本容量与层权相乘得出所需要的实际样本容量以及各市所需要发放的问卷数量。根据各层分配样本量,再在各层中分别进行简单随机抽样,这样不仅能够降低变异性,也在了解总体内不同层次的情况下具有可以对总体不同的层次或类别进行单独研究的优点。本次调研共发放问卷905份,收回问卷821份,问卷回收率为90.71%,其中有效问卷786份,问卷有效率为95.74%,数据来源具有较好的代表性。对回收的问卷进行编码和录入,进行完整性、一致性、准确性、可靠性审核。信度效度检验结果显示数据真实可靠,可以用于Logistic回归分析。

2.2 数据展示

受访者中,约有51%的受访者为男性,49%的受访者为女性。考虑到样本选取的随机性,根据概率可知男女比例基本上为1:1,因此可认为男女比例是合理的。

受访者在18岁以下的有24人;在18~30岁之间的有157人;在31~45岁之间的有262人;在46~60岁之间的有198人;在60岁以上的有145人。受访者的年龄段主要集中在31~45岁和46~60岁,约占总体样本的一半。这是考虑到该年龄段人群对健康医保卡的使用较多,更了解健康医保卡发展的现状,所以数据真实且具有一定的可分析性。

受访者学历为初中及以下的人数为94人;学历为高中、中专的人数为226人;学历为本科、大专的有402人;学历为硕士、博士的人数为64人。考虑不同学历人群对健康医保卡的接受能力不同,高学历人群占样本总体的多数,可以保证调研结果的准确性和科学性。

受访者月收入在3 000元以下的有61人,月收入在3 000~6 000元的有309人;月收入在6 000~10 000元的有293人;月收入在10 000~20 000元的有89人;月收入在20 000元以上的有34人。考虑到被调查者月收入状况会对健康医保卡的关注度产生一定的影响,因此需要根据收入水平的不同在后续的研究中进行对比分类分析。该样本的月收入分布结构较为分散,可以反映处于不同收入水平个体的想法与意见,因此具有较好的代表性,可以更加准确地推断总体。

2.3 变量设计

依据理论分析涉及的关键研究变量,将第i个个体“是否是健康医保卡用户”这种二元选择行为设置为因变量。当选择“是”时,yi取值为1,当选择“不是”时,yi取值为0。依据研究假设提出的4个观点,将性别、年龄、月收入、学历设置为自变量:x1代表性别,x2-x5代表不同的年龄,x6-x9代表不同的月收入,x10-x12代表不同的学历。分别从性别、年龄、月收入、学历这4个角度考量对健康医保卡选择倾向的影响。

由于本次设置的问卷调查中大量数据为分类资料,例如月收入分成了5档,如果直接编码为5、4、3、2、1,令其作为自变量纳入分析,就等价于是假设这5档间的差距完全相等,或者说对因变量的数值影响程度是均匀的,这样的假设会过于简单武断,与实际情况不符;另外对于无需多分类变量,如由于职业之间不存在数量上的高低,因此不可能为其给出一个单独的回归系数估计值,来表示职业每上升一个单位时因变量的变化趋势。因此本文采用统计上标准的做法,采用虚拟变量进行拟合,然后根据分析结果对模型进行简化。在对基准类的设定上,为方便录入,原则上将最后一个选项设为基准类,当最后一个选项为其他或该选项的被选中频次小于30次时,以倒数第二个选项设定为基准类。具体变量设定如表1所示。

表1 变量设定表

3 实证分析

3.1 模型构建

Logistic回归模型是一种研究二项分类结果与多个互不相关的影响因子(x1,x2,…xn)之间关系的多元统计分析方法。该模型可通过研究滑坡易发性与用户基本特征因子间的关系,预测被调查者是否为健康医保卡用户的概率,其中自变量为用户基本特征因子指标值(x1,x2,…xn),因变量为被调查者是否为健康医保卡用户,分别为1和0。自变量可为连续变量、离散变量或二者任意组合,无需满足正态分布。构建Logistic回归模型如下

式中:P为是健康医保卡用户的概率;α为截距;β为回归系数。P的输出结果是[0,1],为了便于理解与计算,对上式左右两端取自然对数,得线性回归方程如下:

3.2 实证分析

将前期搜集到的数据中的健康医保卡用户群体进行汇总,纳入所有需要考虑的变量,建立二元逻辑回归Logistic模型,拟合模型并估计参数,得到各显著变量的系数估计值、瓦尔德系数和对应P值,具体模型估计结果如表2所示

表2 模型参数估计结果表

针对不同的健康医保卡用户特征,对模型结果进行分析:

1)性别

在0.05的显著性水平上,性别的P值为0.394,未通过显著性检验。这说明在其它条件相同的情况下,被调查者是否为健康医保卡用户这一行为不存在性别差异,即男性与女性对于健康医保卡的选择倾向没有明显的区别。

2)年龄

在设置虚拟变量时,年龄的基础类型为18岁及以下,与基础类型相比,特征年龄(31~45岁)和特征年龄(46~60岁)的系数为正,说明这两个年龄层的人申办健康医保卡的倾向更高。同时这也与职场人士的生活方式及年轻人对新鲜事物的追求和接受程度有关。相对于年长的人,31~60岁的人群可能由于生活方式以及消费理念的不同,对于健康医保卡的敏感度更高,这就使得这类人群成了健康医保卡的主要用户群体。

3)月收入

模型估计结果显示,月收入通过模型系数的显著性检验,这说明月收入对是否为健康医保卡的用户有着显著影响。特征月收入(6 001~10 000元)和特征月收入(10 001~20 000元)的系数较大,且P值小于0.01,这说明这两类月收入人群是健康医保卡用户的概率更高。一般来说,月收入在6 001~20 000元之间的人群具有一定的分析辨别能力,并且健康医保卡所具备的功能也较符合这类人群的需求,所以更多的申办健康医保卡。月收入在6 000元以下的变量不显著,可能是因为这类人群不会花费很多的时间在关注健康医保卡上。月收入在20 000元以上的人群由于收入较高,健康医保卡的功能难以吸引这类人群。

4)学历

模型估计结果显示,学历通过模型系数的显著性检验,这说明个人学历水平高低对于是否是健康医保卡的用户也有着一定影响。其中本科、大专学历的人群显著性最强,它们对于健康医保卡的功能有着更为深入的认识。高中、中专学历的人群对于健康医保卡也有着一定的兴趣,可以通过宣传和普及引导它们下载使用,方便自身。

3.3 卡方检验

利用卡方检验验证性别的影响,建立联立表如表3所示:

表3 性别与健康医保卡用户频数列联表

通过计算可得X2=0.648。当自由度为1,置信区间为95%时,临界值为3.841>0.648。因此假设H1:性格差异对于是否为健康医保卡用户有着显著的影响——不成立。

利用卡方检验验证年龄的影响,建立联立表如表4所示:

表4 年龄与健康医保卡用户频数列联表

通过计算可得X2=29.513。当自由度为4,置信区间为95%时,临界值为9.488<29.513。

因此假设H2:年龄差异对于是否为健康医保卡用户有着显著的影响——成立。

4 建议

通过前期调查,本文提出了影响健康医保卡用户选择倾向的4个假设。结果显示年龄、月收入和学历的差异会显著影响是否为健康医保卡用户的概率,性别则没有明显的影响。根据模型估计结果,女性与男性对健康医保卡的选择倾向无明显差异,年龄在31~45岁的群体对健康医保卡有更深入的了解,月收入为6 000~10 000元的群体会较多地使用健康医保卡,本科、大专学历的群体对健康医保卡的关注度更高。由此得到健康医保卡主要用户的基本特征为:男性及女性,年龄31~45岁,月收入6 000~10 000元,本科、大专学历。

为使健康医保卡能够在浙江省内得到更好的推广,提升在偏远乡镇地区的普及率,让更多的百姓了解使用它,并从中获益,针对不同人群提出以下建议。

(1)根据现有的健康医保卡用户基本特征,在相应的群体中进行内部挖掘,充分发挥潜力。在地铁站、商场等人流较大场所显目位置进行广泛宣传,把握年轻上班族的传播交流能力,使他们能够了解健康医保卡的具体功能和方便之处,进而萌生使用的想法。

(2)研究发现健康医保卡潜在用户的特征为:男性及女性,年龄46~60岁,月收入6 000以下,高中及以下学历。这类人群对于健康医保卡有着较大的需求,生活中经常用到相关功能。但是他们的接受能力和操作能力相对较弱,无法有效地使用健康医保卡,因此针对这类人群需要完善引导措施,发动志愿者上门去传授使用的方法,让他们更好理解相应的功能。

(3)针对偏远乡镇地区,需要政府落实奖励政策,鼓励居民使用健康医保卡,提升普及率。在大众的传播媒体上进行广泛宣传,让更多的人能够知道健康医保卡的存在。

5 结语

本文从浙江省健康医保卡发展不均衡的现状出发,通过搜集现有用户的相关数据,运用Logistic回归模型和卡方检验对健康医保卡用户的基本特征进行了分析。根据实验结果得出主要用户和潜在用户的特征,并分别针对不同的人群提出了使用建议。本研究具有良好的现实意义,也为其他省市推进医保社保体制改革提供了可复制可推广的宝贵经验。

猜你喜欢
医保卡学历人群
学历造假引发法律纠纷
工程师盗刷医保卡变阶下囚
糖尿病早预防、早控制
学历军备竞赛,可以休矣
我走进人群
财富焦虑人群
网友话题下期话题
对冒用医保卡的行为不能“一惩了之”
知识无力感
秘书缘何成为『高危人群』