姜 昊,常 啸
(安徽财经大学 统计与应用数学学院,安徽 蚌埠 233000)
基于Logistic回归分析的城乡高额彩礼研究
姜 昊,常 啸
(安徽财经大学 统计与应用数学学院,安徽 蚌埠 233000)
以安徽省蚌埠市为调查点,建立相应的抽样框,然后利用内曼最优分配确定各层样本量,再采用简单随机抽样技术抽取样本,最后将采集到的原始数据处理后运用SAS软件进行Logistic回归,研究城乡结婚彩礼与哪些因素存在重要联系,进而联系实际对城乡高额彩礼问题进行分析并得出结论。
抽样框;内曼最优分配;原始数据;高额彩礼;Logistic回归
李玲[1]以农村结婚消费为切入点,从符号消费的视角通过对东部地区的农村细致考察,了解农村结婚消费现状,并在此基础上对农村消费行为进行分析,得出消费行为最终是为了其符号意义;葛雅兰[2]和田丰[3]都对农村的高额彩礼现状、产生原因进行了分析,并提出了相关的遏制措施;郭莲纯[4]从婚俗礼仪习俗的角度考察城乡婚俗的变化,进而说明婚俗嬗变的原因,得出近二十年城乡婚俗嬗变主要是由人们婚姻观念的变化、外来文化的入侵以及社会生活的变化造成的;张路等人[5]通过对当前社会男女比例的调查,得出男女比例失调是导致彩礼数额畸形增长的主要原因,并分别对其造成的积极影响与消极影响进行详细分析;孙勇[6]对双方婚约进行研究并对双方解除婚约后财物纠纷如何正确合法处理提出了重要的建议;林云飞[7]对我国中部地区彩礼出现的纠纷诈骗现象进行详细阐述,并提出完善相关法律来遏制上述现象在此出现。由上可知,目前学者主要研究了当前城乡高额彩礼出现的一些表层原因以及高额彩礼带来的一系列社会及法律问题,但是对于彩礼产生的根源,以及哪些因素与彩礼显著相关并对其产生显著影响的研究较少,更加缺少实际量化研究。因此量化研究彩礼产生的深层原因以及其他相关因素具有重要的意义,本文将通过实地调查获取的数据对彩礼现象进行深层挖掘,从而为更深层次的分析打下基础。
自古以来,我国就有男方在婚姻约定初步达成时向女方赠送聘金、聘礼的习俗,这种聘金、聘礼俗称“彩礼”。彩礼是人类社会的一种普遍现象,而且在中国,彩礼可以追溯到周代,并且彩礼是作为确定婚姻关系极其重要的一个仪式,因为一旦接收彩礼,即标志着男女双方的婚约正式成立,然而在当今社会,在我国广大的农村地区,尤其是东北华北地区,婚嫁的彩礼费用以惊人的速度上升,高额彩礼成了人民沉重的负担,彩礼不再单纯是为了确定婚姻关系,而逐渐变成以追求财物为出发点的[2],由上可知,婚姻彩礼可能已经发生变质,因此,研究引发热议的婚姻彩礼与哪些因素相关尤为重要。
为了研究婚姻彩礼的问题与哪些因素相关,笔者选定安徽省蚌埠市所在的城镇和乡村为调查地点,所选地区的所有居民为调查总体,首先根据抽样调查理论[8]设计出本次调查方案,然后通过结合整群抽样、分层抽样和简单随机抽样方法来抽取样本,再采取面访调查中的个别面谈法采集数据,样本具体选取过程如下。
1.抽样框的选定
抽样单位:以安徽省蚌埠市所有居民为调查总体,通过整群抽样选取出蚌埠市区、怀远县、以及其下属龙亢镇和万福镇(隶属怀远县),再采取多阶段分层抽样抽取样本单位:第一阶段以蚌埠市、怀远县城以及龙亢、万福镇为初级调查单位;第二阶段以街道为二级抽样单位;第三阶段以街道的每个村落或每个区为三级抽样单位;第四阶段以每个居民为最终单位。根据这四阶段的抽样,可以建立本次调查的抽样框,抽样框的分布见表1:
表1 抽样框分布
2.样本量的确定
在本次抽样调查中,首先查阅蚌埠市相关资料可得蚌埠市人口大约为380万,进一步可以根据统计学区间估计的知识对本次调查所需调查的样本量进行估计,其样本量计算公式[8]为:
其中,n为纯净样本量,,Zα/2为一定置信度下所对应的临界值(本次取0.05),p为具有某种属性的样本比例(保守估计取0.5),N是总体数目,△p为误差范围(本次取0.05),求得保守估计样本量为:
同时考虑为了减少无效问卷对样本精度的影响,估计问卷有效回答率r为0.65到0.75,得:
综合上述因素,为了使调查结果达到精度要求,同时控制经费在一定范围内,从而发放问卷546份。
进一步计算分层抽样调查的各层所需要的样本量,由于预先了解了各地调查所需的费用高低,由于各调查点区域发展类似,所以各地调查费用没有显著差异,即该分层抽样调查中各层样本量可以由最优分配简化为内曼最优分配方法[8]计算,其计算公式为:
其中,nh是调查各层所需抽取的样本量,n是调查中一共所需抽取的样本总量,Wh是各层的层权,Sh是各层样本的方差,Nh是各层总体的数目,进一步在相关文献中查询各层的层权和各层样本的方差,查阅得到结果见下表2。
表2 各层的层权及方差
得到各层次的样本量分别为106、141、158、143。
各层的人数分布条形图如图1所示:
图1 各层样本的数量
首先,通过面访调查和查阅文献可知,5万是大众所能接受的彩礼的分界点,因此为了研究彩礼价格在5万以下和5万以上这个二分类变量与哪些因素相关,所以选取问卷中“性别、年龄、户籍、是否独生、文化程度、职业、家庭收入”等因素进行分析。由于本次调查的数据(数据来源于全国大学生市场调查大赛)属于分类变量,属于离散型变量,因此对此问题分析需要运用Logistic回归[9]进行分析。
大众所能接受彩礼钱范围可表示为 ;选取性别、年龄、户籍、是否独生、文化程度、职业、家庭年总收入作为影响因素,令它们分别为Xi,i=1,2,…,7 。
Logit变换:通常把出现某种结果的概率与不出现某种结果的概率之比称为比值,即Odds,Odds=π/(1-π),取其对数 ,这就是Logit变换。
令因变量 服从二项分布,其二项分类的取值为0、1,Y=1的总体概率为p,Y=0的总体概率为1-p建立二项Logistic回归模型如下:
logit(p)=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7其中:Y为二分类变量:Y=0代表大众接受彩礼钱5万以下,Y=1代表大众接受彩礼钱5万以上。
X1表示性别:X1=1表示性别为男,X1=2表示性别为女。
X2表示年龄:X2=1表示年龄为18岁以下,X2=2表示年龄为18-25岁,X2=3表示年龄为25-35岁,X2=4表示年龄为35-55岁,X2=5表示年龄为55岁以上。
X3表示户籍:X3=1表示户籍为城镇,X3=2表示户籍为农村。
X4表示是否独生:X4=1表示是独生,X4=2表示不是独生。
X7表示家庭年总收入:X7=1表示家庭年总收入为2万以下,X7=2表示家庭年总收入为2-5万,X7=3表示家庭年总收入为5-10万,X7=4表示家庭年总收入为10万以上。
文化程度和职业为无序多分类变量,X5表示文化程度变量,X5=1表示文化程度为小学及以下,X5=2表示文化程度为初中,X5=3表示文化程度为高中,X5=4表示文化程度为本科,X5=5表示文化程度为本科以上。X6表示职业变量,X6=1表示为学生,X6=2表示为教师,X6=3表示为医生,X6=4表示为务工人员,X6=5表示为企业员工,X6=6表示职业为个体工商户。
利用SAS软件,得到模型的似然比检验结果见下表3:
由上表可看出,伴随概率值大于0.05,卡方检验不显著,暂时无法拒绝原假设,因此根据HL检验[10]的性质,即可认为该模型能够很好的拟合。进一步得到最终的模型的预测结果,见表4:
表3 Hosmer和Lemeshow检验
表4 方程预测结果
将伴随概率值小于0.05的变量纳入方程,由表4看出,有三个变量进入方程(表中已将不显著的变量剔除),拟合的方程为:
logit(p)=0.75+0.31X3-1.52X5+0.65X6
用该方程可以做预测,预测值大于0.5说明该对象接受彩礼钱范围可能是5万以上,小于0.5说明该对象接受彩礼钱范围可能是5万以下。从方程中可以看出:logit(p)越大,则p越大,即被调查者能接受彩礼钱范围在5万以上的概率越大。
最后通过SAS软件对模型的预测结果进行检验:通过上述模型对数据中各个单位进行预测,得到在当前所处的解释变量下能接受彩礼的范围的预测值,并且与观测得到的原始数据进行对比,构建二维交叉表,得出结果见下表5:
表5 实际观测值与预测值交叉表
通过上表5可以看出,该模型预测的综合正确率达到76%,即该模型对此问题的预测效果良好。
通过上述对所能接受的彩礼与一系列因素进行的Logistic回归模型的分析,得出以下三点结论:从户籍角度分析,可见户籍所对应的系数为0.31,说明在一定程度上,农村户籍的被调查者所能接受的彩礼高于城镇,这可能主要与社会保障程度相关,城镇被调查者基本具有各种社会保障,但是农村被调查者则很少具有社会保障,因此农村被调查者需要更多彩礼使儿女的生活更加有保障;从文化角度分析,随着文化水平的提高,所能接受的彩礼价格处于逐级降低的倾向,这可能主要是由于随着文化水平的提高,对彩礼文化的理解更深,对于彩礼的初衷没有转变为对财物的追求;从职业角度分析,学生、教职工最不愿接受高额彩礼,医生次之,这可能与其收入相关,一般而言个体户较教职工收入更高,即使二者都不愿支付高额彩礼,但是在一些场合尽管彩礼金额较高,个体户仍然会支付高额彩礼。
[1]李玲.符号消费视角下的农村青年结婚消费[J].华中师范大学研究生学报,2015,22(2):52~53.
[2]葛雅兰.关于高额彩礼的几点思考[J].辽宁行政学院学报,2012,12 (12):151~152.
[3]田丰.农村青年结婚高额彩礼问题探析[J].中国青年社会科学,2016,35(2):62~63.
[4]郭莲纯.近二十年城乡居民婚俗礼仪习俗的嬗变[J].辽东学院学报,2008,10 (4):35~37.
[5]张路.农村青年结婚“彩礼”问题的探析[J].管理视窗,2015,(13):65~68.
[6]孙勇.浅析解除婚姻后财务纠纷的处理[J].辽宁师范大学学报,2004.7,27(4):28 ~30.
[7]林云飞.中原农村彩礼现状调查及法律思考[J].许昌学院学报,2014,33(3):135~137.
[8]金勇进,杜子芳,蒋妍.抽样技术(第四版)[M].北京:中国人民大学出版社,2015,(7):52~53,55~56,83~90.
[9]张虎,刘强.问卷调查分析中的Logistic回归与自变量筛选问题研究[J].中南财经政法大学学报,2003, (5):128~132.
[10]冯国双,刘德平.医学研究中的Logistic回归分析及SAS实现[M].北京:北京大学医学出版社,2012.
2095-4654(2016)10-0008-04
2016-07-09 基金项目:国家自然科学项目(11301001); 国家社会科学基金青年项目(08CJY028);安徽财经大学科研项目(acjyzd201429)的成果之一
C912.82
A