曹 浚
西安市高新三中
基于模式识别的男女体重控制认知行为研究
曹浚
西安市高新三中
本文以182名大学生的真实体重和期望体重数据为研究对象,利用Matlab编程建立正态分布假设下的最小错误率贝叶斯分类器,进行体重数据的性别分类,以探究男女性别在体重控制认知行为上的差异。
男女性别;体重数据;模式识别;贝叶斯决策;Matlab编程
体重是人体的一个重要生理指标,与人的健康和外在形象息息相关。对于女性而言,体重是一个预测身体吸引力的重要指标。近年来,根据调查显示,许多女大学生认为自己太胖,从而有减肥意向,而实际上女大学生的超重率小于10%。为此,一些学者进行了女性体重控制认知行为失调的研究。
目前国内外关于体重控制认知行为的研究多集中在女性,对于男女性别差异在体重控制认知行为中的影响研究较少。本文采用模式识别中的最小错误率贝叶斯决策方法,基于182个大学生的真实体重数据和期望体重数据对性别进行分类,进而验证男女性别对体重控制认知行为的影响,为后续男女体重控制认知行为提供一定理论基础。
2.1分类方法介绍
我们所采用的分类方法为最小错误率贝叶斯决策。将所研究的对象分为ω1和ω2这两类,假设对象的特征x的数据可以通过某种方式获得。用P(ω1|x)和P(ω2|x)分别表示这个时候ω1类和ω2类的后验概率。由条件概率公式可知,后验概率P(ωi| x)(i=1,2)表示为:
其中P()ωi为ω1和ω2这两类的先验概率。我们称
为最小错误率贝叶斯决策原理。在本课题中,x是一个二维向量,且我们假设概率密度函数P(x|ωi)满足正态分布。双变量正态分布联合概率密度函数如公式(2-3)所示:
其中-∞〈x,y〈+∞;-∞〈μ1,μ2〈+∞;σ1,σ2〉0;-1≤ρ≤1;μ1,μ2分别是x,y的均值,分别是x,y的方差,ρ是x,y的相关系数。
2.2数据集说明
本课题所用数据来自美国宾夕法尼亚州立大学Mind on Statistic公开数据集。该数据集统计了182名大学生(女性119名,男性63名)的真实体重和他们各自所期望的身体重。
随机选取数据集中少量男性数据和女性数据作为训练集,训练集中的性别为已知量;剩余数据(或全部数据)为测试集,测试集中性别为未知量。将测试集的分类结果与真实性别进行对比即可得出分类错误率。
随机选取19名女性数据和9名男性数据作为训练集,包含真实体重(记为actual)、期望体重(记为ideal)这两个特征。为了充分挖掘数据集中所蕴含的信息,计算真实体重和期望体重之差(记为diff),作为第三个特征。
从上述三个特种两两选择,分别计算各种特征选取方式下的概率密度函数参数,如表3.1所示。
表3.1各种特征选取方式下的概率密度函数参数
由表3.1可以看出,当选择ideal和diff作为特征时,男性与女性的相关系数均最小。
利用第3章中各种特征选取情况下建立起的最小错误率贝叶斯分类器对测试集数据进行性别分类,并根据测试集的真实性别计算男性的决策错误率P(error男)和女性的决策错误率P(error女)。分别用数据集中男女性别的人数百分比作为男性和女性的先验概率,最后分别用两种性别的先验概率对两种性别的错误率进行加权求和得到总错误率P(error总)。结果如表4.1所示:
表4 .1各种特征选取情况下的决策错误率
由表4.1可知,选取ideal和diff为特征时,总的决策错误率最小。
5.总结与展望
体重是影响人体外在形象的重要指标。本文用模式识别的方法,研究了男女性别在体重控制认知行为上的差异。研究结果显示,相对男性大学生而言,女性大学生对自己体重的期望值偏离真实值更多,也即女性更期望获得一个更小的体重。这对于后续研究男女审美及体质健康均具有一定的理论价值和意义。
[1][英]斯瓦米,[英]富氽汉姆.魅力心理学[M].华夏出版社,2011.
[2]高德顺,邹大华,沈勋章,等.东亚地区四大城市女大学生青春期减肥意向的比较研究——自我体型的误区与社会性体型焦虑的现状[J].体育科研,2002(2)∶38-40.
[3]高德顺,陈海涛,丁洪祥.关于青春期女大学生减肥的调查研究[J].中国体育科技,2002,38(6)∶36-38.
[4]尹小俭,季成叶,李世昌.大学生肥胖的现况与体质健康的相关性研究[J].现代预防医学,2007,34(23)∶4527-4530.
[5]石岩,周璠.女性体重控制认知行为失调的三维模型构建[J].体育科学,2012,32(9)∶23-30.
[6]周璠.女大学生体重控制认知行为失调研究[D].山西大学,2014.
曹浚(1999-),男,陕西省旬阳县人,就读于陕西省西安市高新第三中学,高中在读,研究方向:模式识别与人工智能。