基于主成分分析法的河北省人口文化素质综合评估

2016-07-19 01:18吴云霞陈红娟
长春工业大学学报 2016年3期
关键词:主成分分析

吴云霞, 康 娜, 陈红娟, 刘 静

(1.河北地质大学, 河北 石家庄 050031;2.安徽省地质矿产勘察局322地质队, 安徽 马鞍山 243000)



基于主成分分析法的河北省人口文化素质综合评估

吴云霞1,康娜1,陈红娟1,刘静2

(1.河北地质大学, 河北 石家庄050031;2.安徽省地质矿产勘察局322地质队, 安徽 马鞍山243000)

摘要:采用主成分分析方法对河北省的11个设区市进行人口文化素质综合评估。石家庄、秦皇岛、唐山、廊坊高中以上教育较好,专业技术人员的比例较高。而邯郸、邢台、沧州、衡水这四个城市高学历人才要相对少一些。衡水、邢台、保定、石家庄9年义务教育推行实现的相对更好,张家口、承德、邯郸的基础教育发展较为薄弱。综合评估结果与河北省11个设区市的经济、社会等综合发展水平基本相一致。

关键词:主成分分析; 人口文化素质;spss软件; 综合评估

0引言

人口文化素质是衡量人口素质的重要标志之一[1]。目前,国内对于人口文化素质的综合评估方法都借鉴人口素质PQLI及HDI的构建方法构建人口文化素质综合评估模型[2-6]。文中采用主成分分析方法,在选取指标相类似的情况下对河北省人口文化素质进行综合评估,试图找到文化素质高低的原因,并进行聚类分析,对11个设区市进行归类,针对不同类别人口文化素质发展存在的问题指出对策。

1主成分分析的原理和步骤

主成分分析就是把原有的多个指标转化成少数几个代表性较好的综合指标,这少数几个指标能够反映原来指标大部分的信息(85%以上),并且各个指标之间保持独立,避免出现重叠信息。它们通常表示为原始变量的某种线性组合。主成分分析主要起着降维和简化数据结构的作用[7-10]。

设有p个指标,把这p个指标看作p个随机变量,记为x1,x2,…,xp,主成分分析就是要把这p个指标的问题转变为讨论m个新的指标F1,F2,…,Fm(m

使其满足每个主成分的系数平方和为1,主成分之间相互独立且方差依次递减,重要性依次递减。在SPSS中,主成分分析经常被嵌入到因子分析过程之中。

主成分系数计算方法为成分矩阵中的数据除以主成分相对应的特征值开平方根,便得到主成分中每个指标所对应的系数。

2指标选择与数据来源

人口文化素质各因素指标的选择从国际通用的人口素质的评估模型来看,关于文化素质方面一般都是以文化普及率或识字率来反映,而在HDI模型中,则增加了平均受教育年限指标来反映知识变量。因此,选取文盲率来反映文盲人口比例,选取研究生及以上文化程度、大学生、高中、初中及小学文化程度的人口比例来反映人口的文化结构状况;此外,从人口文化素质的涵义及构成来看,构建的指标体系还必须包含技术方面的因素,因此,选取各级各类专业技术人口的比例来反映人口的技术状况。这些指标基本上能从三个不同的方面较全面地反映人口的文化素质状况[2-3]。

文中数据来自河北省统计局第六次人口普查办公室,所选指标见表1[11]。

表1 河北省11个设区市人口文化素质各因素指标数据           %

注:小学、初中、高中、大学专科、大学本科、研究生文化程度比例分别是占全省6岁以上总人口的比例;文盲率是文盲和半文盲人口占15岁及15岁以上人口的比例;各级各类专业技术人口比例指各级各类专业技术人口占16岁及16岁以上就业人口的比例。

3计算结果

利用SPSS19.0 软件首先将原始数据进行标准化处理

对标准化后的数据作统计分析,提取了相关系数矩阵中两个主成分,它们对方差的贡献率分别是65.986% 和23.402%,见表2。

表2 特征值及主成分贡献率和累计贡献率              %

表2中,总贡献率高达89.388%, 超过85%, 适合用主成分分析法。其中第一主成分对应的特征值为5.279,第二主成分对应的特征值为1.872,因子载荷矩阵见表3。

表3 因子载荷矩阵

由成分系数矩阵得主成分表达式为:

(1)

(2)

利用SPSS软件分析可知,f1和f2的贡献率分别是65.986%和23.402%,因此可以得加权得分公式为:

(3)

4综合分析

从因子载荷矩阵(见表3)可知,利用SPSS19.0提取了2 个主要成分。高中文化程度比例(x3)、大学专科文化程度比例(x4)、大学本科文化程度比例(x5)、研究生文化程度比例(x6)、专业技术人员比例(x8)标准化后的变量在f1上都有较大的载荷,而其他的文化素质指标在f1上的载荷较小,即f1主要反映高中及高中以上教育和专业技术人员比例对文化素质的影响,分值越高反映的文化素质越高;在f2上小学文化程度比例(x1),初中文化程度比例(x2),文盲率(x7)载荷较大,即在f2上主要反映初中及初中以下教育对文化素质的影响,分值越低文化素质越高。

根据式(1)~式(3)计算得到各地区主成分得分及因子排名情况见表5。

表5 各地区因子得分排名情况

注:第一主成分(f1)和加权综合按得分从高到低排序,第二主成分(f2)按得分从低到高排序。

从表5我们发现,石家庄、秦皇岛、唐山、廊坊在f1得分较高,排名靠前,说明这些区市高中以上教育较好,专业技术人员的比例较高。而邯郸、邢台、沧州、衡水这四个城市在f1排名较为靠后,说明这些设区市的高学历人才要相对较少。衡水、邢台、保定、石家庄在f2上排名靠前,说明河北省这几个设区市9年义务教育推行实现的相对更好,张家口、承德、邯郸的基础教育发展较为薄弱。

2005年6月6日,河北省委、省政府正式出台的《关于实施“一线两厢”区域经济发展战略的指导意见》,意见的核心是抓“一线”,推“两厢”。抓“一线”,就是充分利用石家庄、保定、廊坊、唐山、秦皇岛五市经济基础比较雄厚的优势,发挥“领跑”作用;推“两厢”,就是积极推进南部邯郸、邢台、衡水、沧州四市这一厢,大力扶持北部张家口、承德这一厢,逐步形成“一线两厢”区域经济共同发展的大格局。把表5与“一线两厢”政策中的城市划分相比较,发现其与f的排名不谋而合,f排名前四位城市属于“一线两厢”的一线城市,f排名后四位城市与南厢的四个城市相一致,张家口与承德在f排名中处于中间位置,属于北厢的两个城市。由此发现基于主成分分析方法进行的河北省人口文化素质的综合评估与河北省的区域经济发展战略是相一致的,吻合的较好,说明文中的评估方法具有实际应用价值。

特别关注一下保定,保定属于“一线两厢”的一线城市,但是其人口文化素质在f上排在承德之后,人口文化素质与其经济发展不一致,也就是其人口文化发展与其经济、社会发展相比是相对滞后的[12]。

5聚类分析

平均联接(组间)的树状图如图1所示。

利用平均距离聚类分析方法对河北省11个设区市作合理的聚类,根据聚类分析结果(见表1)将河北省11个设区市分为四类:

第1类,人口文化素质综合水平较高型:石家庄、秦皇岛,在河北省属于人口文化素质最高的水平。

第2类,环京津经济型:唐山、廊坊,在河北省属于人口文化素质较高的水平,是河北省人口文化素质中等偏上的城市。

第3类,地理区位限制型:张家口、承德,属于河北省人口文化素质中等水平。

第4类,高学历人才发展滞后型:邢台、沧州、邯郸、保定、衡水是河北省人口文化素质水平相对较低的城市。

图1平均联接(组间)的树状图

6结语

1)所选指标对人口文化素质的影响主要体现在两个方面,即高中及高中以上教育和专业技术人员比例对文化素质的影响,分值越高反映的文化素质越高;初中及初中以下教育对文化素质的影响,分值越低文化素质越高。

2)石家庄、秦皇岛、唐山、廊坊高中以上教育较好,专业技术人员的比例较高。这些城市分别是省会、沿海和环京津城市,属于人口文化素质综合水平较高型。衡水、邢台、保定、石家庄在9年义务教育推行实现的相对更好[13]。

3)衡水、沧州、邢台、邯郸高学历人才和专业技术人才要相对较少。属于高学历人才发展滞后型。张家口、承德的基础教育发展较为薄弱,属于地理区位限制型。保定人口文化素质发展滞后与经济、社会发展,属于人口文化素质与经济发展不协调型[14-15]。

4)采用主成分分析方法对河北省人口文化素质进行综合评估的结果与河北省区域经济发展战略相一致,吻合度高,说明文中的评估方法具有实际应用价值,在其他省市以及全国可以尝试进行数据分析,找到不同地区人口文化素质发展的症结。

7建议

人口文化素质综合排名基本由第一主成分决定,即河北省如果想进一步提升人口文化素质需要加大教育投入力度,全面提升教育水平,特别是提高高中及高中以上和专业技术人员的教育。

针对高学历人才发展滞后型,河北省需优化区域布局结构,支持这些地区发展高等教育,发挥省属重点骨干大学的示范、辐射和带动作用,对口支援薄弱高校。同时通过产学结合的办学模式大力发展职业技术教育[16]。

针对地理区位限制型地方政府应加大基础教育投入力度,克服地理区位的问题,制定符合当地需求的政策,巩固“普及九年制义务教育”,不断提高农村地区适龄人口的小学和初中入学率、毕业率,减少青少年文盲半文盲比例,解决好当地人口的下一代受教育问题[17]。

文中是主成分分析方法在人口文化素质综合评价中的首次应用,研究结果清晰反映了河北省不同地区人口文化素质的优势和劣势,特别是存在的问题,有助于河北省教育、人才管理部门从总体设计层面,到具体的教育阶段制定合理的人口文化素质提高计划,综合提高河北省的人口文化素质。

参考文献:

[1]景跃军,谢喆.中国人口文化程度的影响因素研究.人口学刊,1995(1):26-29.

[2]张霞,苏为华.人口文化素质综合评估[J].统计应用,2004(1):37-40.

[3]张鸣宇,李辉.吉林省人口文化素质研究[D].长春:吉林大学,2011.

[4]段力刚.基于群决策:层次分析和PQLI法的人口素质与经济发展问题研究[D].保定:河北大学,2009.

[5]赵秋成.PQLI法的不足及其改进[J].上海统计,1998(1):32-34.

[6]朱计生,钱金平.人口素质的综合评判方法[J].系统工程理论与实践,1992(5):45-50.

[7]叶晓枫,王志良.主成分分析法在水资源评价中的应用[J].河南大学学报:自然科学版,2007,37(3):276-279.

[8]漆勇方.主成分分析法在环境污染评估中的应用[J].萍乡高等专科学校学报,2012,29(3):40-44.

[9]刘涛.基于主成分分析的山东省产业结构变动影响因素研究[J].山东大学学报:哲学社会科学版,2011(3):107-112.

[10]杨宾峰,宁欣.主成分分析在数字图像特征提取中的应用[J].微计算机信息,2007,23(6):282-283.

[11]河北省统计局.河北省2010年第六次全国人口普查主要数据公报[EB/OL].(2011-05-08)[2015-01-13].http://www.hetj.gov.cn/hetj/tjgbtg/101374627640719.html.

[12]申亚民.陕西人口素质与经济发展[J].西安文理学院学报:自然科学版,2003,18(2):51-55.

[13]贾玲玲.河北省城市化水平综合评价研究[D].太原:山西师范大学,2010.

[14]李生志,张水龙,常春平,等.河北省人口素质与环境关系的研究[J].河北师范大学学报:自然科学版,1996(1):89-97.

[15]王霞,张连瑞.河北省人口文化素质浅析[J].河北成人教育学院学报,2005,7(4):70-71.

[16]张志强.我国人口素质水平的统计分析[J].山西财经大学学报,2001,23(2):102-104.

[17]李亚丽,于怀昌.GIS支持下的河南省人口素质空间动态特征研究[J].南阳师范学院学报,2007(6):61-64.

Evaluationofpopulationculturequalitybasedonprincipalcomponentanalysismethod

WUYunxia,KANGNa,CHENHongjuan,LIUJing

(1.HebeiGEOUniversity,Shijiazhuang050031,China;2.BureauofGeologyandMineralExplorationofAnhuiProvince-322GeologicalTeam,Ma’anshan243000,China)

Abstract:Principalcomponentanalysisisusedtomakethecomprehensiveassessmentofpopulationculturalqualityinelevenmunicipal-levelcitiesinHebeiProvince.High-schooleducationlevelishigherinShijiazhuang,Qinhuangdao,TangshanandLangfangwithhigherproportionofprofessionalandtechnicalpersonnel.ThenumberofpeoplewithhigheracademicqualificationsisrelativelylowerinHandan,Xingtai,CangzhouandHengshui.Nine-yearcompulsoryeducationiswellcarriedoutinHengshui,Xingtai,BaodingandShijiazhuang,butrelativelyweakinZhangjiakou,ChengdeandHandan.Theassessmentresultsarematchedwiththeeconomicandsocialdevelopmentinthecorrespondingareas.

Keywords:principalcomponentanalysis;demographicandculturalquality;spsssoftware;comprehensiveassessment.

收稿日期:2016-01-13

基金项目:2015年度河北省社会科学发展研究重点课题(2015020211); 河北省第六次全国人口普查招标课题(RKPC-HY05)

作者简介:吴云霞(1978-),女,汉族,河北石家庄人,河北地质大学讲师,硕士,主要从事人口与地理信息系统方面的研究,E-mail:wuyunxia2006@163.com.

DOI:10.15923/j.cnki.cn22-1382/t.2016.3.04

中图分类号:C922

文献标志码:A

文章编号:1674-1374(2016)03-0224-06

猜你喜欢
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
关于AI上市公司发展水平评价
大学生创业自我效能感结构研究
塔里木河流域水资源承载力变化及其驱动力分析
我国上市商业银行信贷资产证券化效应实证研究
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
农村劳动力转移影响因素与转移数量的动态关系研究