高妍方,邓晓红,崔晓青,刘佳
(山东建筑大学管理工程学院,山东济南250101)
农村转移人口住房保障决策数据集成研究
高妍方,邓晓红,崔晓青,刘佳
(山东建筑大学管理工程学院,山东济南250101)
农村转移人口住房保障是城镇化背景下我国城市管理面临的难题之一。农村转移人口住房保障决策数据集成研究,是充分利用农村转移人口住房保障决策相关的多种数据资源,科学地进行农村转移人口住房保障决策管理的基础与前提。文章总结了农村转移人口住房保障决策数据的来源和特点,提出了住房保障对象分析、住房保障形式分析和保障性住房区位分析3个农村转移人口住房保障决策数据集成的主题;设计了数据集成主题相关的维度以及事实表构成要素,构建了每个主题的多维数据集成模型;建立了农村转移人口住房保障决策集成系统架构,并进行了应用分析研究。
农村转移人口;住房保障;数据集成;多维数据模型
Abstract:Ruralmigrant population's housing security is a big problem for city management in the context of the new urbanization.Research on data integration of ruralmigrant population is the basis and precondition for scientific decision and management of ruralmigrant population's housing security based on full use of various data resources.Data sources and data features of ruralmigrant population for housing security decision are summarized,themes on data integration for ruralmigrant population's housing security decision including housing security targetanalysis,housing security form analysis and security housing's location analysis are proposed,and then component elements of dimensions and fact tables for themes of housing security decision are designed,and multi-dimensionmodels for themes of rural migrant population's housing security decision are constructed.Decision integration system framework is constructed accordingly,and applications of housing security decision are analyzed and researched.
Key words:ruralmigrant population;housing security;data integration;multi-dimension datamodel
随着我国城镇化进程的推进,中央明确提出要全面放开建制镇和小城市落户限制,有序放开中等城市落户限制,逐步推进农村转移人口市民化。住房是促进农村转移人口市民化的重要条件,农村转移人口住房保障因此成为我国城市管理面临的难题之一,也是学者研究的热点问题[1-4]。
住房保障的规划和实施是复杂的系统工程。根据中华人民共和国住房和城乡建设部等6部委联合发布的《关于做好住房保障规划编制工作的通知》[5],住房保障规划编制需要依据相关统计资料,做好各类住房保障对象数量和状况分析;对政府保障能力进行分析,明确规划定位;依据规划期间住宅数量和空间布局,对住房保障规划实施效果进行预测分析。因此,要制定合理的农村转移人口住房保障规划,需要全面掌握城市中的农村转移人口信息,了解农村转移人口的生存发展状况,准确反映农村转移人口的规模、结构和变化情况。
农村转移人口的基本信息主要由政府部门统计管理,信息分布存储在不同部门,数据统计口径难以统一[6-8]。同时,随着大数据技术的快速发展和应用,能采集到更多的农村转移人口数据[9-10]。农村转移人口住房保障决策数据集成研究,是充分利用农村转移人口住房保障决策相关的多种数据资源,科学地进行农村转移人口住房保障决策管理的基础与前提。
从当前人口信息管理的研究成果看[11-13],多维数据集成模型是进行数据集成和多维分析的有效方法,适用于人口信息建模和分析。因此,文章基于多维数据模型研究农村转移人口的住房保障决策数据集成,并构建农村转移人口住房保障决策集成系统架构,探讨在集成系统下如何进行农村转移人口住房保障决策。
科学的住房保障决策,需要了解保障对象的规模、结构以及政府保障能力。其中,农村转移人口规模和结构是制定住房保障政策的关键。为获取农村转移人口的规模和结构,分析农村转移人口数据资源的来源及其存在的问题。
随着数据采集、集成和管理技术的快速发展,可使用的数据数量多且来源广。文章参考济南市、北京市等城市进行住房保障决策的流程和信息统计要求[14-15],以及农村转移人口对住房的基本需求,提取农村转移人口住房保障决策所需数据,见表1。
表1 农村转移人口住房保障决策数据指标
依据目前我国农村转移人口管理制度和农村转移人口在城市的生活模式,以及政府信息公开和管理的现状[16],农村转移人口数据资源有如下几方面问题。
(1)数据维度高
农村转移人口的数据主要分布在用工单位、公安、计生、社会保险、银行、医疗、统计、民政、教育、土地、房产等部门[17]。将所有部门的数据进行综合,用于农村转移人口特征描述的维度有几十个[17]。
(2)数据不完整
农村转移人口管理部门根据自身业务需要进行数据统计时覆盖的人群不一致[17]。另外,不同部门统计数据口径难以统一,导致数据粒度不同,难以形成农村转移人口的完整数据链。
(3)数据不规范
由于没有统一的数据采集规范,各部门在统计数据时采用的标准不同,导致数据格式和类型存在差异。另外,受管理模式和信息技术的制约,数据存储平台和工具也存在差别。
(4)数据断流
农村转移人口处在城市生活的边缘状态,难以及时获取相关数据;且由于农村转移人口数据分布在多个部门和企业,人口数据发生变化时难以同时更新,存在数据断流问题[17]。
针对农村转移人口数据资源存在的问题,要实现农村转移人口住房保障决策分析的科学性,需要对来源不同的数据进行集成。多维数据模型是实现多源异构数据集成的常用模型,是构建数据集成系统、实现联机分析处理(On-Line Analytical Processing,OLAP)和数据挖掘的关键。因此,构建农村转移人口住房保障决策的多维数据集成模型,实现农村转移人口多源异构数据集成。
主题是在较高的层次上对数据进行综合、归类和分析利用的抽象概念,每个主题对应一个宏观分析领域,确定主题后,进一步提出需要集成的数据内容。
根据农村转移人口住房保障决策分析的需求,确定农村转移人口住房保障决策分析的主题。住房保障决策分析的核心问题包括确定住房保障对象,以及合理的住房保障形式和区位等。因此,住房保障对象分析、住房保障形式分析、保障性住房区位分析是住房保障决策面临的主要分析领域,将其确定为农村转移人口住房保障决策数据集成的主题,依据主题的核心目标构建多维数据集成模型。
多维数据集成模型由事实表和维度表两部分组成。事实表用来储存主题分析的主干内容,维度表对事实表中的指标进行过滤和重新组织。构建住房保障对象分析、住房保障形式分析、保障性住房区位分析3个主题的事实表和维度表,形成多维数据集成模型。
(1)住房保障对象分析主题的多维数据集成模型
住房保障对象分析的目的是认定参与住房保障的农村转移人口群体,需要详细了解农村转移人口的特征,包括年龄、性别、文化水平等个人基本信息,以及家庭结构、工作领域、居住状况等信息。对农村转移人口进行群体聚类,筛选出每个群体在个人、家庭、工作和居住等方面的主要特征,并将其作为是否提供住房保障的依据。则农村转移人口住房保障对象分析主题的维度表应包括个人基本信息维度、家庭结构维度、工作类型维度以及居住状况维度,事实表仅包含多个维度的外键,没有具体的度量值,是无事实的事实表。维度表和事实表包含的具体内容,如图1所示。
图1 住房保障对象分析主题的多维数据集成模型图
(2)住房保障形式分析主题的多维数据集成模型
住房保障形式分析的目的是为农村转移人口提供合理的住房保障类型,需要详细了解农村转移人口的潜在需求。基于住房保障对象分析主题对农村转移人口群体的分类结果,提炼每类群体在工作、家庭等方面的共同特征,挖掘其对住房的共同需求。依据住房需求和政府保障能力,分析能够提供的住房保障形式。
(3)保障性住房区位分析主题的多维数据集成模型
保障性住房区位分析主题的目的是发现农村转移人口居住区域分布与工作区域、子女教育区域的关系,根据农村转移人口在工作、教育等方面的需求,优化保障性住房的区位分布。需要详细了解农村转移人口的工作地点、居住地点和子女教育区域,以及在相应区域内聚集的人口数量,基于这些信息,分析农村转移人口区位聚集状况,实现保障性住房区位的合理规划。则保障性住房区位分析主题的维度表应包括工作地点维度、居住地点维度和子女教育区域维度,事实表中的人口数是相应区域的农村转移人口总数量。维度表和事实表包含的具体内容,如图2所示。
图2 保障性住房区位分析主题的多维数据集成模型图
基于多维数据集成模型,构建农村转移人口住房保障决策集成系统,将为农村转移人口住房保障决策数据的采集、存储和挖掘提供一个基础的管理平台,是实现农村转移人口住房保障决策科学分析的重要途径。
依据一般决策支持系统的架构[18],结合农村转移人口住房保障决策工作的需要,设计基于多维数据集成模型的农村转移人口住房保障决策集成系统架构,由5个层次组成,如图3所示。
图3 农村转移人口住房保障决策集成系统架构图
(1)数据源
根据住房保障决策需求,对数据分布、数据结构、数据类型进行分析,将数据源划分成两部分,一部分是企业和政府采集的农村转移人口个人、家庭、工作和住房等数据,是政府和企业统计的一手数据,能直接反映农村转移人口的工作和生活状态;另一部分是农村转移人口在日常生活中产生的数据,分布在不同企业,能间接反映农村转移人口的工作和生活状态。
(2)数据加工
农村转移人口数据位于不同的政府部门和商业企业,数据存储的位置、逻辑结构和物理状态存在较大差别。将数据进行集成,需要对数据类型、格式和名称等进行统一,并消除数据中存在的缺漏值、不一致等问题,为加载到数据集成仓库中做好预备工作。
(3)数据集成
为实现农村转移人口住房保障数据的集成,利用多维数据集成模型,根据住房保障决策的要求进行主题划分,实现住房保障决策数据的归类集成。
(4)数据分析
为全面分析农村转移人口住房保障决策问题,既需要描述性分析,也需要深层次挖掘。具体的,描述性分析应用数据仓库的OLAP方法完成,深层次挖掘应用数据挖掘方法完成。基于OLAP方法和数据挖掘方法,构建公共模型,用于住房保障决策主题分析。
(5)数据展示
为给用户直观地展示分析结果,在自定义查询的基础上,采用多维分析和可视化相结合的展示方式,并将综合分析结果生成报表,用于支持农村转移人口住房保障决策分析。
在农村转移人口住房保障决策集成系统架构下,根据数据来源及其组织模式,通过OLAP和数据挖掘等技术,实现农村转移人口住房保障决策分析。
(1)基于OLAP的农村转移人口住房保障决策分析
利用OLAP从不同应用角度对农村转移人口进行多维查询和分析,获取农村转移人口的群体特征,以及不同群体之间的差异。
①描述分析
利用数据的常用统计值(如众数、均值、最大值、最小值、方差、分布等)反映农村转移人口的基本情况,利用OLAP的基本操作(如上钻、下钻、切块、切片、旋转)进行多粒度、多角度的分析和查询。如应用OLAP的“切片”操作,查询服务行业中农村转移人口的年龄、平均收入等信息。
②对比分析
以农村转移人口的个人维度、工作维度和家庭维度作为筛选条件,利用OLAP基本操作实现信息提取,对比农村转移人口在各种条件下的异同。如以行业作为筛选条件,对比“服务业”和“制造业”中农村转移人口的收入、年龄、家庭结构等方面的异同,提炼不同群体的特征。
(2)基于数据挖掘的农村转移人口住房保障决策分析
OLAP分析仅能处理住房保障决策的部分问题,为完善解决住房保障对象分析、住房保障形式分析、保障性住房区位分析等3个主题的决策问题,需要利用聚类分析、关联分析和预测分析等常用数据挖掘技术进行深入挖掘。
①基于聚类分析的农村转移人口类别划分
通过对农村转移人口类别划分,获得不同群体的人口结构,为确定住房保障对象提供依据。利用聚类分析,将农村转移人口群体划分类别,并用统计方法获得每类群体的特征。利用农村转移人口群体类别特征,根据政府的保障能力,确定住房保障对象的标准,从而确定住房保障对象。
②基于关联分析的农村转移人口潜在需求分析
农村转移人口对住房的潜在需求,是确定住房保障形式和住房区位的依据。在聚类分析结果的基础上进行关联分析,发现每类群体对住房的潜在需求;依据政府的保障能力和住房保障对象的潜在需求,进行住房保障形式和区位分析,有助于制定满足个性化需求的住房保障政策。
③基于预测分析的农村转移人口留居意愿分析
留居意愿是对农村转移人口是否提供住房保障的重要指标。利用农村转移人口的个人、工作、家庭等基本信息,以及通信、消费、教育、交通等方面的信息,对留居意愿进行预测,为确定住房保障对象提供更进一步的信息支持。
农村转移人口流动性强,难以进行长期统一的跟踪管理,造成了农村转移人口数据资源分布广泛,数据质量相对较低。为了更好的利用数据支持住房保障决策,需要对农村转移人口数据进行统一集成和管理。利用多维数据集成模型,实现多源异构数据集成,有助于从多维度分析农村转移人口的结构和生存状况,深入挖掘农村转移人口的住房需求,从而实现农村转移人口住房保障的科学决策。
[1] 巴曙松.正视流动人口的住房保障[J].中国经济报告,2012(6):77-80.
[2] 曾国安,雷泽珩.论进城农业转移人口住房保障发展的政策支持[J].湖北社会科学,2014(10):75-79.
[3] 谭安富.论住房保障对农业转移人口市民化的推拉效应[J].兰州学刊,2014(6):99-104.
[4] 张小平,吕学昌.“流动人口聚居型城中村”规划改造研究——以济南市为例[J].山东建筑大学学报,2013,28(5):439-444.
[5] 中华人民共和国住房和城乡建设部等六部委.关于做好住房保障规划编制工作的通知[EB/OL].http://www.mohurd.gov.cn/zcfg/jsbwj_0/jsbwjzfbzs/201006/t20100613_201322.html.[2017-06-21].
[6] 段成荣,孙玉晶.我国流动人口统计口径的历史变动[J].人口研究,2006,30(4):70-76.
[7] 吕利丹,段成荣.对我国流动人口统计调查的总结与思考[J].南方人口,2012,27(3):73-80.
[8] 白先春,凌亢.提高人口统计数据质量的对策研究——以人口迁移统计为例[J].中国行政管理,2011(12):113-116.
[9] 于浩.大数据时代政府数据管理的机遇、挑战与对策[J].中国行政管理,2015,12(3):127-130.
[10]李宇.大数据背景下政府信息资源管理的探索与思考——以流动人口信息管理为例[J].电子政务,2014(7):100-104.
[11]王晖.暂住人口数据仓库的设计与应用[D].鞍山:辽宁科技大学,2008.
[12]鞠剑勋.基于HBase的人口管理系统的设计与实现[D].南京:南京大学,2013.
[13]郭锐.基于数据仓库的人口数据分析系统的设计及实现[D].北京:中国科学院大学,2015.
[14]北京市住房和城乡建设委员会.关于进一步完善我市保障性住房申请,审核,分配政策有关问题的通知[EB/OL].http://zhengwu.beijing.gov.cn/gzdt/gggs/t1305760.htm.[2017-06-21].
[15]济南市住房保障和房产管理局.关于印发《济南市政府集中建设公共租赁住房申请分配程序》等文件的通知[EB/OL].http://xxgk.jinan.gov.cn/xxgk/jcms_files/jcms1/web44/site/art/2015/6/29/art_18509_148219.html.[2017-06-21].
[16]郑磊,高丰.中国开放政府数据平台研究:框架、现状与建议[J].电子政务,2015,(7):8-16.
[17]王进孝.关于城市流动人口服务与管理信息化建设的思考[J].电子政务,2011(4):6-10.
[18]吴小芳,于红波,胡月明,等.村镇建设用地再开发数字化监管与空间决策支持系统研究[J].测绘通报,2015(12):93-97.
(学科责编:康文凤)
Research on data integration of ruralm igrant population for housing security decision
Gao Yanfang,Deng Xiaohong,Cui Xiaoqing,et al.
(School of Management Engineering,Shandong Jianzhu University,Jinan 250101,China)
C931
A
1673-7644(2017)04-0333-06
2017-06-21
教育部人文社会科学规划基金项目(14YJA630006);山东省高校人文社科研究计划(J16YF14)
高妍方(1979-),女,副教授,博士,主要进行信息资源管理、大数据技术及应用等方面的研究.E-mail:gaogao308@hotmail.com