闫晓彤 王吉凤 张华威
摘 要 随着互联网的发展,出现了自助式服务软件用户,用户选择并预定平台发布的任务,通过研究项目的任务定价规律,分析任务未完成的原因。根据题中的数据利用软件地理寻找调查的城市所在地,观察城市任务完成和未完成的数据。通过观察总体数据,分析出不同城市与任务完成之间的相关性,进而利用聚类分析法对各个任务完成率的影响因素进行相似度分类,并计算出任务标价的规律:任务点价格和类中心的距离之间存在线性关系。
关键词 拍照赚钱 聚类分析 最小二乘法
一、数据分析
通过经纬度图表,发现数据中任务位置分布在佛山、东莞、深圳、广东4个地区。其中,东莞的完成概率近100%,深圳完成力度最小,广东和佛山的完成量目测能够达到一半。
二、模型建立与求解
聚类分析法以经纬度位置来确定各个样本的相似度,将数据无量纲化处理,逐个扫描数据以便更准确细致的分类并确定类中心。由于本题需要分析不同维度下的数据,上述分析对数据进行标准化处理后,采用欧几里得公式
计算两类之间的距离,利用软件SPSS进行精确的聚类分析,以任务定价为65的任务点为起始点聚类得到以下经纬度。
基于聚类分析数据,推测拍照赚钱的定价规律为:4个城市基于类中心的基础价格,随着地理条件不断向外扩散,任务的标定价格也逐渐增加,每个城市因其经济水平、人口密度、交通情况的不同影响着上升的程度。通过采用最小二乘法拟合,寻找任务定价和扩散半径之间的距离平方和的最小值。
通过拟合得出结论:每个任务点的任务定价与中心扩散半径之间呈线性关系,经过数据的分析发现每扩散1km,任务价格上升0.2~0.4元。
第一,城市区域差异。根据地图定位信息了解到东莞任务几乎全部完成,东莞是经济发展中城市,任务标价在人民理想期望水平以上,任务的完成率较高;佛山由于任务标价低导致任务完成率低;广州和深圳位置优越,经济繁荣,但是标定价格低并且会员人数少于任务数,出现供求不匹配的现象,导致完成率较低。
第二,任务会员情况。将半径3km的4个城市的任務完成情况和会员分布情况进行具体数表统计。
通过对数据的处理可得,某些地区位置偏远,人口密度小,任务量相对会员人数来说较多,交通不便,导致完成率较低。通过图表可知,在东莞等完成度较高的地方,会员的信誉度也相对较高,佛山地区的会员信誉度不高、意愿不强烈,导致完成度也不高。
三、结果分析
利用数据软件SPSS进行分析,针对不同的地理位置制定不同的价格,综合分析价格和地理位置等因素对任务完成量的影响。
根据对任务未完成的多种因素的分析,得出原因:
第一,会员的数量不足以供应任务的设置数量。
第二,在相同的地点和任务时间内,未完成的任务标价普遍偏低。
第三,城市的人物设置点交通状况不乐观,任务设置点离会员距离较远。
第四,任务完成状况不好的地区,会员信誉度较低。
(闫晓彤、王吉凤单位为华北理工大学冶金与能源学院;张华威单位为华北理工大学理学院)
参考文献
[1] 叶晓甦,张永艳.商业银行对PPP项目全寿命周期的风险识别和防范[J].建筑经济,2010(10).
[2] 单晓丽,等.项目融资中贷款银行面临的关键风险识别[J].统计与决策,2009(9).
[3] 朱雅杰.众包商业模式要素模型及运行机制研究[D].山东大学,2011.