基于K-MEANS聚类算法对众包任务定价的计量分析

2018-05-02 06:30孙晓玲朱家明贺晓剑殷德香
赤峰学院学报·自然科学版 2018年4期
关键词:定价会员聚类

孙晓玲,朱家明,贺晓剑,殷德香

(1.安徽财经大学 统计与应用数学学院;2.安徽财经大学 工商管理学院,安徽 蚌埠 233030)

0 引言

随着互联网越来越发达,经济全球化日趋迅速,众包作为一种新型商业模式逐渐在市场崭露头角[1],将这种高效方法应用于任务定价是大势所趋,本文将在K-MEANS算法应用的基础上对众包任务定价方式进行计量分析.

1 数据来源与模型假设

数据来源于2017年“高教社杯”全国大学生数学建模竞赛B题.为便于解决问题,对本文提出以下假设:⑴本文所使用的数据均真实有效,具有统计分析价值;⑵任务定价主要受会员与任务距离影响,忽略其他因素对定价的影响;⑶会员的配送能力能够满足该区域内所有的配送需求.

2 基于K-MEANS聚类分析的距离体系

2.1 研究思路

通过查阅资料与相关文献,选取恰当的方法探索任务定价模型.首先,用数学软件挖掘数据信息通过任务与会员的位置对任务与会员聚类,将任务与会员打包[2];然后,根据已完成任务的价格进行加权合计得到任务定价函数;最后对新任务与会员分类预测新任务的定价.

2.2 研究方法

根据研究思路,对数据做如下处理挖掘数据信息,求解会员中心到任务中心的距离.

⑴运用K-MEANS聚类算法根据任务位置信息将已结束项目聚成m类[3],得到各类的中心的位置为(Wi,Ei),其中,i=1,2,…,m;根据会员位置信息将会员聚成n类,得到各类的中心的位置为(Wj,Ej),其中,j=1,2,…,n.

⑵计算各任务聚类中心与会员聚类中心的距离dij.结合地理知识与数学知识,根据地球表面任意两点距离的求解方法计算各任务聚类中心到各会员聚类中心的距离,如图1所示,计算步骤如下:

图1 经纬度求解距离示意图

已知,A、B 两点的经纬度分别为 Aj、Aw、Bj、Bw,c 为弧长对应的圆心角,地球的半径为R.

第一步,利用球面余弦公式,

其中,角C等于角A-OC-B,即面AOC与面BOC的二面角,即Bj-Aj.于是,公式等价于:

第二步,用反余弦函数求圆心角:

第三步,将角度化为弧度求距离:

⑶根据距离远近关系将任务与会员分为N个区域,N=min(m,n).

2.3 结果分析

对原始数据进行数据挖掘,运用SPSS软件根据位置信息分别对已完成任务与会员聚类,得到聚类结果[4].根据聚类结果将任务最终聚成20类,最终聚类中心的位置和每一类包含的任务个数如表1所示.

表1 任务聚类结果

根据聚类结果将会员最终聚成4类,最终聚类中心的位置和每一类包含的会员个数如表2所示.

表2 会员聚类结果

运用MATLAB软件计算会员聚类中心到任务聚类中心的最小距离[5],为模型的简便不考虑只有一个任务的类5,类13,类17.于是任务分为17类会员分为20类,最终形成17个区域,即分成17个包.区域组合及区域内的任务密度、加权价格如表3所示.

运用MATLAB软件分析加权价格与密度的关系并拟合加权价格和密度的函数关系[6],拟合结果为:

3 模糊加权平均定价体系

3.1 研究思路

受滴滴打车的启发,考虑打包定价的方法.利用K-MEANS聚类算法对离散的任务聚类,聚类后将任务联合在一起打包发布.根据聚类结果对原始定价模型进行修正,建立模糊加权平均定价模型.

3.2 数据处理

根据任务点分布图(图2)可以看出,任务点的分布具有离散性的特点.“拍照赚钱”任务在时效性方面有要求,在配送区域划分的时候考虑将距离作为主要的划分标准.采用K-MEANS聚类算法对任务点区域进行划分,通过利用K-MEANS算法聚类[7],聚成6类,各个任务点聚类后的结果如图2所示.

图2 任务点聚类分布图

根据聚类分析结果,得到各类别下的任务定价,如表4所示.

3.3 研究方法

表3 区域组合信息表

表4 各类别任务价格分布

⑴权重的确定

权重是指某一因素在集合中的重要程度[8],即在其他因素不变的情况下,该因素的变化对定价结果的影响程度,计算公式为:

Pij表示某个定价出现的次数,例P11表示第一类别的任务有7次定价为65元.

系数kij(i=1,2,…,n)称权,他说明这系数后面的数据,在整个统计数据中占的比重,也说明这个数据对统计结果的影响程度,其中

⑵加权平均定价[9]模型

加权平均定价模型是指将产品或服务的所有可能的定价与其各自权重乘积的和,得出综合各种情况的定价W,其数学表达式为:

xi(i=1,2,…,n)表示拍照任务所有可能的定价65≤xi≤85;

系数kij(i=1,2,…,n)称权,他说明这系数后面的数据,在整个统计数据中占的比重,也说明这个数据对统计结果的影响程度,其中

⑶任务定价

由(1)式可求出各种价格在不同类别任务下的权重,带入(2)式可求出各类别任务在打包发布时的定价(见表5).

表5 各类别任务在打包发布时定价

3.4 结果分析

在计算出各类别任务在打包发布时定价后,根据附件一求出每价格下已结束任务的任务完成度(见表6),据此拟合出任务完成度与价格的关系,如图3所示,可知任务完成度为[10]:

表6 各定价下任务完成度

图3 定价与任务完成度的关系

图4 是否打包发布完成度对比

根据所求(2)式所求价格与完成度的关系,计算出在将任务点划分成6类时打包发布的任务完成度,并与之前分散发布的任务度对比可知,修改之前的定价模型后,各地区的任务完成度处于大致持平状态,缓解了偏远任务点无人问津的状况,有利于提高整体任务完成度,任务完成度前后对比如图4所示.

4 结束语

本文利用K-MEANS聚类分析方法和球面距离处理数据,得到“众包”任务定价,合理考虑了地理位置与任务密度对任务定价的影响.为提高任务完成度,合理考虑不同价格在不同分类中的权重,提出模糊加权平均定价模型,使任务定价更加合理.如此定价方式,相比传统的市场调查方式确定任务定价,可以缩短调查周期,节约调查成本,实现企业与会员双方利益共嬴.

参考文献:

〔1〕孙坳,何明珂.基于结构方程模型的众包物流风险识别与分 析 [J/OL].管 理 现 代 化 ,2017,(06):105-109(2017-11-22).http://kns.cnki.net/kcms/detail/11.1403.C.20171122.1207.028.html.

〔2〕朱建平.应用多元统计分析[M].北京:科学出版社,2016.

〔3〕李磊,王俊熙,贺易,詹鹏,刘方方,汤弋.基于 K-means聚类粒子群算法的多点PV-DG日前分配计划[J].高电压技术,2017,43(04):1263-1270.

〔4〕朱家明,任晓翮.基于AHP-熵值法的精明增长计量分析[J].安徽大学学报(自然科学版),2017,41(6):61-67.

〔5〕姜启源,等.数学模型(第三版)[M].北京:高等教育出版社,2003.8.

〔6〕孙信昕,赵兴龙.基于K-means遗传算法的众包配送网络优化研究[D].北京交通大学,2016.

〔7〕赵文杰,朱家明,吴晓蔓,等.基于C均值聚类下出租车资源配置的优化[J].佳木斯大学学报(自然科学版),2016,34(02):267-271.

〔8〕李震,洪添胜,曾祥业,等.基于 K-means聚类的柑橘红蜘蛛图像目标识别[J].农业工程学报,2012,28(23):147-153+299.

〔9〕何玲,朱家明,蔡经纬,等.基于马尔可夫预测法邮轮定价策略的研究[J].商丘师范学院学报,2016,32(09):1-5.

〔10〕杨桂元.数学建模[M].上海:上海财经大学,2015.

猜你喜欢
定价会员聚类
30万元的MPV搅局者来了!传祺M8宗师系列为什么定价贵?
会员之窗
本刊2020年36卷第12期版权页定价勘误
会员之窗
会员之窗
会员之窗
基于K-means聚类的车-地无线通信场强研究
基于分层Copula的CDS定价研究
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现