基于K-均值聚类算法的众包任务定价模型设计

2019-10-21 08:08赵建君杨伟男虞赟泽蒋巍巍
现代信息科技 2019年12期
关键词:主成分分析法

赵建君 杨伟男 虞赟泽 蒋巍巍

摘  要:针对众包任务的合理定价问题,首先将任务定价划分为区域间任务定价和区域内任务定价。其次针对区域间任务定价,运用K-均值聚类法划分任务区域;选择合理指标,建立基于主成分分析法的优化任务定价模型。针对区域内任务定价,确定会员中心及区域内任务定价与到会员中心距离的关系。最后通过循环遍历法得到众包任务定价方案。通过新定价方案与原方案的对比表明,该模型可以制定出准确、合理的任务定价方案。

关键词:主成分分析法;红细胞计数法;循环遍历法;K-均值聚类

中图分类号:TP301.6      文献标识码:A 文章编号:2096-4706(2019)12-0072-03

Abstract:To solve the problem of reasonable pricing for crowdsourcing tasks. Firstly,divided it into inter-regional task pricing and intra-regional task pricing. Secondly,according to the inter-regional task pricing,the K-means clustering method is used to divide the task areas,and the optimal task pricing model based on principal component analysis is established by selecting reasonable indicators. Aiming at the task pricing in the region,the relationship between the task pricing in the member center and the distance from the member center is determined. Finally,the pricing scheme of crowdsourcing tasks is obtained by cyclic traversal method. The comparison between the new pricing scheme and the original one shows that the model can work out an accurate and reasonable task pricing scheme.

Keywords:principal component analysis;red blood cell counting;loop traversal;K-means clustering

0  引  言

0.1  背景

众包是指将传统企业内部完成的任务通过公开招标的形式,转交给非特定的外部网络群体完成,参与个体分别提交方案后,发包方择优而选,并对中标者给予奖励的问题解决模式。众包作为一种新兴商业模式,对其研究侧重于基础理论,缺乏一套合理的评价体系为企业運用众包商业模式提供指导[1]。

0.2  问题

为提高众包任务完成度,以及建立合理的指标评价体系并对众包模式下的任务进行定价,本文借助众包任务定价模型通过聚类分析,设计出在保证众包任务完成度最高的同时满足众包模式下的任务定价较低的方案。对此,本文以广州、佛山、东莞、深圳区域的已结束众包任务为例,对每个任务进行重新定价。

1  算法

1.1  区域间的任务定价

1.1.1  采用K-均值聚类算法划分区块

本文研究的众包任务共有835个任务,分布于广州、佛山、东莞、深圳四个区域,为了使任务定价更加准确,本文采用血红细胞计数法的思想,采用K-均值聚类算法将所有任务点划分成20个区域。聚类完成后,发现有三个类中只有一个任务点,故将这三个任务点归入到其最近的类当中,最终得到17个区域。

1.1.2  指标选取

首先搜索影响众包任务定价的因素,确定以任务点定价为目标层,经济发达程度、会员情况、交通便利程度为准则层,以区域内商场数量、区域内会员可接任务情况、区域内可接任务情况、区域内平均信誉值、平均预订任务开始时间、区域内公路数量为指标层。

通过各区域统计年鉴和“地图无忧”地图平台,确定划分的17个区域的各指标相关数据,如表1所示。

1.1.3  建立基于主成分分析法的优化任务定价模型

由于本文选取了6个指标,因素较多,且指标之间存在重叠,因此我们采用主层次分析法进行降维处理,把原来多个变量划为少数几个综合指标,并使这些少数综合指标尽可能多地保留原来较多的变量所反映的信息。

新任务定价方案下任务平均定价为69.97元,完成率为85.87%;原任务定价方案下任务平均定价为69.11元,完成率为62.51%。新任务定价方案在原任务定价方案定价提高了1.24%的情况下,任务完成率提高了23.36%,新任务定价方案效果非常显著。

2  结  论

本文在基于K-均值聚类算法的众包任务定价模型的基础上,设计出了基于广州、佛山、东莞、深圳四个区域的已结束众包任务的最佳任务定价方案。在保证众包任务完成度最高的同时满足众包模式下的任务的定价较低的目标。本模型适用于多种类型的众包任务定价,适用性强。但考虑到影响定价因素的指标较少,不够全面;使用时还应增加多种因素,进行更多目标化的模型构建。

参考文献:

[1] 解倩男.基于价值网的众包商业模式评价体系研究 [D].西安:西安电子科技大学,2015.

[2] 陈搏,王苏生.基于知识距离的知识定价决策模型及其应用 [J].预测,2008(5):38-44+57.

[3] 韩忠民.知经纬度计算两点精确距离 [J].科技传播,2011(11):196+174.

作者简介:赵建君(1997-),女,汉族,浙江湖州人,本科

在读,研究方向:计算机科学与技术;通讯作者:蒋巍巍(1980-),男,汉族,浙江青田人,硕士研究生,讲师,研究方向:计算机网络应用。

猜你喜欢
主成分分析法
山东省旅游产业竞争力评价研究
中国装备制造业阶段竞争力研究
陕西省各地区人力资本水平综合评价与分析
基于主成分分析的煤层气赋存影响因素分析
成都市中心城区商服用地基准地价空间演变规律研究
基于主成分分析法的高校财务风险评价指标体系构建
太原市土地可持续利用研究
基于主成分分析法的成都市房地产泡沫程度评价
考察我国各省市自治区社会发展综合状况
金华市服务外包产业科技创新能力研究