基于双变量定价模型的众包定价策略研究*

2018-08-03 07:25邵静宜苏岐芳
台州学院学报 2018年3期
关键词:完成率配额定价

邵静宜,苏岐芳

(台州学院 数学与信息工程学院, 浙江 临海 317000)

1 众包活动的研究背景

传统的商业战略中日益高昂的服务费用开始让这些商业决策者被网络群体力量所吸引,也就是在战略设计上融入众包概念[1]。近年来,众包为传统数据管理提供了一种通过汇聚群体智慧求解问题的新模式,并成为当前数据库领域的研究热点之一[2]。基于移动互联网的自助式劳务众包平台的APP油然而生,其核心为合理的任务定价,所以合理的为众包活动中任务定价是实现商业共赢的关键。为解决这一核心定价问题,本文以2017年全国数学建模竞赛B题数据[3]为支持,建立双变量定价模型对众包任务中定价方案进行研究。

2 影响定价因素分析

2.1 任务位置与会员情况分析

2.1.1 任务位置情况分析

将任务位置经纬度导入“地图慧”平台。通过观察图1发现各个任务大致分布在三个地区:广州、东莞、深圳。

2.1.2 会员情况分析

观察图2发现东莞地区的项目完成率最好;广州地区项目完成率较好;深圳地区的项目完成率最差。将任务和会员位置按图2进行大致分区,其中个别会员距离任务区域过远,故不在考虑范围之内。

图2 位置分区图

2.1.3 确定影响范围

任务点和会员的影响范围半径是由人的出行距离决定的。由文献[4]知人拥有机动车的出行距离为12.6 km。根据地球上任意两点的经纬度计算两点之间的距离条件知:若假设选取的任务点的经度为j,纬度为w,则需要研究的经度范围为j±0.126°,纬度范围为w±0.088°。若有特殊情况的任务点,范围按实际情况分析。

2.1.4 会员信息筛选

根据任务点影响范围,筛选平台中会员信息,获取附近会员数量、任务限额总数和总信誉值。

2.2 定价规律分析

2.2.1 以任务为中心的定价规律

已知任务点周边研究的经度范围波动在±0.126°内,纬度范围波动在±0.088°内,选取几个典型性任务点,确保这些点的分布和覆盖范围能大致覆盖全部区域如图3所示,每个任务点按图相应编号。

图3 选取的任务点分布与范围覆盖图

按照影响范围,对会员信息进行筛选,获取对应编号的任务点附近会员数量、任务限额总数和总信誉值信息如表1所示。

表1 选取任务点的附近信息记录表

2.2.2 以会员为中心的定价规律

某个会员能够影响的任务是由会员与任务之间的距离决定的,影响的任务数量是由会员的任务配额数决定的,这样构成了会员影响的任务区域。已知某一任务位置的经纬度(x,y)与某一会员的位置的经纬度(a,b),根据文献[5],写出两点的经纬度计算之间的距离公式如下:

其中R为地球半径。

因为已结束项目的任务数量共有835单,配额起码在6单以上的高等级会员影响任务的情况更具有连续性。因此随机选取部分高等级会员,分析任务在距离变动下的定价情况。

对上述情况分析可以得到以下定价规律:

(1)对于某一个任务点,当附近会员数增加时,定价降低。

(2)对于某一个任务点,当附近会员预定任务限额总数增加时,定价降低。

(3)以某一会员为中心点,其影响范围内的任务,距离会员越远定价越高。

2.3 任务未完成原因分析

2.3.1 选取区间

选取未完成任务区域中有代表性的区间,区间选取如图4和图5所示。

图4 未完成区域的区间选取第一部分图

图5 未完成区域的区间选取第二部分图

2.3.2 分析区间中的任务和会员信息

这五个区间内的任务和会员信息分析情况如表2所示。

表2 五个区间分析情况表

分析表2发现任务未完成原因如下:

(1)某任务的定价低导致任务无法完成。

(2)某任务所在区间内的会员人数少导致任务无法完成。

(3)某任务所在区间内的会员等级低导致该任务无法完成。而导致会员等级低的原因可能有:该软件刚开始在该地区实施;该地区人们完成该软件任务是业余模式;该地区位于偏僻地区等。

基于文献[6-12]的研究,分析已知的定价规律与任务未完成原因可知,影响定价有两个因素:一是以某一会员分配到的任务的相对距离,二是以某一任务为中心的会员数量。

3 双变量定价模型的建立与优化

3.1 双变量的数据获取

3.1.1 任务相对距离分析

在任务分配的过程中,应避免会员因配额数过小,从而分配不到任务导致任务空余的情况产生。故任务分配策略是计算会员配额数量的核心:若配额数量大于1,向下取整;若配额数量小于1,向上取整。

使用式(1)计算每一个任务到会员的距离。以某一个会员为中心点,出行距离12.6 km为半径的范围内的任务进行选取,主要依据是会员的配额数量及任务的距离。从近及远选取相应配额数量的任务,分配好该会员的任务后,删去分配好的任务,从而更新任务表,这样就得到了某一个会员可以分配到的任务情况。算法流程如图6所示。

3.1.2 会员数量统计

为了得到某一任务为中心附近的会员数量,只需要计算出每一个会员离该任务的距离,然后限定范围半径是人的出行距离12.6 km,最后比较会员离任务的距离,统计该任务限定范围内的会员数量即可。算法流程如图7所示。

图6 相对距离算法流程图

图7 会员数量统计算法流程图

3.2 利用回归分析建立模型

3.2.1 判断定价与会员数量以及相对距离的相关性。

利用SPSS软件对获取双变量的数据与定价数据进行相关性分析。通过皮尔森相关系数表明双变量与定价是相关的。

3.2.2 判断定价与会员数量以及相对距离的线性关系

利用SPSS软件对双变量的数据和定价进行线性分析。会员的数量与因变量定价在线性关系上是显著的,但是相对距离的线性关系并不显著。故对相对距离这个变量进行非线性分析,发现指数函数形式符合该变量的非线性关系。

3.2.3 确认参数

使用SPSS软件对双变量进行非线性回归分析,相应的参数如表3所示。

表3 变量的参数评估表

由表3得知,参数是显著的,以评估值作为的参数式子是可靠的。取新定价的初始值为原定价的平均值69,建立双变量定价模型如下:

模型的实际效果通过新旧方案在整体价格、完成率、未完成原因这些方面进行比较呈现。整体价格上新方案较旧方案减少了300多元;完成率上新方案分配后只有九单任务未分配到具体人,完成率提高了30%;未完成任务原因上新方案将某些区间任务的定价相应的提高,减轻了任务定价低对任务未完成的影响。

3.3 优化基于双变量的定价模型

考虑当任务单个发布时,任务会有不被选择的情况出现,以及若会员数远远大于任务数会出现竞争激烈的情况,所以需要把任务联合打包。利用位置变量将多个任务点进行任务打包,同时只有符合条件的会员是可以选择打包任务。

任务打包操作:

第一步,选择打包距离。首先根据式(1)计算两两任务之间距离,观察发现1000 m是较为合适的打包距离。所以只考虑1000 m以内的任务进行打包。

第二步,初步打包。此时得到了距离小于1000 m的两两任务情况,将两两任务附近能关联起来的少于1000 m距离的任务进行初步打包。例如:任务1和任务29之间的距离小于1000 m,任务29和任务31之间的距离小于1000 m,以此类推,把这些任务均打包。

第三步,双重检验。第一重检验:初步打包的任务群中两两任务之间的距离均要小于1000 m。若满足这个条件,则保持打包的状态;若不满足这个条件,则对其适当拆分。第二重检验:把通过第一重检验的打包任务群,以其中所有任务的平均经纬度为圆心,13.6 km为半径规划出范围。13.6 km的确定是基于人的出行距离和打包的集中距离。检验在这范围内有无会员可以接受这个打包任务,接受的依据是会员的配额情况。若未通过,则对其由大包拆分成小包以满足该范围内会员的配额情况。

第四步,完成任务打包。若双重检验全部通过,则任务打包完成。

通过任务打包后对双变量定价模型进行一定优化,而此时每一个任务包中全部任务点经纬度的中心坐标作为任务包的所在位置。再在已知任务位置和周边会员的情况下根据式(2)得到任务的合理定价。因为每个任务包中包含任务个数为 Ni(i=1,2,3,...,43),所以任务包的定价模型如下:

其中X=Y·Ni.

3.4 定价方案的完成率模型

为了能够判断打包后定价方案的完成程度,计算出不同定价下任务的完成比例,利用SPSS软件中线性回归模型建立定价与任务完成比例的函数关系,得到完成率模型如下:

考虑任务包中任务个数Ni后,任务包的完成率P也可得到:

3.5 任务打包前后完成率对比

要定量比较打包前后任务定价方案哪个更优化,需将任务打包前的平均完成率与打包后任务完成率进行对比,步骤如图8所示。

图8 打包任务完成率比较流程图

利用双变量定价模型与完成率模型,计算打包任务的定价与打包前后的完成率。比较打包前后的整体任务完成率P前,P后:当P前>P后,打包后降低任务完成率;当P前<P后,打包后提高任务完成率;当P前=P后,打包不影响任务完成率。对支持数据进行计算后发现打包后的任务包中62%的任务包提高了完成率,31%的任务包完成率前后一致,只有7%任务包的完成率在打包后降低了。所以不难知道,打包后的任务的完成率在一定程度上得到了提高。

4 双变量定价模型的应用

为了体现双变量定价模型的实际应用情况,取新项目任务应用所建立的模型。

4.1 任务和会员分区情况

观察图9的热力分布图发现新项目的各个任务集中在广州和深圳两个地方。

图9 新任务在实际地图上分布的热力图

观察位置分布图10,发现任务位置除了是集中在两个地方外,在其中还有格外明显的五块分区,故将任务按图10进行大致的分区,接着获取在这些区域中的会员情况。

图10 新任务位置分区图

4.2 新项目打包定价方案

依据打包要求将任务进行打包发布,因为打包任务过多,故在这里列举几个任务包的具体情况,并取其中部分任务包对其定价效果进行比较和讨论。任务包情况如表4所示。

利用式(3)和(4)将打包任务的定价详情与打包前后的完成率用表5呈现如下:

表5 新任务打包定价与完成率详情表

打包后的任务中62.5%的任务包提高了完成率,所以打包后的任务的完成率在一定程度上得到了提高。

5 结束语

本文通过定价规律和未完成原因分析,得到影响任务定价两因素,以某一会员分配到的任务的相对距离和以某一任务为中心的会员数量具有可靠性。利用SPSS,Excel、MATLAB等软件建立双变量定价模型合理地表示出任务定价与两个变量之间的关系,并在任务打包的情况下进一步的优化该模型,最后通过完成率模型探究了所建立模型的优化程度。

猜你喜欢
完成率配额定价
重要更正
国有企业更容易“走出去”吗?——基于跨境并购完成率的分析
多措并举:洪雅联社提前完成6项指标
碳减排量及碳配额的区别
鱼粉:秘鲁A季配额低于预期,内外盘短期大幅上涨
关于提高航天型号计划完成率的思考
鱼粉:秘鲁A季配额公布,国内外鱼粉价格反弹
利用Fabozzi定价模型对房地产金融衍生品定价的实证分析
电力:可再生能源配额办法出台 确保风光水全额消纳
基于分层Copula的CDS定价研究