一种任务定价APP的模型设计研究

2020-03-12 01:44凌雪岷
玉溪师范学院学报 2020年6期
关键词:完成率定价会员

凌雪岷

(安徽新华学院 通识教育部,安徽 合肥 230088)

随着互联网普及率的提高以及web2.0时代网络虚拟产品交易的兴起,众包的电子商务模式得到了广泛的运用并占据了越来越重要的市场地位.“拍照赚钱”是企业用移动互联网下的自助式服务模式,用户则通过提供商业调查和信息搜集的数据来获取相应的任务报酬.这种新颖的调查方式比传统的方式节省了调查成本且更加有效,但定价不合理,任务完成率降低,往往会导致商品检查的失败.为了设计出合理定价方案,本文根据已完成任务的相关数据[1],运用K-means算法,初步观测定价大致的分布规律,采用两种方法建立了不同位置的任务定价模型[2,3].

1 定价规律分析

1.1 任务定价数据分析

通过对文献[1]附件1中任务的定价与任务位置,用spss进行初步分析,发现在区域中心位置上任务标价比较低,然后以逐渐递增的方式向边缘扩散.

选取4个区域,将这些任务位置对应于地图上,发现其对应4个城市,分别是广州、深圳、佛山和东莞,再运用K-means算法对每一个区域找出它们的中心.因此,对于附件1中给出的样本数据,对广东地区中的所有样本做方差,以及同一区域所有样本间的距离均值为R,初步把选择位于样本分布密集区域,且相距较远的样本为K-means的初始聚类中心.最初的选择过程为:

(1)选择方差最小的那个样本为第一个类簇的初始中心,以R为半径做圆;

(2)在圆之外的样本中,寻找方差最小的样本作为第二个类簇的初始中心,直到第k个类簇的初始中心选择到.

此时,得到了K-means算法的初始聚类中心向量,其他3个区域以此类推,以下用距离来度量样品之间的相似性程度.

图1 任务定价分布图

1.2 K-means算法聚类模型

假设待聚类数据集为:x={xi|xi∈RP,i=1,2,…,n},k个初始聚类中心分别为C1,C2,…,Ck,用A1,A2,…,Ak表示k个类簇所包含的样本的集合为A.定义:样本xi,xj之间的欧氏距离为

(1)

样本xi到所有样本的距离的平均值为:

(2)

则样本xi的方差为:

(3)

那么有数据集样本的平均距离为:

(4)

这样,找到聚类误差平方和公式:

(5)

确定其算法的步骤:

(6)

A=A-A1

(7)

A=A-Ac

否则,找到k个初始聚类中心C1,C2,…,Ck转入步骤b.

②构造初始划分:a.根据(1)计算数据集中每个样本到各个初始聚类中心的距离,根据相似性原理将样本分配到距离最近,即最相似的类簇中,得到初始划分;b.计算每一个类簇中所有样本的均值,作为该类簇的新中心;c.根据(5)计算当前聚类结果的聚类误差平方和E;

③ 重新分配样本并更新聚类中心:a.根据(1)计算数据集中每个样本到各个类簇中心的距离,根据相似性原理将样本分配到距离最近的类簇中;b.计算每一个类簇中所有样本的均值,作为该类簇的新中心;c.根据定义5计算当前聚类结果的聚类误差平方和E′;d.如果E′-E<10-10,即聚类中心不再变化,则算法结束,输出聚类结果.否则,令E′=E,转向步骤③.

1.3 利用数据拟合方法建立任务定价模型

将样本数据代入,观察数据集的大致情况.发现可以用曲线拟合来判定位置与定价的关系,于是对某区域中价格最低的点的位置取一个均值(记为r),将任务定价记为W,可以模拟出一个关于(r,W)的二次曲线.有

W=a+br+qr2

(8)

图2 位置与定价关系曲线模拟图

从任务位置中任意选取100个,用计算器来近似确定a,b,q的值.

a=39.037 7,b=5.756 6,q=65.809 0

得到W=39.037 7+5.756 6r+65.809 0r2,则得出了任务定价的一般规律,即:以(23.125 35,113.298 9)为任务定价中心,周围定价与其到该中心位置的距离满足上述二次函数关系,验证了刚开始观测到的现象.将k-means算法与任务定价位置一一对应起来.

将定价为65的点的位置取均值记为o,定价为66 的点作为一类,取这些点位置的平均值记为o1,再记这个平均值点到o点的距离为r1.再对定价为67的点作为集合取平均值记为o2,到o点的距离为r2.当r2>r1时,将其纳入定价为67的集合; 当r2≤r1时,将其归入定价为66 的分类中.再对定价为68的点作为一个集合取其位置的平均值记为o3,到o点的距离为r3.当r3>r2时,将其纳入定价为68的集合中,保持不变; 当r3≤r2时,将其纳入定价为67 的集合中.后该定价以此类推,直到定价为85的点.

1.4 利用倒推方法建立任务定价模型

对于区域,各点定价按递增方式排列m0

① 查找定价为m0元的点,得到(α01,β01),(α02,β02),…,(α0k0,β0k0),记

(10)

(11)

得(α0,β0),认定该点为该区域中心;

② 查找定价为m1元的点,得到(α11,β11),(α12,β12),…,(α1k1,β1k1),记

(12)

③ 查找定价为m2元的点,得到(α21,β21),(α22,β22),…,(α2k2,β2k2),记

(13)

○n 查找定价为mn元的点,得到(αn1,βn1),(αn2,βn2),…,(αnkn,βnkn),记

(14)

图3 价格与完成率关系图

(15)

(16)

(17)

其中

(18)

注1 插入价格与任务完成情况线性关系的图片来反映价格越高完成率越高.

1.5 分析任务未完成原因

未完成的任务多集中在深圳和广州(见图4),这是因为:

图4 完成与未完成任务分布图

① 城市中心任务定价低于边缘,定价本身没有满足接包方的要求;

② 考虑到是交通拥挤、物价水平高,任务完成过程中接包方对于信息取材所花费的成本与心中期望值有落差,导致有些任务没有被接手;

③ 任务难度较大,不易完成;

④ 任务复杂性较大,完成过程过于繁琐;

⑤ 部分接包方马虎对工作不够认真,导致任务无法完成.

2 定价模型建立与求解

2.1 分析

对文献[1]中的位置与完成度图进行观察和分析后发现,未完成的任务多数集中在深圳、广州较中心地区.

图5 任务完成与会员分布情况

图6 任务与价格情况

以附件二中会员的位置为考量,将会员位置与完成及未完成的位置进行一个散点分析.发现有些地区附近会员虽然很少、路程远,但还是被完成了.而有些是会员离任务很近却没有完成,还有一些是比较大众的情况,任务多会员多,但还是没有完成.这其中,就考虑那些路程远、附近会员少,已完成的是不是任务的定价比较高、任务比较简单?而任务多、会员多,没有完成的是不是与任务定价低有关呢?而恰巧这些区域是在经济发达的东莞、广州,交通拥挤、物价过高造成会员投入成本的增加也成了考虑的一个因素.带着前面两个问题,对照着任务定价的分布位置进行分析,发现有以下特征:

① 在会员比较集中的地方多是任务价格低区,任务未完成;

② 在会员比较集中的位置有些任务定价高的也没有完成;

③ 在一些会员比较少、距离任务近的位置定价高的也没有完成;

④ 在一些会员少、距离较远,定价或低或高均被完成.

图7 未完成任务与会员位置 图8 任务完成情况与信誉高会员情况

图9 已完成任务与会员位置情况

这在很大程度上印证了之前的猜想,任务未完成与交通拥挤造成会员投入成本的增加使得任务标价与其心中期望值不吻合,造成未完成率的升高.再将附件二中信誉高的会员与完成情况作分析,发现靠近深圳与东莞的那一大片区域,虽然有许多信誉高的会员,但是任务未完成率还是很高;在东莞中心区域,信誉高的会员虽然比较少,但是任务完成情况非常可观;而在广州一些中心区域,许多信誉高的会员周边任务也没有完成.因此在对比这会员的已完成情况来分析综合得出:

① 信誉高的会员的完成情况与会员的已完成情况基本吻合,说明信誉高的会员执行能力高,任务完成度高;

② 对于深圳与东莞的那部分区域完成率低的原因应该是任务难度大、任务比较复杂,对比着任务定价来看,这一块的定价普遍不高.

2.2 模型的建立与求解

由上述附件一与附件二数据的整合分析.针对问题一解决方案的不足,设计一种改进方案,综合考虑了会员位置与任务完成情况的影响和人口稠密地区经济较发达、交通堵塞等造成会员拍照成本较高情况这两个方面,建立相关模型关系.设会员总数为S1,(ξg,ηg),表示第g个会员的位置.(γk,τk)表示第k个任务点的位置,对应的任务定价为Mk,设任务点为S2个,(k=1,2,…,S2),设会员到任务点的位置为

(19)

(20)

(21)

与原方案进行比较分析:新方案中对一些任务集中且会员集中情况下任务定价过高,进行了消减,对一些离会员比较远、任务定价低的点进行舍弃.通过这两种手段节省的资金用作会员集中因任务定价比较低导致任务未完成的资金补贴,以此来提高任务的完成率.

微量随机舍弃算法另外,也可以对会员集中且任务未完成集中的区域随机删去某些任务点,通过这种方式筹集流动资金用以对别的未完成任务的定价提高上,用计算机模拟结果,一定程度上提高完成率,即微量随机舍弃算法.

表1 价格与完成率情况表

注3 ① 这里的P1是根据65元完成的任务率计算的; ② 这里的P2是根据85元完成的任务率计算的; ③ 大概提高了6个百分点.

3 结 语

本文根据已知项目数据给出两种定价方案:即以位置偏差为变量,建立偏差与任务定价之间的函数关系和采用倒推方法给出任务定价规律,并在此基础上提出微量随机舍弃算法,在一定程度上提高了任务完成率,但城市人口拥挤如何量化等还需要更进一步的研究优化.

猜你喜欢
完成率定价会员
30万元的MPV搅局者来了!传祺M8宗师系列为什么定价贵?
国有企业更容易“走出去”吗?——基于跨境并购完成率的分析
多措并举:洪雅联社提前完成6项指标
关于提高航天型号计划完成率的思考
会员之窗
会员之窗
会员之窗
利用Fabozzi定价模型对房地产金融衍生品定价的实证分析
基于分层Copula的CDS定价研究
自主定价基本不可能