拍照赚钱APP定价方案的修正模型

2019-04-10 01:08鲁冰儿朱晨晨田源明王志勇
实验科学与技术 2019年1期
关键词:附件定价会员

鲁冰儿,朱晨晨,田源明,王志勇

(1.电子科技大学 计算机科学与工程学院,四川 成都 611731;2.电子科技大学 英才实验学院,四川 成都 611731;3.电子科技大学 数学科学学院,四川 成都 611731)

移动互联网兴起后与各行各业均有结合,“拍照赚钱”即为借助移动互联网平台产生的一种自助式服务模式。用户若要在此APP上赚钱,则需下载APP,注册成为APP的会员。其后根据自身情况和APP上存在且无他人领取的拍照任务实际对任务进行认领以赚取对任务所标定的酬金。因而平台成为此自助式服务模式的核心要素。但若APP对所给任务的标价不合理则会因无人问津而导致任务失败。

给出已结束项目的任务数据和会员信息数据,现有是一个新的检查项目任务数据,只有任务的位置信息。

现完成如下4个问题。

1)研究已结束项目中项目的任务定价规律,分析任务未完成的原因。

2)为已结束项目中的项目设计新的任务定价方案,并和原方案进行比较。

3)实际情况下,多个任务可能因为位置比较集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对最终的任务完成情况又有什么影响。

4)对新的检查项目任务中的新项目给出你的任务定价方案,并评价该方案的实施效果。

1 数据预处理

题目已知已结束项目和新的检查项目任务分别提供了附件一的835个已结束项目的任务数据、附件二中的1 877个会员信息数据以及附件三中的2 066个新检查项目的任务数据进行分析。由于数据量较大,此处需要对所给的数据进行一定的预处理,以防止其中有出错的数据在计算时对结果造成事与愿违的影响而出现误差。

借助“地图无忧”网站,将附件所给数据分别按照已结束项目中已完成任务数据、已结束项目中未完成任务数据、会员信息数据、新检查项目的任务数据这4个图层以已知经纬度批量输入。

根据已知信息的地理位置分布得到,绝大多数的数据点均分布在广东省内的广州市、深圳市、东莞市和佛山市,极少数的点出现在这4个城市外。后续分析以此四城市为基准,剔除不符合条件的数据。

此外对比所有数据的经纬度,存在记录员将会员位置的经纬度记反而出现误差,需要修正的数据。完成数据的剔除和修正,后文的建模和求解均建立在此数据预处理的基础上进行。

2 多元回归分析模型

2.1 K-means聚类

根据上述分析,此处利用K-means聚类算法[1]将附件一中835个任务的经纬度数值相近的部分进行聚类处理。

由于任务数目过多,若聚类时设定的分类数目过小则容易导致分类不准确并且结果误差大。故以经纬度为参照,对已完成任务的聚类分析数目设为20类。

设附件一中的s个任务的经纬度点分别为:

{(LonA1,LatA1),(LonA2,LatA2),…,(LonAs,LatAs)} 。

其中LonAi表示第i个任务的经度,表示第i个任务的纬度。

找到20类聚类的中心点:{(LonA1,LatA1),(LonA2,LatA2),…,(LonA20,LatA20)}。接下来将20个聚类中心从任务集合剔除,其次将任务从i=21开始编号,对剩余的数据点进行聚类,使每个数据点和最近聚类中心的欧式距离平方和最小,将这个距离平方和记为目标函数Ws,其数学表达式为:

(LatAi-LatAj)2|

(1)

在对已完成项目数据以其GPS经纬度完成聚类操作,聚为20类。得到这20个中心点后仅从此MATLAB的聚类图难以进行下一步的分析,需要和后续附件的数据结合在一起讨论。

由此将20个中心点对应的经纬度输入“地图无忧”,得到地图上的分布图如图1所示。

图1 聚类中心的地理位置

注意到中心点输入之后均匀分布在前文讨论的数据范围内,但其中从化区右上方的3个中心点在聚类完成后均只聚集了一个任务,过于特殊,不具有一般性,即不能代表一部分数据的特性。因而在划分时去掉这3个中心点,将原有的聚类为20部分更正为17部分进行后续讨论。

2.2 定价规律回归分析模型

在得到附件一中已完成任务数据的聚类结果后,考虑以结果区域为单位,分析该在对物品定价时服从的规律。则需要一定的指标来评判定价的趋势以给出分析。指标的选取依据附件已知信息,附件一、二中提供的相关指标有任务GPS纬度、任务GPS经度、任务执行情况、会员位置(GPS)、预订任务限额、预订任务开始时间、信誉值7个指标。

引入指标区域内会员平均距离来表示各区域聚类中心到该区域内各会员距离的平均值。

引入指标区域内会员水平将会员的预订任务开始时间和信誉值两者综合起来。

引入区域内供求比衡量相对需求量。

以任务聚类时的聚类中心点为圆心,取适当的半径画圆,此圆范围内的会员均属于此区域,要求所有中心点组成的圆群可以覆盖到每个会员且每个中心的划分半径出于计算方便的考虑,尽量选取该中心与邻近区域中心距离的一半。在划分过程中,若有会员被重复划分,无需删除,可重复属于某一区域。

在对附件一中的定价规律可能涉及的因素进行量化后,考虑该定价规律可能是不正确的,即可能没有考虑到所有的因素。

因此,采用后退逐步回归的方法来拟合出定价规律,建立多元线性回归方程[2]:

y=ε+ax1+bx2+cx3

(2)

式中,y为价格,x1为会员水平,x2为供求比,x3为平均距离。拟合后进行显著性检验,对其中显著性值过大的变量进行剔除,并再次拟合,直到无变量可剔除为止。其中,自变量分别为距离、供求比、会员水平,因变量为价格。

进行回归分析后,剔除自变量距离后的拟合效果很好,会员水平和供求比的显著性均小于0.05。

由此,得到多元回归模型:

y=67.648+55.87x1-9.772x2

(3)

从此式也可以看出,该平台在定价时没有考虑距离因素,与距离因素不相关。

通过多元回归解析式,可以得出定价规律为:

以67.648为基础定价,以此为基础考虑区域内的会员水平和区域供求比两个因素,且会员水平为增加定价的指标,供求比为减少定价的指标。

2.3 任务未完成原因分析体系

本文可以从宏观和微观两个角度建立任务未完成原因分析体系。宏观即为以市的角度讨论任务的完成度与各城市指标之间的联系。微观即为从单个任务的角度分析个例中存在的特殊情况,讨论任务未完成的原因。

2.3.1 宏观

1)经济水平。

以人均GDP[3-6]来衡量四市的经济水平可得,东莞市的人均GDP仅为深圳市的48.29%,但是平均定价却比深圳市高了4.67%。由此得出结论:对于经济水平较高的城市,其任务未完成的原因在于定价过低导致了对会员的吸引力低,不倾向于接平台发布的任务。

2)地理位置偏远。

经统计,三市城区外任务完成率与所得的三市全市的任务完成度相比,均有一定程度的下降。地理位置偏远对任务完成度有很大的影响。由此可得结论,地理位置偏远是任务未完成的重要因素之一。

3)信誉值与配额问题。

经计算,广州市和佛山市未完成任务处于配额过低会员周围的数量均占总任务未完成数的50%左右。这一影响可得结论,信誉值与配额的分配不当是任务未完成的重要因素之一。

2.3.2 微观

微观角度从具体的地点进行分析,将附件一所有数据输入网站 分析各数据的尽可能详细的坐标地点,根据地点的详细地址和周围情况分析任务未完成的原因。

以深圳市为例,在深圳市的127个未完成任务中,仅学校、水库、消防队就有10个,这些地方均难以进入。还有训练场、充电厂、工业园等有10个,对于简易完成的拍照任务来说,这些地方都有各种各样的原因难以完成拍照任务,或是地点本身就难以进入。分析有16个公园、景区类任务,17个从卫星地图上观察处于城市绿化内的任务未完成的原因可能是此类地方的拍照任务较有难度,涉及某些专业相关知识,因此会员也不倾向于接受此类任务。

广州市、佛山市也均有类似原因。此类由于拍照任务目的地特殊而未能完成任务的情况在总体未完成任务中占比较大。

车身侧面最动人的无疑是SAV标志性的车身比例。相比上一代车型,全新BMW X5尺寸全面加大,轴距比前代车型长42毫米,由此带来了更加舒展的车身。同时精确的腰线从后门处上扬,构成了富有力量感的肩部特征,并与伸展到侧翼的3D立体悬浮LED尾灯相融合,展现了富有艺术气息的科技感和雕塑感。环顾全新BMW X5不难发现它散发着X家族强劲、清晰而精确设计特征,让时尚感与豪华感并存。

3 优化定价方案

3.1 定价方案

以附件一中所有定价的平均值S0=69.11作为总基础定价。其次考虑各市的经济水平因素,并综合考虑各市的总会员人数、会员完成任务成本等因素以确定各城市的基础定价。

为了保证基础定价的合理性,采用价格转移的方式对基础定价进行修正,综合考虑以上3个因素,对3个因素标准化后的数值进行取平均值作为价格转移系数[7],其计算公式为:

(4)

式中,λi表示各城市的价格转移系数,αi、βi、γi分别表示各城市的经济水平综合得分,各城市的会员数量,各城市的人均工资标准化后的数据。接下来,对价格转移系数赋系数得到价格转移函数Ei(k)。

Ei(k)=5λi

(5)

最后,基于各城市的基础定价,综合考虑结合距离、区域供求比等因素,对各城市的任务进行定价修正。

1)采用K-means算法对各城市的会员聚类,将广州市、佛山市、东莞市、深圳市的会员分别聚为6、5、5、4类;

2)对附件一中的任务进行划分,找到每一个任务所属的会员区域;

3)计算出每一个任务所在区域的供求比、信誉等级平均值及与会员聚类点的距离。

(6)

(7)

式中,Q(p)表示供求比修正函数,p表示任务距所在区域的供求比。

(8)

式中,R(g)表示信誉等级修正函数,g表示任务所在会员区域的会员平均信誉等级。

所有的任务都可以通过上式重新计算定价。现以任意一点A0272为例,对其新定价计算结果进行展示,原价为68元,更正之后的定价为76.545元。

3.2 新旧定价方案比较

3.2.1 会员收入的变化

定价提升则会员任务的收益增加,会员更倾向于完成任务,也会吸引更多的人加入此APP平台。对于此方面的变化,每个任务计算新定价模型中的定价与原价进行比对即为新的任务定价方案和原方案的比较。

3.2.2 APP平台收入的变化

平台的盈利取决于其收取企业的金额和支付给会员的金额差,对企业支付金额的比例分配。

(9)

经计算,平台支付给会员的利益占企业支付金额的比例为x=0.7。基于此计算,制订新的定价方案后,平台收入减少了11.35%。

3.2.3 任务完成度的变化

以在上文制订出的方案为基础,增加会员选取任务的心理因素进行模拟,对任务的完成情况进行仿真,来比较采取新的方案后任务完成度的变化。

1)每个会员选取任务时,优先考虑选择离他最近的10个任务之一,如果10个任务均被选完,则从第11个开始依次往后选取;

2)在原则(1)的前提下,每个会员优先从价格最高的3个任务中进行随机选择,如果均被选完,则优先考虑距离因素。在距离接近的情况下,考虑价格因素;

3)会员接取任务时,与自己的心里预期值进行比较,若小于心理预期值则不会接取任务,若大于或等于心理预期值,则接取任务。

心理预期值确定方法:假设一个月工作22天,每天工作7 h,则一个月工作时长为154 h,则各城市的单位工作收益的计算公式为:

(10)

假设APP平台拍照任务每单耗时为t,则会员对是否接取任务的心理预期值计算公式为:

(11)

3.2.4 APP平台可持续发展

对模拟结果进行具体分析,统计出各个信誉等级会员的接单率、完成率及平均收益。与原有的定价方案进行比较,得到各个数值的变化,分析平台在降低自己利益的情况下,能否满足提升会员数量等利于自己发展的目的。

经计算分析,以广州市为例,修改前任务完成度为0.609 4,修改后任务完成度为0.722 0,提升百分比18.48%。由仿真结果观测,新定价方案的实施对深圳市的任务完成度有极大的提升,对广州市和佛山市提升幅度较小,对东莞市基本无变化,但也是小幅增长并未下降。同时考虑到在改变定价方案以前东莞市的任务完成度就已经达到98.883%这一现象,新定价方案对这4个APP使用城市的任务完成度提升是显而易见的。

对前述的模拟结果分析,发现平台只减少了自己11.35%的利益,却提升了19.74%的任务总体完成度。同时,使4个APP主要使用城市的完成度都得到了提升。从某种程度上来讲,调动了会员的积极性,甚至能吸引新会员的加入,均有利于平台的可持续性发展。

最重要的一点是,新的定价方案解决了东莞市整体和佛山市内部的一个溢价问题,使平台的投资更加均衡,该改变也有利于平台的可持续发展。

4 打包任务模型

4.1 打包模型

选取层次聚类算法[8],将每个任务点视为一个原子簇,采用最邻近方法,定义类间距离为两类之间数据的最小距离。设置聚类的终止条件为最近的簇之间的距离超过阈值3 km。本文中数据均为数值型数据,因此选取欧式距离来衡量不同类别数据点间的距离(相似度),将满足条件的原子簇不断聚为一簇,即完成了对近距离任务的打包过程。

对已完成项目聚类处理后,以广州市打包类别11为例。

其打包所含任务数为3,定价为203.97元。

4.2 定价修正模型

任务集所含任务数量及其周围会员数量从某种程度上可以体现出任务集受欢迎的程度,即任务集所含任务数量越多,任务集周围会员数量越多,则任务集受欢迎的程度越高,对其定价降低的程度也就可以越高[9]。

建立价格降低程度δ、任务集周围会员数量m和任务集所含任务数量n的函数关系式:

(12)

选取10个距离第i个任务集最近的未打包任务,将第i个任务集降低的定价根据距离分配给这10个任务。假设这10个点距任务集中心的距离为ui,则每个任务点分配到的定价为:

(13)

修正后的定价模型为:

若任务被打包分配,则其所在的任务集的任务定价为(sij表示第i个任务集中第j个任务的定价):

(14)

若任务未被打包分配,但任务集对其进行了定价分配,则其定价为:

Si=S0+Ei(k)+Q(p)+R(g)+D(s)+s+

(15)

若任务未被打包分配,且任务集没有对其进行定价分配,则其定价为:

Si=S0+Ei(k)+Q(p)+R(g)+D(s)

(16)

经仿真测试计算,以深圳市为例,打包前,任务完成度为0.565,任务数为173,打包后,任务完成度为0.782,任务数为42,完成度变化38.41%,任务数变化为75.72%。

5 新定价方案模型及评估

5.1 新定价方案模型

将前面建立的定价模型和定价修正模型综合起来,得到考虑打包因素后的定价模型[10]。以2.2节得到的多元回归模型,延续其旧方案下定价的研究,将其应用于所求数据,模拟出旧方案下的定价[11-12]。

5.2 评价模型

以3.2节中新旧方案比较为基础,仍旧选取会员收入的变化、APP平台收入的变化、任务完成度的变化、APP平台可持续发展为四项评价指标,计算方法同3.2节。

6 结束语

运用上述的任务定价模型,结合新任务中的任务地理位置,计算出新的任务定价方案。以广州市为例,其类别为14的打包任务所含任务数为5,价格为333.21元。依据旧方案,广州市任务编号为C0069的任务定价为74.575元。平台收入变化模型计算出新任务定价方案与原规律制订出的定价方案的平台收入的变化,其结果得,平台收入降低29.88%。对新旧任务定价方案进行完成度的仿真,其结果以广州市和深圳市为例,其新旧定价方案的完成度均上升。对前述的模拟结果分析,发现平台减少了自己29.88%的利益,对于广州市和深圳市分别提升了38.67%和75.68%的任务完成度。同时,考虑到新项目中任务数量很大,使两个任务主要分布城市的完成度都得到了提升。从某种程度上来讲,调动了会员的积极性,甚至能吸引新会员的加入,均有利于平台的可持续性发展。

猜你喜欢
附件定价会员
30万元的MPV搅局者来了!传祺M8宗师系列为什么定价贵?
大型外浮顶储罐安全附件常见问题
附件三:拟制定的标准汇总表
会员之窗
会员之窗
会员之窗
关于TSG 07——2019附件M与TSG Z0004——2007内容的对照
利用Fabozzi定价模型对房地产金融衍生品定价的实证分析
基于分层Copula的CDS定价研究
新型武器及附件展呈