张 静
(吉林建筑大学城建学院,吉林长春 130114)
在“互联网+”时代下,电子商务发展愈发迅猛,“拍照赚钱”软件成为电子商务的一大亮点。用户注册成为该APP会员后,通过APP任务发放平台领取需要拍照的任务,完成并提交任务来赚取任务所标定的酬金。但用户的期望收益会随着该软件用户基数的增多而减少,进而导致任务完成率的降低。
刘艳[1]针对服务过程中出现的响应时间问题及如何将相关方利益最大化的问题,提出了一种动态资源定价模型,该种模型通过用户与供应商之间的双向拍卖来实现。模型中用户通过响应时间出价,资源提供商根据负载情况定价。周琨[2]针对航空公司的航班运行一直存在安全与成本的矛盾,建立最优化飞机日利用率的数学模型,运用分枝定价算法进行求解。国成哲[3]创建基于产生新的基本逻辑块的打包算法,能够及时实现信息的更替,使得最终决策结果更加准确、有效。胡欣洁[4]在实时多任务多用户操作系统QNX支持下,重点讨论了实时多任务数字仿真软件的实现和解决的技术关键。
为了解决多个用户同时选择特定任务这一问题,对用户位置和任务均较密集的区域进行单独划定选取,对原有定价模型进行修改,以避免多任务多用户争相选择的问题。考虑到众包平台、会员用户和任务发放点经纬度分布之间的相互关系,我们要找到一种合适的修改方案,使任务发放量最大,同时使会员用户和平台软件的利益最大化,将任务预定时间考虑进去,建立修正的定价模型。通过检验模型的容错率,对比确定出合理的定价方案,并验证其合理性。
一个任务合理定价的得来需要综合考虑若干因素。这些因素要想被有效且快速地运用,需要一个准确的定价辅助分析模型。一般来看,影响任务定价的因素有以下几个方面:(1)任务发布位置。一个好的任务发布位置对于任务价格的影响是巨大的。在人流稀疏、位置偏远的地方发布任务,会使得会员难以在短时间内完成任务。反之,会员不但可以快速完成任务,整个区域内的完成率也会较高。(2)会员位置。会员位置对于任务的完成情况有直接影响。面对同一个任务,同一区域内的会员会存在竞争,但由于会员与任务间的位置远近不同,这种竞争关系的激烈程度也不尽一致。采用何种定价策略来降低会员的时间成本,进而平衡会员与任务的不同距离,是分析模型需要注意的问题。(3)预定任务限额。在初期由于任务较少,可能存在定价不合理的现象。但是随着任务限额投放量的增加,定价最终会趋于合理。(4)信誉值。信誉值对于用户而言是一种激励制度,信誉度高的用户可以优先进行任务预定。并且价格还可随任务预定量的变化而变化,即任务预定量越大,价格越低。
数据来源:http://blog.sciencenet.cn/blog-752541-1075913.html(2017年高教社杯全国大学生数学建模竞赛B题的3个附件)。距离任务最近的会员位置与该任务之间的距离可以通过JAVA软件求得,该算法以被完成的任务为中心。构建for循环,输入参数:内层循环是所有会员的具体地点,定义一个变量为min的函数;外层循环为带有精确经纬度的各个任务位置;输出参数:会员编号以及所有任务到会员之间的最短距离,其中包含所有由程序运行的835个任务。接下来通过链接会员信息表与任务列表进行数据处理。最后通过数据可视化技术,把会员表跟任务表进行完整链接并把主键建立为会员编号,得到的部分结果如表1所示。
表1 自然连接表
用户信誉度与开始预定时间、会员配额之间存在一定程度上的正相关关系。其中,配额指的是在一天时间内某一位会员最多可以顺利完成的任务数,配额的多少将直接影响任务的最终完成情况。会员与任务间的距离是影响任务完成的另一重要指标,当会员距离任务过远时,他不太可能接受该任务,因此二者之间是负相关的关系。假设用户期望值是用户信誉值与任务与用户距离的比值,以任务配额和用户期望值为自变量,以任务定价为因变量,对所有数据进行标准化处理后,再运用SPSS 22.0做线性回归[5],最终可得到模型一的线性关系式:
Y=-0.055m+0.067n+71.445.
其中,m为期望值,n为预订任务限额。
最终由描述性统计量反映出,数据的定价均集中在70元。从Anova图以及模型汇总分析可得出,决定系数为35%,这说明了该回归关系可被自变量解释的比例为35%。统计量F=0.063,说明拟合较好,该模型较良好。
针对多任务多用户争相选择的问题,对原定价模型修正。为避免不利局面的发生,应注重实际效果,按任务的经纬度分布进行合理的组织打包,即在划分的区域范围内将两者相对集中的任务点联合在一起进行打包发布,这样既降低了用户的成本,也完善了供求匹配。加强统分结合,统一实施发放,最后科学地分配到用户,解决多用户互相选择的问题。这样的实施方案,在进一步降低成本的同时也为用户提供了保障。
设计一种修改方案,来避免多任务多用户争相选择的问题,考虑到众包平台、会员用户和任务发放点经纬度分布之间的相互关系,要找到一种合适的修改方案使得任务的发放量最大,同时使会员用户和平台软件达到利益最大化,为此建立三者之间的影响模型。此模型的算法如下:
输入:A数组存放具体任务位置的坐标(Ai0,Ai1);
过程:对A数组存放的坐标进行遍历,for循环:
{inti=0;i {intj=i+1;j 循环条件:(Ai0-Aj0)2+(Ai1-Aj1)2≤M,阈值M设定为0.003; 决定总任务定价的权重由每个任务包中的任务数量所确定,权重W=(11-n)/10; 输出:数组接受打包的3个任务编号,并存储。 实验部分代码及结果如图1和图2所示。 图1 打包过程的部分代码 图2 生成数据 在改进的任务模型中,仍假设期望值为用户信誉度与距离的比值。模型二以期望值和用户配额度为自变量,以任务定价为因变量。考虑到预定时间[6]可能会影响到接单执行的可能性,在模型二的基础上进行修正,将开始预订时间转化为数值作为第三个自变量。应用SPSS 22.0软件,得到自变量前面的系数值,如表2所示。修正的模型二的线性关系表达式如下所示: Y=-0.08x1+0.319x2+0.255x3+0.033x4-0.017. 其中,x1为每个任务包到最近会员的距离,x2为期望值,x3为开始预订时间,x4为任务配额,Y表示任务定价。 表2 线性关系式中的系数表 综合对Anova图和模型分析可知,决定系数R2为5%,说明y的全部变异中,可以通过回归关系被自变量解释的比例为35%。如果统计量太小,表明因变量能被自变量解释的程度很差,得到的回归直线意义很差;反之,则拟合较好。此处的F=0.06,说明拟合较好。 4.1.1 算法思想 (1)输入变量:用户期望值、用户与任务之间的最小距离、任务定价、模型预定任务额、拟合任务定价、用户开始预订时间; (2)循环条件:abs(拟合任务定价-任务定价)≤ 3; (3)输出结果:如果满足算法循环条件,则算法输出1;若不满足,则结果为0; 本文设置的任务定价容错率(阈值)为3。采用四个区域的拟合方程来拟合任务定价。图3是检验容错率的部分Java代码。 图3 检验容错率的部分Java代码 4.1.2 统计结果 任务定价模型:广州市任务定价容错率的结果比对模型正确的概率值为68.31%;佛山市任务定价容错率的结果比对模型正确的概率值为74.52%;深圳市任务定价容错率的结果比对模型正确的概率值为80.14%;东莞市任务定价容错率的结果比对模型正确的概率值为76.13%。 解决多用户多任务争相选择问题的模型:广州市任务定价容错率的结果比对模型正确的概率值为79.31%;佛山市任务定价容错率的结果比对模型正确的概率值为85.67%;深圳市任务定价容错率的结果比对模型正确的概率值为90.03%;东莞市任务定价容错率的结果比对模型正确的概率值为86.45%。 其中,πi=E(yi),因而选取权数为ωi=nipi(i-pi). 对四个区域的数据,依次点选SPSS软件Statistics-Regression-Logistic命令,进入Logistic回归对话框,选入变量,点选OK运行。统计结果为: 任务定价模型:广州市任务定价模型正确的概率值为67.21%;佛山市任务定价模型正确的概率值为72.59%;深圳市任务定价模型正确的概率值为79.04%;东莞市任务定价模型正确的概率值为74.35%。 解决多用户多任务争相选择问题的模型:广州市任务定价模型正确的概率值为75.19%;佛山市任务定价模型正确的概率值为84.76%;深圳市任务定价模型正确的概率值为90.12%;东莞市任务定价模型正确的概率值为85.54%。决定系数R2=0.9243,显著性检验值P≈0,高度显著。 本文首先结合会员的信息,基于会员与任务的最小距离、会员预定任务限额以及会员信誉度3个指标,建立多元线性回归模型,衡量不同时间段不同区域内的“供需匹配”程度是否适合。然后对4个区域定价容错阈值内的正确率进行分别计算,通过Java软件进行运算分析,当各个区域内的阈值正确率不低于70%时,方可认为该方案是合理有效的。 对于多位用户集中选择某一任务的问题,模型也有单独的应对措施。模型单独为这种用户和任务均比较密集的区域进行修改优化。首先按任务的经纬度分布进行合理的组织打包,即在划分区域范围内将两者相对集中的任务点联合在一起进行打包发布,这样避免了任务高峰期的局面发生。其次将任务预定时间考虑进去,建立实时的定价模型,使得任务的发放量最大,同时使会员用户和平台软件的利益最大。3.2 修正后的模型结果及分析
4 模型检验
4.1 检验标准一
4.2 检验标准二(分组数据的Logistic回归模型)
5 总结和评价