李俊 卓应广 秦丽文
The Multi-Task Packaging Pricing Model of "Make Money by Taking Pictures"
Based on Nonlinear Regression
LI Jun1, ZHUO Ying-guang2, QIN Li-wen1
【摘 要】“拍照赚钱”是一种新颖的网络商业机遇。通过对多个任务进行打包发布不仅可以使用户的满意程度提高,还可以使得商家获得较高的利益。论文应用MATLAB以及SPSS等数据处理与分析软件对数据进行斯皮尔曼相关系数分析,建立多元线性回归模型,用该模型对数据进行处理,根据处理后的数据建立非线性回归模型,即多任务打包定价模型。该模型的适应性和经济性均较高,可推广应用于跑腿、代购等领域定价问题的解决。
【Abstract】"Making money by taking pictures" is a new online business opportunity. It can not only improve the satisfaction of users, but also make the merchants get higher benefits by packaging and publishing multi-task. The paper uses MATLAB, SPSS and other data processing and analysis software to perform Spearman correlation coefficient analysis on the data, establish a multiple linear regression model, use this model to process the data, and establish a nonlinear regression model based on the processed data, that is, multi-task package pricing model. The model has high adaptability and economy, and can be used to solve the pricing problems in the fields of running errands, agency purchase and so on.
【关键词】斯皮尔曼相关系数;多元线性回归;非线性回归
【Keywords】Spearman correlation coefficient; multiple linear regression; nonlinear regression
【中图分类号】F224 【文献标志码】A 【文章編号】1673-1069(2020)05-0168-02
1 引言
随着网络技术的快速发展,网络商业机遇如雨后春笋般层出不穷。“拍照赚钱”就是现在网络技术快速发展下产生的一种自助式服务模式。用户只需要一部手机,通过下载APP软件并注册成为会员,从APP上领取需要拍照的任务(如去某个商业市场核查某种商品),以此来赚取相应的酬金。这是一种基于移动联网设备的自助式劳务众包平台,为企业提供各种商业核查和信息搜集服务,相比传统的人力调研方式可节省大量调查成本,而且有效地保证了所调查对象相关数据的真实性,缩短了调查的周期,提高了企业采集信息的效率。但当多个任务位置相对集中时,会导致新的问题,即用户争相选择。针对该问题可采用将多个任务打包,然后进行发布的方式。在APP中对多任务打包之后进行合理定价是保证正常运行的核心要素,这也是如今大多数商家面临的一个亟待解决的实际性问题。
2 问题分析
通过对项目任务数据和会员信息数据进行斯皮尔曼相关系数分析,可以知道定价规律与任务GPS经纬度、任务执行情况、会员的信誉值、会员GPS经纬度分布都有关联。从地理位置上进行考虑,可以使用“地图者”地图标记软件,这是一种基于云服务的新型地理信息系统,主要面向企业机构和个人用户提供云地图服务。系统主要功能包括空间地理数据的编辑、展示、可视化分析、辅助决策,等等。将任务数据导入“地图者”,其自动找到相对的位置,并将数据在图层上表示出来,然后手工设置图层样式,选择合适的图层,如图1所示。
通过图1可以了解到任务未完成的位置主要集中分布在机场、森林公园、山区等几乎没有商业市场的地方。而且在实际情景中,在任务相对集中的区域会出现用户争相选择的情况。
综合考虑以上情况,可以将位置相对集中的任务根据不同会员预定任务限额的数目进行打包,得到许多不同任务数量的小包,让会员根据自己的任务限额进行挑选(在这里假设某位置内的任务量足够多、不同信誉值的会员和任务的位置随机分布,而且每个会员所选择的小包的任务数量小于等于其各自的预定任务限额),在此基础上进行建立模型和求解。
利用SPSS软件对会员信息数据进行相关性分析,如表1所示。
由表1分析可得,预定任务限额(分配件数)与信誉值、任务纬度以及任务经度均有相关性,且显著性均为0。
2.1 多元线性回归模型的建立与求解
多元线性回归模型具体求解步骤如下:
①b=regress(Y,X)确定回归方程系数的点估计值。其中,Y为任务限额的n*1的矩阵;X为(ones(n,1),x1,…,xm)的矩阵,即关于任务经度、纬度以及会员信誉值的n*3维的矩阵。
②根据[b,bint,rint,states]=regress(Y,X,alpha)求回归系数的点估计和区间估计,并检验回归模型。
③通过rcoplot(r,rint)得出残差以及其置信区间。通过将已结束项目的任务数据导入MATLAB,然后进行多元线性回归可得数据处理结果:
R2=0.864,拟合度较高,其他结果见表2。
由表2可得任务定价和任务纬度以及任务经度的多元线性回归方程为:
Y=-19.2376+2.46×X1+0.2802×X2(1)
式(1)中,Y为任务定价,X1为GPS纬度,X2为GPS经度。
同理,由会员信息数据可得任务打包数和任务纬度、任务经度以及信誉值的多元线性回归方程为:
Z=263.2205-1.9425×X1-1.8738×X2+0.004×X3(2)
式(2)中,Z为任务打包数,X1为GPS纬度,X2为GPS经度,X3为会员信誉值。
2.2 多任务打包定价模型的求解
分别由式(1)和式(2)结合已结束项目任务数据和会员信息数据中的数据得到两组新的数据,每组数据分别包含定价和任务经纬度、任务打包數和任务经纬度,然后利用任务经纬度将两组数据结合在一起,再次使用MATLAB软件进行一元指数形式的非线性回归求解,可以得到任务定价和任务打包数的拟合回归方程:
Y=3.7255×Z-0.02 (3)
式(3)中,Y为任务定价,Z为任务打包数。
定价和任务打包数的散点图如图2所示。
3 结语
本文根据已结束项目任务数据,利用MATLAB构建定价和位置经纬度的多元线性回归方程,根据会员信息数据建立分配件数和位置经纬度以及会员信誉值的多元线性回归方程,接着进行一元指数形式的非线性回归求解,可以得到定价和预定任务限额的拟合回归方程。综合分析可得,该模型具有较高的实用性和经济性,因此,可以作为多任务打包定价的模型,并可推广用于解决跑腿和代购定价等问题。
【参考文献】
【1】王松桂,陈敏,陈立萍.线性统计模型线性回归与方差分析[M].北京:高等教育出版社,1999.
【2】卓金武.MATLAB在数学建模中的应用[M].北京:北京航空航天大学出版社,2014.
【3】毛可.软件众包任务的定价模型与人员匹配方法研究及工具实现[D].北京:中国科学院大学,2014.