李婷婷
(河北省石家庄铁道大学,河北 石家庄 050043)
众包平台是一种自主式服务的商业模式,用户安装APP后,可以领取相关任务,赚取酬金。使用者可以在上面浏览各种商业公司的相关信息,例如饭店的相关菜价、好吃与否等信息。在一定程度上,这种方式代替了问卷调查;而且其具有较好的真实性,实时性。
在众包平台中,核心问题是针对每个任务需要制定价格,在定价的过程中,需要考虑以下因素:
①考虑任务的位置、完成情况信息。
②还应该考虑到任务位置附近的会员信息,如其信誉度、经验等因素,这样才能对任务给出合理的价格。
③在具体场景中,对于地理位置相对较近的多个任务,可以打包进行发布。
首先需要对数据进行预处理,将经纬度转换为XY坐标,由于位置经纬度中纬度和经度所代表的距离不相同,无法直接计算两个位置之间的距离,所以先对经纬度进行了高斯投影变换,将经纬度转化为X、Y值。利用Matlab导入会员和任务的位置X、Y坐标,利用两层循环求位置之间的距离。在Matlab中,结合冒泡排序法对每一个任务的距离进行从低到高排序,求出最小的16个距离以及相应会员的荣誉值和预期任务限额。
通过对任务在地图中的实际分布图分析可知,任务的地点主要分布在四个城市,利用SPSS软件对给定数据进行K平均值聚类,将数据分为四类。并且每一类都有周围任务的数量、平均距离、最大最小距离等十二个影响因素,对每一类进行回归拟合。
上述拟合过程已经考虑12个因素对价格的影响情况,还需对拟合结果进行调整,调整的目的主要有①将未完成的任务价格提高,从而吸引会员来完成该任务;②将已完成的任务价格降低,从而增加收益。
对于已经结束的任务,完成情况只有0或1,即未完成或者已完成。而对于新任务的价格预订,应该考虑该任务被完成的可能性,进而引入成功率的概念。设某一个新任务周围2.5km以内的任n务总个数为n,n个任务中已完成的任务个数为n1、未完成的任务个数为2,则成功率p=n1/n,这里引入成功率的基准p0值为80%,则调整的价格为Δm=(p-p0)×r。其中,r为价格变化与成功率变化的比值,求解拟合得到r=33.546。调整后的价格为m′=m-Δm,即m′=m-r×(p-p0)。
任务分布上,有的地点任务相对集中,用户争相选择,对这种情况的考虑是将任务联合发布。对于联合发布,不仅可以提高任务完成的效率,减少完成任务所需的时间,而且还能促进任务的完成质量,提高任务的完成率。
对于任务打包联合发布的情况,首先考虑对哪些任务进行打包,然后考虑如何进行打包,最后如何为打包后的任务包进行定价。基于上述考虑,选择任务打包时,主要通过选择相距较近的任务来进行打包发布,即对于给定任务A0,对其周围的任务iA距A0的距离D0i进行判断,若D0i小于一个给定标度l,则认为该任务可以与给定任务进行打包,在上述标度l范围内若存在多个任务,则一起打包发布;若A0周围l范围内不存在其他任务,则该任务不进行打包,直接带入原定价方案。对于定价,考虑的主要因素是包内各个任务之间的距离关系,采用包内平均距离Dj来衡量,若Dj较小,认为该包内任务都相距较近,完成起来更快捷、方便,所以相应的整包价格也会比相应的包内任务价格之和Sj要降低;反之,Dj较大,则认为包内任务相距相对较远,完成起来更费时、费力,整包价格则会相应上涨,最终给出合理的定价方案。对于给定任务Ai(i=1,2,3...,n)依次与其他任务Aj进行距离的对比,若有对应Dij<l,则将Aj归入Ai所在包,若不存在Dij<l,则Ai不进行打包。
在每个打好的包中,可以求得包内任务的平均距离(t为包的编号)和包内的所有任务价格之和St,对于平均距离,给定参考值D0=300.5(当=D0时,St即为该包的定价Mt),存在如下调节关系:Mt=St+(Dt-D0)×β×t,Mt即为该打包任务的定价。β为调节系数,值为0.03。
①经度和纬度每一度对应的距离变化不同,所以采用高斯投影将经纬度转换成XY坐标,使得模型更为准确。
②在对价格的影响因素研究中,通过相关行分析,筛选出相关性较小的因素,模型拟合结果合理可靠。
③打包时,确定出打包的范围较为合理;并且在定价时,使用平均距离判断包内任务的分散程度。
本文通过利用聚类、回归拟合等方法对数据进行数据挖掘,将打包理念融入定价方案得出最终的定价方案。对于经纬度进行高斯投影变换,提高了准确度。对于未完成的任务,引入调节系数,进一步合理地定价,提高了完成率。