谢 鑫
(漳州职业技术学院)
随着互联网技术的不断进步和发展,电子商务系统为商户和客户带来了大量的信息,各种基于电子商务的个性化服务也开始由此形成,线上电商用户潜在购买力挖掘成为研究的热点话题,相关专家也相继展开了研究.从线上电商用户自身角度出发,用户更加关心如何以更低的价格获取最满意的商品[1-2].从企业角度出发,企业更加关注如何增加收益,制定用户满意的销售方案,同时对企业的潜在客户进行优化.国内相关专家也针对该方面的内容进行了大量的研究,例如屠守中等将矩阵分解和标签传播算法两者进行结合,同时将用户划分为两种类型,对用户的兴趣进行提取和计算,最终实现用户兴趣挖掘[3].秦永彬等通过二次single-pass不完全聚类算法进行将用户微博划分为多个不同的簇,同时将簇进行合并,并且采用LDA模型进行建模,引入时间因子,最终获取用户兴趣,实现兴趣挖掘[4].但是上述方法无法获取准确的挖掘结果,所以提出一种基于数据特征提取的线上电商用户潜在购买力挖掘方法.仿真实验结果表明,所提方法可以获取高精度高效率的线上电商用户潜在购买力挖掘结果.
1.1.1 线上电商用户访问数据融合
为了更好实现线上电商用户购买力挖掘[5-6],需要优先组建信息访问融合模型,由于类内数据一直处于分布不均匀的状态,所以还需要进一步组建多元数据融合跟踪识别模型,进而获取电商用户的模糊决策函数,如公式(1)所示:
μ(n)=β[1-exp(α|e(n))],|e(n)|2>K
(1)
式中,μ(n)代表模糊决策函数;K代表数据库的检测阈值;β代表数据库的关联度水平;e(n)代表数据库的融合函数;α代表数据库的分布式融合系数.
1.1.2 电商用户潜在购买力分组检测
构建线上电商用户潜在购买力挖掘的量化分析模型,同时还进一步构建分布式融合模型[7-8],最终得到以下形式的统计函数F,如公式(2)所示:
(2)
式中,φ(xi)代表数据库的约束指标参量集;ξ(i)代表用户访问数据集.粗糙向量机对应的关联规则分布G可以表示为公式(3)的形式:
(3)
式中,ω代表电商用户访问数据库的有限特征项集合;xi代表访问数据的类数据集;r代表类节点数量.
1.1.3关联特征提取
将全新形成的样本加入到原始训练集中,为了后期获取更加准确的挖掘结果,结合粗糙集匹配方法[9-10],获取数据挖掘寻优需要满足的约束条件:
(4)
分析合成样本和相邻父节点之间的关系,以此为依据,获取访问数据集对应的模糊聚类函数.同时根据模糊聚类函数,可以获取最优解向量融合方式,同时计算线上电商用户潜在购买力挖掘的平均值H,如公式(5)所示:
(5)
式中,σ代表数据挖掘结果的方差.
通过以上分析,对线上电商用户的潜在购买力进行关联特征提取[11-12](如图1所示),具体的计算式为:
图1 线上电商用户潜在购买力关联特征提取流程图
(6)
式中,J代表线上电商用户潜在购买力的关联特征提取结果.
设定共对N个线上电商用户进行潜在购买力挖掘,每个用户的潜在购买能力并不是固定的,所以可以通过以下矩阵Ft对用户的行为特征进行描述:
(7)
式中,hi,j代表线上电商用户的潜在购买特征.
对于观测的线上电商用户而言,可以获取线上电商用户潜在购买力,具体计算式如下:
(8)
式中,HDii代表线上电商用户潜在购买力计算结果;ωij代表用户在t时间段的购买能力;hij代表用户在t时间段的权重取值.
选取合适的阈值,可以对线上用户的线上电商用户潜在购买力进行等级划分,具体的计算式为:
(9)
式中,HSij代表线上电商用户潜在购买力划分结果.
在对线上电商用户潜在购买力挖掘过程中,需要设定多个参数,不同参数的取值是完全不同的.需要借助熵权决策法对提取到的特征进行计算,进而选取合适的权重取值,详细的操作步骤如下所示:
(1)在实际问题中,需要优先组建m个样本n个评价指标的判断矩阵R,具体如公式(10)所示.
(10)
(2)将判断矩阵进行归一化处理,进而获取以下形式的归一化矩阵B,如公式(11)所示:
(11)
(3)通过熵的定义,可以确定特征向量对应的熵值为:
(12)
式中,hx、hy和hz分别代表不同的参数.
针对自然对数而言,需要设定熵的定义,假设不符合实际情况,则需要借助以下公式进行计算:
(13)
式中,fij代表第i个特征值对应的熵值.
(4)计算不同线上电商用户潜在购买力关联特征对应的权重值,如公式(14)所示:
(14)
式中,ωi代表综合熵值.
通过熵值计算结果选择合适的权值,同时计算不同线上电商用户的潜在购买力[14-15],通过购买能力进行等级划分,最终实现电商用户潜在购买力挖掘.
为了验证所提基于数据特征提取的线上电商用户潜在购买力挖掘方法的应用性能,需要进行仿真实验测试分析.通过相关参数设定,获取线上电商用户数据分布情况,如图2所示.
图2 线上电商用户数据分布情况
采用图3对所提方法的收敛性能进行测试:
分析图3中的实验数据可知,所提方法具有较好的收敛性能.
图3 线上电商用户潜在购买力挖掘的收敛性能测试结果
为了进一步验证所提方法的性能,以下实验测试将召回率作为测试指标.其中,当召回率的取值在95%以上,则说明其具有比较好的挖掘能力.详细的实验测试结果如图4所示.
分析图4中的实验数据可知,所提方法具有较高的召回率,充分说明所提方法可以获取比较满意的线上电商用户潜在购买力挖掘结果.
图4 召回率测试结果分析
以下对线上电商用户潜在购买力挖掘精度进行测试,重点对使用所提方法前后的挖掘精度进行测试分析,测试结果见表1.
表1 使用所提方法前后的线上电商用户潜在购买力挖掘精度测试结果分析
分析表1中的实验数据可知,在使用所提方法进行线上电商用户潜在购买力挖掘后,挖掘精度相比之前得到有效提升,全面验证了所提方法的优越性.
以下对实验测试进一步分析所提方法的挖掘效率变化情况,选取传统方法作为对比方法,详细的实验测试结果如图5所示.
分析图5中的实验数据可知,随着测试样本数量的持续增加,传统方法的挖掘效率呈直线下降趋势.而所提方法的挖掘效率则处于比较稳定的状态,充分说明所提方法可以以更快的速度完成线上电商用户潜在购买力挖掘.
图5 不同方法的线上电商用户潜在购买力挖掘效率对比
利用表2给出使用所提方法前后的挖掘成本变化情况.
表2 使用所提方法前后的线上电商用户潜在购买力挖掘成本测试结果分析
分析表2中的实验数据可知,在使用所提方法进行线上电商用户潜在购买力挖掘后,挖掘成本相比之前得到有效降低,有效验证了所提方法的优越性.
网络技术以及互联网技术的飞速发展,线上电子商务中的线上电商用户潜在购买力数据必将得到更好的挖掘处理,同时数据中隐藏的价值也将得到更加充分的利用.从数据特征挖掘的角度出发,提出一种基于数据特征提取的线上电商用户潜在购买力挖掘方法.所提方法可以准确挖掘用户的潜在购买能力,还能够有效提升挖掘效率,以更低的成本完成挖掘,同时可以为商务决策提供有效的数据支持,全面推进电子商务的发展.