基于Web日志挖掘的电商平台产品个性化推荐算法研究

2018-12-23 21:39梁清洁江苏先农电子商务有限公司
数码世界 2018年1期

梁清洁 江苏先农电子商务有限公司

1 Web日志挖掘技术概述

Web日志挖掘是Web数据挖掘的一种,涉及多个领域,是计算机学、统计学、信息学、数据库等多门技术的综合。Web日志挖掘有很多优势,它是基于大数据的,少量的数据无法通过人工分析来得出蕴含的规律,缺乏普遍性。经过Web日志挖掘技术得出的信息,不是经过简单的推理而得出的信息,它可以深度挖掘隐藏在数据内部的关联关系,进行准确的预测,从而给企业或者用户带来直接利益。

2 Web日志挖掘算法

Web日志挖掘算法有四步。其一,源数据收集。它的主要作用是收集系统平台的日志文件,对用户的浏览记录、注册信息、需求信息等进行分析提取,提高电商平台的个性化推荐水平。其二,数据预处理。系统文件存储的原始信息有些是非结构化的,因此在对这些数据信息挖掘之前进行预处理,对日志信息加以整理,剔除无用的记录。数据预处理要分为三步:首先删除系统日志中与算法无法的数据,比如非HTML文件;然后对用户进行识别,采用启发式规则,尽量避免防火墙、代理服务器的影响;最后,就是用户会话的识别,通过用户对服务器的有效访问,根据访问记录获取用户浏览兴趣。其三,模式发现。即运用多种算法技术对预处理后的数据进行挖掘,分析数据中的路径、关联关系。其四,模式分析。从上一步的发现算法中筛选出有价值的模式,并对其进行精确的分析。模式分析的主要技术是利用数据库封装,执行联机分析。

3 电商平台产品个性化推荐算法研究

随着Web2.0的发展,有关推荐算法也逐渐成熟。常用的推荐算法有基于内容相似度的算法、协同过滤推荐算法、聚类算法、基于关联规则的推荐算法四类。

3.1 基于内容相似度的算法

基于内容相似度的算法是传统的推荐算法,应用广泛,它是以分析用户的购买记录和浏览记录为核心,将相似度高的商品推荐给用户。分为信息的获取和过滤两个部分,信息获取是指抽取项目关键字抽取项目的关键字,然后对关键词的权重进行分析,在依据用户的喜好对其进行建模,取其平均值。这里指的注意的是关键词的权重与出现的次数成正比例关系。信息过滤指的是根据用户的喜好对其建模的一个过程。该算1给用户进行精准的推荐,提高了用户体验,但是它需要对商品进行建模,在而且很难根据图像、视频找出相应的文本信息。例如,通过消费者浏览和购买商品的大数据分析,我们可以从中提取出共同点,然后筛选其他产品进行推荐,给消费者多种选择,提高支付率。

3.2 协同过滤推荐算法

协同过滤推荐算法(user-based collaborative filtering),分为两种,基于用户的和基于商品的。基于用户的协同过滤算法的核心思想就是找出有其用户相似喜好相似的邻居群,根据他们的历史记录,来分析用户的习惯,从而对其推荐商品的一个算法,它可以挖掘用户潜在的兴趣爱好,但是准确性不高。基于商品的协同过滤算法,与之前的推荐机制类似,但是它的核心思想是挖掘商品之间的相似性。这种推荐方式,可以离线运行,对图像视频等对象也可以进行有效的推荐。例如,对某用户买衣服,经过算法的综合排名,发现排第一的是方便面,排第六的才是衣服,结果推荐了方便面岂不闹了笑话。但是对商品进行了归一分类,服装类商品只限推荐服装,这样就会增强商品的过滤性和协同性。

3.3 聚类算法

聚类算法,它可以对目标用户进行多指标划分,个性化和精细化运营。它是通过对目标用户进行群体分类,对产品进行价值组合,发现其孤立点。但是在实际应用中,数据处理复杂,聚类分析作为其中的一个环节。例如,在电商平台的搜索引擎中,很多网民所查询和浏览的商品种类比较类似,对这些查询进行聚类,一方面可以使用类内部的词进行关键词推荐;另一方面,聚类过程的自动化,有助于产生新的话题类别,还有助于减少存储空间。

3.4 基于关联规则的推荐算法

基于关联规则的推荐算法是最为经典算法,它的核心就是找出数据的依赖关系。通过关联关规则分析,及时了解到用户在购买某种物品后还需要哪些物品,挖掘出相应的关联信息,为用户推荐关联物品。实际上是一种交叉销售模式,根据不同的商品,结合其历史浏览、购买记录,构建符合需求的关联模型。例如,可以在用户支付下单一种商品后,通过计算,推荐其它周边商品,比如替代品、互补品之类的商品,加强线上产品之间的关联性,提高周边商品的推荐率。

Web日志挖掘是一项综合性的技术,尤其在用户和商品指数上升的今天,电商平台采用个性化推荐算法,可以有效帮助用户找到所需要的商品。电子商务平台通过对用户的浏览习惯、购买记录等进行分析挖掘,找出相应的关联信息,可以精准预测用户需求,为用户提供更加人性化、个性化的服务,从而提升用户的体验和黏着度,提高平台的效益。

[1]卢辉数据挖掘与数字化运营实战[M]北京:机械工业出版社2013:15-28

[2]单剑锋,马德锦常用Web服务技术研究[J]计算机技术与发展2013(6):253-257

[3]桑志超个性化推荐引擎及在电子商务中的应用[J]科技视界2014(91):136,141