王海明
基于大数据下电子商务商品推荐系统的分析
王海明
随着电子商务的不断发展,电子商品的种类逐渐增多,如何推荐给适合顾客的商品来提高交易量成为电商首要考虑的问题。本文对如何完善电子商务商品推荐系统进行分析,围绕设计搜索的整体性、相似商品的推荐和对顾客进行分类三个方面展开讨论,从而实现提高电子商务商品成交额的目标。
电子商务目前已经十分普遍,网上商品交易数量也随之增多,网上商品种类繁多,商品消费者的选择性增加。因此,电子商务商品推荐系统的完善成为提高交易量的重要手段。通过挖掘大数据下消费者的消费特点,进行相应的商品推荐,对实现电子商务商品发展有着重要的作用。
从消费者的角度出发,将电子商务商品推荐系统按使用技术分为两类,一种是自动化程度,一种是持久性程度。自动化程度是指消费者在进行商品选择时,通过输入相关信息,便会出现一系列有关商品,其中可能出现消费者恰好感兴趣的商品,以此缩短消费者查找商品时间,尽可能提供给消费者便利。手工方式是指消费者需要进行对所需商品的具体要求,网上会根据消费者需求显示出具体的商品,这类推荐方法存在限制消费者接触更多商品类型的弊端;所谓持久性程度,是指根据用户的不同需求,综合推荐消费者感兴趣的商品,不局限与消费者某阶段的单独需求,而是对用户多种需求进行整合分析,再推荐给用户相关的商品。
以上两个推荐系统从用户的角度出发进行分类,体现了电子商务网站以用户为核心的标准,通过进行不同类型推荐系统的探索,尽可能使推荐系统满足用户的需求。以上两类推荐系统可以实现自主的、持久的对用户进行推荐。基于以上两个推荐标准可以将电子商务推荐系统分为四类,包括非个性电子商务推荐系统、根据产品属性的电子商务推荐系统、相关性商品推荐系统、相关性用户推荐系统。其中,非个性电子商务推荐系统指的是推荐标准主要源于各个用户的评价,对全部用户评价作出综合判断,这种推荐系统对全部用户的推荐标准相同,并且是系统自动产生的,不需要对用户需求进行复杂的分析;基于产品属性的推荐系统,主要核心是商品,通过接收用户输入的相关产品属性,推荐给用户具有对应属性的商品。这种推荐系统注重用户的个性化需求,可以使根据用户的瞬时需求进行推荐,也可以根据用户的多种需求来推荐;相关性产品和相关性客户推荐分别是根据商品的相似性和用户之间的相似性进行推荐,个性化程度较高。
基于大数据的电子商务个性化推荐
大数据的挖掘是根据用户需求进行相应商品推荐的前提。目前,主要推荐算法包括内容过滤算法和协同过滤算法两类,其中过滤算法是在内容的基础上进行信息检索,协同过滤算法更多的是根据用户的具体需求,以客户的兴趣为主要推荐标准。当前最为流行的挖掘算法是基于Web的挖掘,因此将Web挖掘的电子商务推荐与用户需求进行有效结合是实现电子商务发展的关键。
研究表明,目前存在的推荐算法准确性不够,通常是根据用户以往的浏览内容进行推荐。而用户的需求处于不断变化中,若只根据消费者以往需求进行推荐,往往有别与消费者的目前需求,并且这种方式也不被消费者接受,在进行商品选择时,常出现用户不感兴趣的商品推荐,会影响用户的消费情绪。因此,创新出能满足用户当前商品需求的推荐算法,是完善电子商务商品推荐系统的重点。
基于关联规则的推荐算法
基于关联规则的推荐算法。关联规则属于数据挖掘技术,该技术能发现数据之间的某些关联。关联规则挖掘出的数据能有效将用户消费特点显示出来,根据用户的购买习惯,可通过关联规则进行与用户需求有关的商品匹配,对用户的需求有一定的掌握。这种方法对商家进行商品促销有很大的帮助,举例说明,当用户产生购买记录后,关联规则便会挖掘出相关数据,商家通过对数据的分析,能直观的发现消费者的购买习惯,在进行商品促销时,商家便会根据分析出的数据结果,进行符合群众需求的商品促销,能为商家带来很大的效益。
Apriori算法及改进算法。Apriori算法是基于关联规则的一种推荐算法,它的基本思想是,首先通过挖掘数据中大范围的数据项集作为候选,并记录候选项集中每个数据发生的次数,将大于最小支持率的数据作为一个集合,将该集合记作L1,再基于L1中数据,进一步生成集合L2,以此类推,直至生成集合Ln,标志着集合已经不能更加细分。最后,再根据相应算法导出规律。Apriori算法在用户相似商品需求的判断中起到重要的作用,但是仍然存在一些不足,包括由于数据库太大,导致算法存在一些不必要的规则,加大了数据分析难度;Apriori算法的运算步骤,要求在运算时,要对数据库进行多次扫描,降低了算法的效率;由于一些客观因素的存在,也会影响算法的准确性,导致最后的结果与实际存在差异。算法的改进是实现结果准确的重点,它的改进可以从算法的效率和产生集合的准确性入手,例如数据库中包括多种商品的信息,由于某些商品之间的联系较大,可能导致它与其他商品之间关联性被忽视,那么产生的集合就是不准确的,为了改善这种情况,可以将与众多商品具有关联性的商品做出标志,避免此类商品数据的频繁扫面,造成算法的不准确。
分段Apriori算法及其应用。分段Apriori算法就是将大数据库中的项分成小部分,再对各部分进行Apriori算法。这种算法可能会丢掉数据库中的一些信息,是分段算法存在的缺陷,但是由于数据库太大,其中的数据不完全有效,分段算法通过丢掉多余的数据,不仅可以提高算法效率,还能提高算法的准确性。举例说明,当我们针对某些属性进行推荐算法时,可以通过添加一些限制条件,频繁集合必须满足前提条件才能进行运算,这样就可以在进行算法前将不必要的数据进行排除,减少运算量,提高算法的效率。
随着科技的发展,电子商务越来越普遍化,网上消费者的数量明显增加,同时由于电子商务商品数量和种类的增加,电子商务的竞争力增大。如何提高对消费者的了解程度,提供相应的产品推荐成为重点问题。可以通过完善电子商务商品推荐系统,实现提高网上交易量的目标。
(作者单位:苏州大学计算机科学与技术学院)