杨永瑞
摘 要:现阶段,我国电子商务平台的快速发展为人们的商品选购提供了极大的便利,但在商品种类、总量持续增加的影响下,消费者如何在最短时间内选择自己心仪的商品,就成为了电商平台关注的重点问题。广告推荐系统的出現恰好满足了消费者和电商平台的需求,广告推荐系统需要在精准定位的用户群体的基础上推荐其感兴趣的广告,数据挖掘技术的引入可以有效解决这一问题。本文基于广告推荐系统的概述,结合传统的广告分类模型弊端分析,探讨了数据挖掘下的广告推荐系统设计,并深刻研究了今后数据挖掘广告推荐系统面对的问题及研究方向。
关键词:数据挖掘;广告推荐;系统设计;问题研究
前言:随着我国电子商务网站的持续发展,诸如文本、图片这种非结构化的数据占据了网站数据的绝大部分。为了更好的实现针对性的广告推荐,电商网站必须要针对这种非结构化数据进行全方位的挖掘。作为数据挖掘技术重要组成部分的文本挖掘,能够从原始的文本中提取相应的知识,并且能够对于一些形式不确定的半结构以及非结构化的数据进行有效的处理。本文通过研究、探讨以数据挖掘作为基础的广告推荐系统的设计,以便为今后网络电商网站的精准化广告推荐提供借鉴和参考。
1、广告推荐系统概述
广告推荐系统作为现阶段推荐系统的典型应用成果代表之一,也是现阶段互联网广告的重要表现形式[1]。各大电子商务网站都开始借助广告推荐系统对自己的产品进行推广,诸如阿里巴巴、亚马逊等国内外知名的公司通过合理的应用数据挖掘以及相关的程序算法,将用户的历史数据和用户的消费偏好进行深刻的挖掘以及比较,真正将用户可能感兴趣以及触发购买潜行为的商品进行了精准预测。这里所提到的广告推荐系统实际上是凭借各种技术手段实施广告交易和管理的一种广告形态,又或者可以将之视为一种利用算法和技术精准的确定产品目标客户,并为其提供广告推荐,有效提供商品信息的一种方法。以数据挖掘技术作为基础的广告推进系统,能够对用户的记录、点击、评分等信息进行科学有效的记录,从而对各种产品的需求进行预测,最终为用户推荐浏览可能性最大的广告,帮助电商网站实现广告投放效益最大化的目标。
2、传统的广告分类模型弊端分析
广告推荐系统应用的最终目标就是确保能够在特定情景下预测用户对于不同广告的点击率,并推送用户最大可能点击的商品广告。但实际上,之前传统的广告分类模型无法直接通过模型的建立对于广告的点击率进行计算。在之前数据挖掘的广告推荐系统中需要优先判断在特定情况,用户是否会对广告进行点击,可以凭借二值分类的方法建立一个模型,并从原始的广告日志数据转化为各种属性的分类数据集[2]。
在之前原始的广告日志数据中,点击数据是展示数据内部的一个子集,点击数据中的实例可以称为整理,而只在数据展示中出现的则可以成为负例[3]。在具体运用的过程中,可以将所有的正例和负例分别添加1和0的标记。在这种情况下,就能够得到一个包含0或者1带有标记属性的转化数据结合,随后可以将这一标记属性以此为基础学习二值分类器。最终建立广告推荐系统的目标是为了得到广告的点击率以及用户在情景下的具体广告排序,并以这个排序作为基础得到最终的推荐结果。从某种程度上看,分类模型能够完成这一任务,但因为部分分类算法得到的输出结果并非是简单的0或者1,同时可以得到实例结果为1的概率,换言之,就是用户在特定情况下有可能会点击广告的具体概率,也就是广告推荐系统所需要的广告点击率数值。
3、以数据挖掘为基础的广告推荐系统设计研究
3.1推荐系统的总体体系结构设计分析
作为电商平台重要内容的广告系统推荐,人们在浏览电商平台时,通常都会收到有关产品介绍的文字和图片,如何能够在多种产品的图片和文字中寻找到用户想要购买的产品难度相对较大,广告推荐系统能够在吸引顾客的同时为其提供感兴趣的商品。目前我国的电商平台系统都是以B/S结构作为基础,通过使用数据挖掘中的聚类技术能够有效组建广告推荐系统,具体又可以分为离线挖掘和在线推荐两个组成部分。电商平台中的广告推荐系统建立的初衷是为客户提供各种个性化的广告服务,由于电商平台中的客户访问数据处于认知数据增加的状态,如何针对客户的浏览信息使用在线挖掘的模式,这种复杂的运算过程很有可能会带来大量的时间成本投入,并且这种大规模的预算也有可能会带来系统瘫痪的问题。在具体数据处理的过程中,需要采用离线挖掘的方式。
离线挖掘这一部分具体包括了数据的采集、预处理、挖掘以及存放挖掘数据结果几部分。以数据挖掘作为基础的广告推荐系统中,只要用户登录电商平台开始商品信息浏览之后,系统便会自觉将商品浏览记录保存在数据集中,因为这些数据集中的记录尚未进行处理,在系统获得用户的商品浏览记录信息之后,需要进行全方位的挖掘,并在这一步操作之前对其进行预先处理,具体包括了分词、去停用词以及使用特定方式进行计算数据表示。在经过处理之后,数据可以进行聚类操作并将之储存到对应的用户记录数据库中。
在广告推荐系统的在线推荐环节运转中,电商平台任何一个商品的广告都会存入到商品的后台数据库中,并且经过离线挖掘处理之后的数据结果集合会分类存储到用户信息浏览数据库中,只需要系统抓取其中的关键词在与商品数据库中商品的关键字匹配之后,如果相似度大于设置的阈值,则意味着用户对于电商发布的广告位置有着较高的兴趣,可以将该商品广告进行推送。
3.2推荐系统的设计分析
结合我国电商平台对于广告推荐系统的个性化需求看来,其总体的模块可以分为广告、用户、管理员三个部分。广告模块作为整个数据挖掘广告推进系统的核心,电商平台可以发布多条广告让用户进行浏览,或者可以对广告内容进行增加删除和修改[4]。在这一模块上系统需要有效获取用户的商品浏览记录,需要提供用于用户浏览的足够的广告。在获取到用户记录并进行处理之后,需要发布与之匹配的广告内容。用户模块则是针对系统所访问到的各种用户信息浏览记录进行分析和处理的模块,并以此作为基础,发掘用户对于电商平台中感兴趣的产品。这一功能模块需要在运转的过程中,将各个用户登录之后的商品浏览记录进行保存,并经过预处理之后,使用聚类算法进行相似用户处理。为了保障广告推荐系统始终处于一种稳定的运行状态,管理员模块的设计可以针对网站用户的管理广告信息进行管理,并同步进行广告内容的验证和删除等操作。
4、以数据挖掘为基础的广告推荐系统存在的问题及今后的研究方向分析
4.1广告推荐面临的时效性问题
以数据挖掘作為技术所形成的广告推荐系统必须要考虑到广告推荐的时效性问题,需要结合用户需求的变化以及实践上下文之间联系的全方位考虑,换言之,广告宣传的时效性完全是由用户需求的时效性决定的[5]。在一定时间阶段内的用户对于产品需求和偏好会出现一定程度的变化。目前数据挖掘算法生成的广告推荐系统存在着明显的广告推荐时效性问题,比如在用户搜索计算机商品信息并购买之后,在其产品购买之后的一段时间的电商平台或网站依旧会为客户推送有关计算机产品的相关广告,这会使得用户对于商品以及电商平台产生一种抵触的情绪。
与其他专业领域的时效性相比,广告推荐系统的时效性存在着明显地不同。新闻行业的新闻信息推荐时效性是以时间作为节点。最大的特点是与时间上下文之间保持着较为紧密的关联,超过一段时间之后的新闻发布对于用户来说毫无意义。广告推荐系统应用的最终目标是为了激发用户对于商品的购买行为,需要立足于用户和广告产品的角度来掌握广告推荐的时效性。从用户层面看来,广告推荐系统需要以用户行为变化作为出发点,在获续商品需求变化的同时即时进行,反应。从广告商品角度看来,广告推荐系统需要结合产品推出的时间以及广告发布的时间等判断产品是满足用户现阶段的需求。
在这种情形下,系统是否能够为用户提供即时商品广告推荐结果,并同时考虑用户的产品变化是今后数据挖掘算法基础下广告推进系统重要的研究方向。今后的广告推荐系统不但需要获取用户偏好的动态变化特征,并且也需要在系统设计层面进行转型,可以借助Hadoop建立完善的分布式推进系统,进一步强化用户相关偏好以及信息浏览数据的处理能力和效率,以便提高广告推荐系统的灵活性和多样性。
4.2用户个人隐私的安全问题
在数据挖掘算法基础上形成的广告推荐系统,在应用过程中同样也引发了有关消费者个人隐私和数据安全方面的问题。结合近几年国内外电商平台的发展看来,用户在门户网站和金融公司注册时的个人信息出现了大量暴露以及滥用的问题。以目前广告推荐系统中所用的推荐技术看来,通常都需要对用户的历史信息进行调用和分析。即便社会化网络这种对于历史信息依赖度不强的推荐技术方式,也需要针对用户的社会关系、地理位置等信息进行访问,这些信息同样也属于用户的个人隐私。数据的隐私处理使得广告推荐能够利用的数据量有所削减,对于广告推荐系统的最终效果会产生影响。在今后数据挖掘算法下的广告推荐系统应用中,想要更好的提高用户个人隐私的保护程度,不但要保证推荐系统能够有效的保护用户的隐私信息不被他人过度访问,同时也需要缓解因为数据隐私处理对最终推荐结果产生的影响。在今后广告推荐系统发展的过程中,相关专家和学者需要高度关注广告推荐系统隐私保护机制的建立。
总结
广告推荐系统的建立和应用是电商平台能够结合用户产品信息的浏览以及需求偏好等进行精准化购物推荐的有效途径。现阶段,我国电商网站储存的文本图片等资料可以凭借数据挖掘中的文本挖掘方法进行收集、整理、记录以及分析实现广告的精准化投放,但却面临着用户的隐私安全以及广告推荐的时效性问题,需要相关专家和学者在今后广告推荐系统持续发展的过程中,重视系统的全新设计以及隐私保护机制的研究,做到在实现广告推荐系统精准化广告投放的同时,最大程度保障个人隐私安全。
参考文献
[1]张玉洁,董政,孟祥武.个性化广告推荐系统及其应用研究[J].计算机学报,2021,44(03):531-563.
[2]张鑫,李竞一,郭宇萱,陈志豪,朱建方.基于数据挖掘的模拟经营策略分析——以“手环制造企业”为例[J].智库时代,2019(38):67+70.
[3]李双稀,王强,严梓欢,李超.基于人脸识别的商业大数据分析[J].电子世界,2016(22):38.DOI:10.19353/j.cnki.dzsj.2016.22.025.
[4]陈航.大数据对商业营销变革的影响分析[J].中国统计,2016(06):21-22.
[5]于海平,林晓丽,刘会超.基于数据挖掘的移动广告个性化推荐研究[J].计算机技术与发展,2016,24(08):234-237.