电子商务中的数据挖掘及其应用

2020-10-28 08:47孙晓庆
科学导报·学术 2020年45期
关键词:网页页面数据挖掘

孙晓庆

摘  要:随着时代进步,当前企业信息系统普遍面临的“数据爆炸”问题,要及时解决这类问题,同时还要解决“信息缺乏”问题,数据挖掘技术成为当前学术界和企业界研究的热点。本篇文章详细讨论了数据挖掘在电子商务中的数据资源、基本方法、体系结构以及典型应用。

关键词:数据采集;电子商务

一、电子商务中数据资源的数据挖掘

1.服务器数据

通过对此文件中存储的某些项目进行语法分析,例如DNS,就可以知道客户来源所在的地区,通过对域名www.msta.acjp进行分析,就可以知道客户来自哪里。在cookielogs中,HTTP协议本身就是非事务类型的,这一点在事务类型的电子商务中并不适用,这给电子商务带来了很多问题。使用cookie可以解决这个问题。Cookie是一个软体工件,它可以储存客户存取伺服器的资讯,存储有关cookie的服务器软件的这部分称为cookielogs。

2.客户注册信息

用户在网站上的相关信息,通过屏幕传送并进入服务器。在电子商务活动中,电子商务扮演着非常重要的角色,尤其是关于安全和限制客户访问的时间信息。为了提高数据挖掘的精确性和更好地理解客户,数据挖掘需要将客户注册信息集成到访问协议中[1]。

二、电子商务环境下数据挖掘的基本方法

1.路径分析

路径分析可用于确定访问频率最高的网站路径。另外,通过路径分析可以得到关于该路径的其它信息。举例来说,70%的客户访问/company/product2,但是用户会忽略它们。此外,通常情况下,客户并未从主页访问站点,而是从/company/products访问,所以最好的方法是在此页中包含有关产品目录类型的信息。另外还应规定客户在网站上的停留时间,因为顾客一般只在网站上浏览4个网页,所以他们可以把重要的产品信息放在这些网页上,利用路径分析,改善网页设计和网页结构。

2.关联规则发现

关联规则的发现是在电子商务中发现用户访问网站上各种文档之间的关系。国际人工智能公司这两个数据中,A【即(1,1,m)】和t【(14,n)】是数据库中相关数据的一组特征属性。假如我们使用关联规则技术,我们可以发现,如果一个客户访问某个页面/公司/产品时,他也访问该页面/公司/产品2。

3.连续模式的发现

连续模式分析侧重于数据之间的前因或因果关系分析,在顺序事务集中寻找“某些项目跟随其他项目”的内部事务模式。以/company/producti为例,假如在过去10天里,有60%的在线订购客户已经购买了/company/product2,同时,60%的在线订购计算机的客户将在两个月内订购打印机和纸张。通过这些数据,商家可以为客户群体提供更好地针对性服务。

4.分类规则的发现

分类规则简而言之就是先标记每个记录,也就是根据标记对记录进行分类。通过数据挖掘(例如Fazhan/company/productl),假如在网上订购电子商务产品的客户中,60%是生活在大中城市的2岁左右的年轻人,经过分类,我们可以根据这类客户的特点进行经营活动,提供针对性的个性化信息服务[2]。

5.聚类分析结果表明

聚类分析方法的输入集不同于分类规则方法的输入集,聚类分析方法的输入集是一组未标定的记录集。通过将有相似浏览行为的顾客聚类,使管理者能够更好地了解顾客,为顾客提供更合适、更满意的服务。一些客户是否经常浏览相关信息。在这段时间里,真实和电子产品经常出现,通过分析,这些顾客都聚集在一个群体中,我们可以知道这群顾客的需求是什么。服务对象要与其他群组客户区分开来,如“大学生群体”和“白领群体”。这样,web就能自动将新产品信息电子邮件发送到这一特定客户群体,并为这一客户群体动态地更改专门网站。从某种程度上说,满足客户需求,对客户和销售者来说更有意义。

三、电子商务数据挖掘的架构

因为电子商务数据挖掘可以把那些复杂的数据以及结果直接转变成方便理解的信息,因此,要真正发挥电子商务的效率,除了要充分利用和合理选择前面提到的基本方法以及常用的工具外,还必须将办公处理阶段的数据存储在数据库中,并与电子商务行为有机地结合起来,通过图片可以看出,在电子商务中,数据挖掘的体系结构是由商务数据的定义、客户交互以及分析处理三个主要部分组成的。

1.企业数据定义

本节中,客户会通过自身需求来给出数据。这些数据包括了很多内容,如商品信息(产品、产品分类、价格)、内容信息(网页图片和多媒体)以及活动,这些都是收集和处理数据的关键因素。

2.顾客互动

本节介绍顾客与电子商务的互动行为,这种互动可能发生在网站的许多领域,例如客户服务和交流应用程序。为有效地挖掘这些数据源,数据收集不只是销售记录数据,还包括其他客户行为、網站浏览网页等。

3.分析与处理

此环节运用了大数据的统计、数据挖掘算法、可视化工具和OLAP工具,建立了交互决策支持环境,该部分是系统的最后一部分。

四、数据挖掘技术的应用

1.寻找潜在客户

潜在客户的挖掘第一步则是对客户群体进行分类,有“visitorOlace”和“visitoregular”,对商家来说,从网络上的分类中可以看出,通过对已被分类的客户和老客户的部分公共描述,新客户被准确地分类,新客户分类之后要对他们进行判断,即判断他们是有兴趣还是无兴趣的客户群,决定新客户是否是潜在客户,一旦确定了客户的类型,就可以向客户展示网页的内容,而网页的内容则是客户与销售商之间的关系,取决于所提供产品和服务的相关规则。

使用这些规则,对于新客户来说,需要花一些时间浏览市场网站,如果来自于上面的域名jp或m,那么该客户可以被看作是潜在客户,接下来只需要向其显示关于jp或Ils的页面内容即可[3]。

2.改善网站设计

网页内容的排列和连接方式就像超市货架上的商品。将相关文章组合起来,给予一定的支持和信任,有助于销售人员发现因特网上的关联规则,从而动态地适应客户网站的结构,使客户能够访问的连接文件之间的连接更加直接,客户可以轻松地访问他们可能访问的页面,如果网站非常方便浏览,就可以给客户留下好的印象,增加下次访问的可能性。

3.客户群

客户群为e-商业型。分析这类顾客的共同特点,电子商务组织方就能更好地了解他们的顾客,为顾客提供更加适合他们的服务。假如有些客户花些时间在“婴儿玩具”和“婴儿退货”页面上进行分析,把这些客户组合起来,根据收集到的信息,销售者可能知道这是一个“准父母”客户。因此要及时调整页面和页面内容,使商业活动与客户需求保持一致,让商业活动对客户和销售商更有意义。

五、结束语

在机器学习的基础上发展起来的数据挖掘技术,虽然已经有十几年的历史,但是在实际应用中还存在着许多问题,主要是系统结构和典型应用方面的问题,但是在电子商务环境下,数据挖掘技术仍存在着许多亟待解决的问题。比如,在不同国家或地区存储网络数据的不一致性,以及利用数据挖掘技术,利用动态数据库、对象数据库、多媒体等,另外还要进行抽取规则的准确性和时效性,数据的安全性,隐私性等方面的研究。

参考文献

[1]  刘绍君,刘宇为.数据挖掘技术在校园电子商务中的应用探索[J].南方农机,2020,v.51;No.348(08):217+226.

[2]  高艳敏.分析数据挖掘技术运用于电子商务中的对策[J].电子世界,2020(15).

[3]  赵书慧.电商市场中大数据挖掘的分析以及决策探究[J].中国新通信,2020(12).

猜你喜欢
网页页面数据挖掘
答案
让Word同时拥有横向页和纵向页
基于HTML5静态网页设计
搜索引擎怎样对网页排序
数据挖掘综述
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
驱动器页面文件大小的总数为何总是07
网页智能搜索数据挖掘的主要任务
一本面向中高级读者的数据挖掘好书