基于电子商务的Web数据挖掘研究

2015-09-25 09:14张素智曲旭凯张琳
现代计算机 2015年9期
关键词:复杂性页面数据挖掘

张素智,曲旭凯,张琳

(郑州轻工业学院计算机与通信工程学院,郑州 450002)

基于电子商务的Web数据挖掘研究

张素智,曲旭凯,张琳

(郑州轻工业学院计算机与通信工程学院,郑州450002)

0 引言

随着计算机网络技术的飞速发展和互联网的大面积普及,电子商务已悄然融入到我们日常生活中的方方面面,影响人们的消费理念,并逐步取代传统商务模式。在商业领域中,电子商务是一种新兴的商务贸易模式[1]。它是一种以互联网为主体,信息技术为核心的现代商业模式。电子商务的出现促进了传统商务模式的网络化进程,改变了公众的消费环境,现实了商务的活动的数字化、智能化。

电子商务以其方便、快捷等优点赢得了广大用户的青睐,网上交易数额逐年上涨,但是伴随着电子商务活动的发展,各种问题的出现引起了人们的重视。如今,电子商务平台、购物网站等大量的出现,为我们提供各种各样的商务信息。我们面对这些数量巨大、类型不一、结构多样的信息,并且想从中找到对自己价值或是与我们自身需求相关的信息困难重重,将数据挖掘技术应用于电子商务势在必行。数据挖掘技术是一种从大量的、不完全的、有噪声的、随机的、模糊的数据中提取隐含在其中的、人们事先不知道的,但又具有潜在价值的信息和知识的技术[2]。

1 面向电子商务的Web数据挖掘

1.1Web数据挖掘

(1)Web数据挖掘简介

数据挖掘是从大量有噪声或模糊的随机数据中发现有效的、可理解的、隐含其中的、潜在有用的知识或模式[4]。数据挖掘是一种深层次的数据分析方法,结合当前各行各业自动化的发展进程,数据挖掘被运用到越来越多的领域中。如在生物医学中对遗传信息、DNA数据的分析,在GIS系统中对地理位置、地貌特征的挖掘任务等[5]。数据挖掘在经济领域的应用成为目前人们关注以及学者研究的热点。通过对网络中产生的巨量数据进行分析、处理,数据挖掘可以为企业提供客户群体的分类、产品销售预测、企业发展规划等方面的支持。

进行数据挖掘的研究不仅仅是在理论层面上的论证和阐述,关键在于把研究的成果应用于实际中。对于在企业中应用数据挖掘,最主要的目的是为企业管理者提供决策支持,为企业提高效益、获取利润提供帮助。在数据挖掘过程中面临着一个棘手的问题就是待处理的数据是海量的,而待挖掘与通过处理后发现的知识模式匮乏[8]。如何使数据挖掘在商业领域发挥更大的作用是数据挖掘待解决的难题。

(2)Web数据挖掘分类

Web数据挖掘根据Web信息的复杂性、多样性可以分为三类,即:Web内容挖掘、Web访问挖掘、Web结构挖掘。内容数据、访问数据和结构数据三类挖掘对象分别与以上挖掘类型对应。

图1 Web挖掘分类图

①Web内容挖掘

Web内容挖掘的主要任务包括网页分类、网页聚类、信息抽取、网页结果挖掘网页摘要等。Web内容挖掘需要从Web页面及后台数据库中开展挖掘任务,从大量的元数据、文本、视频、音频等网络数据集中找到特定的信息[9]。Web内容挖掘重点研究网页的分类和聚类。Web页面分类是将目标数据源按照预先定义的主题、类别,按照其不同的属性特征构建分类模型。Web页面聚类是将Web中的页面聚集成不同的类别,且同一类别中的页面内容有极高的相似度。Web内容挖掘用户发现相关页面间的连接结构,权威页面查找等[10]。

②Web访问挖掘

Web访问挖掘也称为Web应用挖掘或者Web日志挖掘[11]。Web访问挖掘主要是根据Web中的访问日志或用户的登记文件数据发现用户的访问模式。与Web内容挖掘和结构挖掘使用Web原始数据不同的是访问挖掘任务使用的是从网络交互中抽取的二手数据。Web访问挖掘在实际应用较为普遍,它主要提供对客户行为的分析。Web访问挖掘根据数据源的不同处理方式可以分为两种[12]。第一种是将数据直接进行预处理后进行挖掘任务,第二种是将数据转化后存入关系表中,然后对关系表中的数据进行挖掘分析。通过访问挖掘能发现序列模式和关联规则、提高站点效率、抽取访问信息特点、发现导航模式等。

③Web结构挖掘

Web结构挖掘的任务是从Web页面中发现它们之间的组织结构。Web结构挖掘主要面对是的网页间的链接结构、内页内结构以及URL路径结构等,Web页面结构复杂,根据不同的用户需求有其独特的设计[13]。通过对Web页面结构的分析、判断,将页面之间的连接关系分类,发现除内容以外的信息,再结合挖掘模型获取网页相似度和关联信息。

(3)Web数据挖掘过程

数据挖掘过程一共要经历7个步骤,这7个步骤根据挖掘结果反复迭代,从而得到更加准确的知识,每一个步骤都是必不可少的[14]。过程示意图如下:

图2 数据挖掘过程图

从图中可以看出,数据挖掘主要包括:

①定义问题

数据挖掘任务进行的必要条件是明确挖掘所针对的业务任务。在挖掘任务开始之前对挖掘任务的成果无法进行预测,但对于多数问题来说,在实际应用中还是可以在一定程度上有一些预见性的趋势判断的[15]。在Web中进行数据挖掘,把握清晰、明确的挖掘定义问题是非常必要的,如果只是盲目地为了挖掘而开展挖掘任务,一般来说挖掘任务都不会成功。

②数据收集和抽取

数据收集就是对数据的搜索、取样或是对数据特征的探究。电子商务网站每天都会产生巨量的交易数据和用户浏览记录,数据收集需要把这些相关数据存放到数据仓库或是数据集市,然后利用数据分析技术进行处理。对于Web数据的收集,需要从Web服务器中下载日志文件,从代理服务器端收集信息以及从Web页面中提取数据[16]。如果数据仓库中数据贫乏、不足以支撑数据挖掘任务,还需要从外部系统收集信息。必要时还需另外购买数据进行数据填充。除了数据的收集之外,还需要对收集到的数据进行抽取。进行数据抽取的主要目的是对集合中海量数据进行筛选、分类,为后续的挖掘工作提取高质量的数据源。

③数据预处理

数据预处理是数据挖掘任务中最为关键的一个阶段,也是最为消耗数据的一步。数据预处理包括对数据的分析、数据转换、数据的清洗、技术选择等,主要是为了降低数据中的“噪声”,解决数据缺省、冗余、和数据不一致的问题[17]。Web中数据挖掘任务面对的是巨量的复杂数据,需要运用多种技术对数据进行预处理,为挖掘工作做好准备。所以,数据预处理阶段是数据挖掘成败的关键[18]。

④挖掘模型构建与评估

构建模型主要是将数据进行规格化的处理,使用不同的算法、调整参数来优化挖掘任务。全面考虑影响建模的各种相关因素,从模型的可用性、准确性、普适性等方面进行全面的考察。在确定模型构建方式并完成模式构建任务后需要对模型进行评估。模型的评估不单单是利用工具软件对构建的模型的效率、精确度进行测试和验证,需要分析方法的辅助来衡量所发现模式的意义和提高其在实际业务的应用[19]。模型评估是一个重复的过程,模型中的个别数据或一组变量不能适合实际业务应用的所有需求。模型评估需要有持续的数据选择,必要时需要对第一步的问题进行重新的定义才能得到更加有价值的评估结果[20]。数据挖掘技术本身就是一个不断往复、不断迭代的过程,通过多次的循环构造处理才能得出更好的评估模型。

⑤数据挖掘

数据挖掘阶段需要选择合适的算法对数据进行挖掘,从海量的数据中发现有效的、可理解的、隐含其中的、潜在有用的知识或模式。电子商务中常见的数据挖掘方式主要有关联规则、分类、聚类、序列模式[21]。

⑥结果分析和预测

数据挖掘阶段完成后需要对挖掘的结果进行必要的解释说明和评估。在挖掘结果的表达方式上可以对数据进行可视化的处理,实现对稀疏或复杂数据集的深入洞察。实践是检验真理的唯一标准,挖掘结果也需要在实践中进行检验和论证[22]。在论证过程中,如果挖掘结果准确度不高或者与预期偏差较大就需要对问题进行重新的定义,然后再次收集数据,进行数据的预处理、构件模型并重新进行数据挖掘。预测是基于对挖掘结果的分析,电商网站每天都有成千上万的业务产生,可以利用风险预测来预测每一笔成交业务潜在的风险。

⑦模型管理

数据挖掘任务通过使用数据挖掘的技术得到知识应用规模小、数据模式管理困难,但在少数情况下是相对比较稳定的。在一个挖掘任务中构建的模型生命周期有限,并不是一劳永逸的。在实际应用中,需要不断地迭代和反复,从不同的数据集中进行挖掘,调整算法和参数进行反复的训练,结合实际业务需求动态地修正构建的模型[20]。通过数据挖掘构建的模式是重要文件集合,包含重要的商业数据和企业信息。在进行数据挖掘过程中应格外重视挖掘结果、挖掘模型等数据的存储,数据库管理员需要根据实际情况分配用户访问权限,避免不必要的损失出现。

1.2电子商务中Web数据挖掘问题

电子商务中产生的Web巨量数据种类多、格式复杂,与传统格式化数据仓库存储的数据相比较其最大的特点就是半结构化。Web中的数据在站点中以HTML文本的形式存储,数据格式各异。在进行挖掘任务时,对图像、视频、音频等数据进行处理时,主要有以下两个方面的问题。

①数据库异构

从数据存储方面出发,电子商务中进行Web数据挖掘的数据集即为一个大型的数据库,网络中的各节点看成是独立的数据源。由于用户在网络中的动作随机性较强,网络数据格式没有固定的结构,在数据挖掘的任务开始之前需要对数据进行预处理,为用户提供统一的视图以便于进行挖掘工作。另外,数据的获取工作是进行数据挖掘任务的前提条件。如果在数据收集阶段出现问题,那么后续对数据的分析、集成、建模等工作就无法进行。

②数据的半结构化

Web中的数据与传统数据库中存储的数据在结构上存在很大的区别,其最大的特点就是半结构化[23]。传统的数据库有固定的模型构造标准,用不同的格式描述所存储的数据,而Web中的数据由于格式灵活多变,无法按照既定的模型进行描述[24]。目前,电子商务网站中数据呈动态分布、流动性高,大多数的网站由企业按其发展思路进行设计,网站格式不一,数据种类多样。

通过上述分析可以看出,Web数据挖掘中最主要的问题是解决数据结构半结构化和构建半结构化的集成模型。在实际应用中,大多数的网站开发都是基于XML技术的,XML数据是自描述的半结构化类型的数据,XML技术可以实现将数据源不同结构的数据整合起来,使搜索不兼容的数据库成为可能。XML的灵活性和可扩展性决定了其描述被搜索的Web页面中数据的特点,适用于描述不同应用平台中的数据。XML技术在网站中的广泛应用推动了Web数据挖掘的发展。

1.3电子商务中Web数据挖掘应用

目前,在Web中进行商务活动成为电子商务发展的关键因素,庞大的客户群体与惊人的交易速度是它主要的特点。在跟踪用户Web浏览痕迹、行为习惯、构建分析模型的前提下开展电子商务活动,可以使得企业更加直接发现客户的需求,有针对性地调整企业发展策略。

Web服务器日志文件是网络用户登录在线市场服务器、浏览信息等动作的“痕迹”。通过对客户端在访问时产生的浏览痕迹进行Web数据挖掘,对客户的行为、访问内容、停留时间等动作的分析、判断,可以得到普适的客户行为知识,为网络服务端的改进提供帮助。在这些数据的分析中使用Web数据挖掘技术,服务端有目的地改进服务,动态地调整页面内容与结构,为用户的不同需求提供个性化的服务,提升电子商务服务的效率。在这样的前提下,电子商务和Web数据挖掘技术牢牢地结合在一起[23]。在商务领域应用数据挖掘技术将最大限度地提高企业分析、处理资源的能力,使企业在行业中的竞争力得到充分的体现[25]。这不仅为企业客户关系管理、产品数据管理、企业资源计划提供有效的技术支持,还有利于优化企业资源,提高企业经营效率及管理水平。

在电子商务中,电商网站都有其独特的设计思路和构建模式。虽然网络环境复杂多变,用户根据自己的喜好在站点驻留时间、浏览行为不尽相同,但是用户浏览习惯从长远分析是稳定的。通过使用Web数据挖掘技术对站点用户历史数据的分析,就可以得到对用群体的分类、聚类客户和潜在的商业目标等。以下是Web数据挖掘在电子商务中的应用[26]:

①发现具有潜在价值客户

在挖掘技术的帮助下,电商网站可以对其用户及浏览网站的游客进行相关分类,划分客户群体、发现潜在的客户[27]。通过对客户类型划分,描述用户特征等过程将潜在的客户转化成为在册客户。最后,依据客户类别针对其特点提供用户感兴趣的内容。

②提供优质服务,延长客户的驻留站点时间

对消费者来说,电商网站每天都能为其提供海量的购物信息,互联网的普及拉近了客户与销售商之间传统消费模式的距离。如何使用户增加驻留在自己网站上的时间、增加用户对自己网站的访问次数成为电商企业成败的关键。电商企业需要了解客户的需求、浏览行为,划分用户类别、兴趣,结合数据挖掘中的序列模式发现技术动态的调整Web页面内容,有目的地为用户提供信息和服务,以此延长客户在网站上的驻留时间[28]。

(3)改进站点设计

对Web站点的结构优化可从以下两方面来考虑[4]:

①通过对Web日志文件的挖掘,发现客户访问网站页面间的潜在关联关系,在关联频度高的Web页面之间增加链接,提高用户交叉访问量,增加用户使用频度。

②在Web页面设计时运用路径分析技术判定Web站点中访问频度高的路径,把具有关联性且一定支持度、信任度的信息或链接调整到相近的结构中。由此改进站点和Web页面的设计,提高商品销售量。

③聚类客户分析

将客户聚类分析应用于电子商务中是其重要的应用方向[29]。对客户进行分组、聚类,分析具有相似动作和浏览行为的用户特征,可以帮助企业发现用户需要什么样的服务,是否为用户提供服务。如果一些用户高频度浏览、访问“Java技术”、“软件开发”页面,通过分析,可以将这些用户聚类为一个组群。这样站点就可以通过调整为这类用户提供更加细致的信息,而不会为访问了“数码产品”、“三星手机”的用户提供相似的信息。聚类分析技术的应用使得企业更加了解客户的需求,从而为客户提供合适的服务。

2 电子商务中Web数据挖掘的挑战

2.1数据复杂性带来的挑战

电商“大数据”的产生为人们带来了海量的数据,与此同时,我们在对数据对象进行分析、处理时也不得不面对复杂多变的数据环境。电子商务“大数据”环境下,数据的典型特征就是类型不一、质量参差不齐、关联关系复杂。数据自身的复杂性体现在其类型的复杂性、结构的复杂性、模式的复杂性三个方面[30]。由于数据复杂性带来的问题不仅使得数据计算维度上的增大,而且使得传统的数据处理方法对语义分析、情感识别、主题发现等挖掘任务的分析面临着巨大的困难与挑战[31]。然而现在,我们对大数据分布与其复杂性的内在联系缺乏认识,对大数据自身的数据复杂性、计算复杂性之间的内在原理和其背后的物理意义缺乏理解,加上缺少面向领域的大数据处理知识,极大地制约了人们对大数据高效计算模型和方法的设计能力 (以及面向商务领域的数据处理知识的匮乏,在很大程度上限制了人们对高效数据计算模式的探索、构建和核心算法设计的能力)[32]。

通过对电子商务巨量数据进行模式分析和规律探究、精简数据维度、知识抽取、构建模型、设计算法等任务,有助于对数据复杂性及数据本质特征进行描述和量化。描述和量化数据复杂性和本质特征是深入研究电商巨量数据内在机制度量指标的前提。在研究过程中需要降低数据维度,空间计算复杂度以及二者之间的内在联系,结合数据分布理论模型和多模关联关系,对电商“大数据”需要降低复杂度以及按需约简的原理进行解释,使对电子商务巨量数据复杂性的研究成为其数据计算的研究基础。

2.2计算复杂性带来的挑战

电子商务“大数据”规模巨大、结构异化、高流动性等特点使得传统的模式分析、数据挖掘、信息匹配、检索等数据处理方法不能充分地对大数据进行有效的处理和分析[33]。而且大数据的计算需要我们突破传统计算方式、数据分析、处理方法中对全局数据统计分析和迭代计算的依赖。在我们解决有关大数据的问题时,需要反复地研究和分析其计算的可行性、求解的可行性以及其计算的复杂度[34]。研究针对大数据的高效算法,提供处理、分析大数据问题的基础框架,提高人们对大数据的认识,引领、支持特定领域应用发展,是如今数据挖掘任务的主要问题。电商“大数据”体积巨大,数据间相互关联复杂,价值密度低、分布失衡等特性对研究电商“大数据”的计算可行性、计算复杂度以及构建新的算法模型提出了挑战,同时也为我们进行创造性的研究提供了机遇。

计算复杂性探究的是理解不同数据的难度以及处理数据的困难性、量化指标[35]。研究以数据为中心的电商“大数据”的计算模式,需要结合平均复杂性理论、光滑分析理论、推送式系统模型,设计有效的分布式算法帮助对数据计算复杂性进行理解。

2.3系统复杂性带来的挑战

针对电子商务巨量数据类型不一、应用繁多的特点构建的数据挖掘处理系统是目前行业内研究的基础设施。电子商务惊人的业务量为我们提供了数据体积巨大、格式多样、价值密度分散的大规模数据,其处理过程中计算可行性任务复杂多变、计算任务的时空维度高及其对实时性的过高要求都是研究面临的难题[36]。电子商务巨量数据本身以及在处理中遇到的难点是对研究大数据所设计的处理系统、算法模型的考验,更是对大数据处理平台的效率、算法的优化度以及处理过程中的能耗提出了要求,要求大数据处理系统具有高效处理事务的特点。电商“大数据”处理系统的平台搭建、框架设计、计算可行性架构、计算复杂性维度测试的设计研究都是以电商“大数据”处理系统的并行高效处理、优化为目标的而进行研究。因此大数据分析、处理应解决的首要问题是构建高效优化的分布式处理系统及其软硬件系统的架构,这为大数据处理系统的架构、实施、测试与维护提供了准则,是处理复杂的动态多维大数据的重要依据[37]。

在研究电商“大数据”处理系统的复杂性、计算精度、系统效率与耗能间的关系、并行处理能力等多项任务的过程中,系统的优化问题与绩效评价成为最富挑战性的工作[38]。在实际处理过程中需要根据资源分配和系统负载情况,结合数据流动速度快、价值密度低的特点对电子商务巨量数据的分布式存储、处理工作进行优化,解决系统复杂性带来的挑战。

3 结语

近年来,随着电子商务的高速发展产生了Web大数据,本文由此引出了Web数据挖掘的基本概念,详细分析电商数据挖掘的研究热点,Web数据挖掘分类及应用,最后强调了Web数据挖掘数据面临的一些挑战。对电子商务Web数据挖掘的研究将会持续深入,随着研究的深入将会给Web挖掘技术提出新的要求和挑战。

[1]杜芳芳.浅析基于Web数据挖掘的电子商务网站架构[J].电子商务,2010(02):69~70

[2]孙学军.面向电子商务的Web数据挖掘应用研究:山东大学,2011

[3]曹丽君,刘西印,魏宇清.基于电子商务的数据挖掘探究[J].商场现代化,2008(05):157

[4]王化鹏.基于XML的Web日志挖掘技术研究:华北电力大学(河北),2007

[5]石文卓.改变未来的大数据[J].时事报告(大学生版),2012(02):102-3

[6]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(01):146-69

[7]张莹.Web数据挖掘在电子商务中的应用[J].商场现代化,2007(01):108

[8]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013(S1):142-6

[9]王继成,潘金贵,张福炎.Web文本挖掘技术研究[J].计算机研究与发展,2000(05):513-20

[10]周绪倩.基于电子商务的Web数据挖掘系统架构研究:河北工程大学,2010

[11]任新.Web数据挖掘及其在电子商务中的应用研究:贵州大学,2008

[12]左丹.基于Web日志的用户访问序列模式研究:东北师范大学,2009

[13]邹志文,朱金伟.数据挖掘算法研究与综述[J].计算机工程与设计,2005,(09):2304-7

[14]邹依依.自适应网站的Web挖掘技术的研究:电子科技大学,2008

[15]宁海霞.一种基于XML的Web访问模式发现模型研究:华中科技大学,2006

[16]孔祥洪,翁梅.基于Web的数据挖掘分类技术[J].中国科技信息,2005(20):52

[17]许韦.基于容差关系的多粒度粗糙集在电子商务Web挖掘中的研究:江苏科技大学,2013

[18]张素智,李宝燕,樊得强,editors.面向用户和领域本体的Web信息采集系统.河南省计算机学会2010年学术年会,2010

[19]岳惠娜.商务智能中营销预测模型及算法研究:沈阳工业大学,2014

[20]马凌,邢芸,陈昊天.我国社会化电子商务发展现状与趋势分析[J].现代商贸工业,2014(05):167-8.

[21]胡文瑜,孙志挥,吴英杰.数据挖掘取样方法研究[J].计算机研究与发展,2011(01):45~54

[22]刘姝.应用Web数据挖掘技术进行电子商务的分析[J].电子技术与软件工程,2014(07):216-7

[23]黄玲.在电子商务中应用Web数据挖掘的研究:湖南大学,2014

[24]周朕.面向电子商务的WEB数据挖掘研究:中南大学,2011

[25]李争艳.Web数据挖掘技术及应用研究[J].科技资讯,2007(14):95

[26]朱红祥.基于web日志数据挖掘的电子商务推荐系统实现:山东大学,2008

[27]娄迎红.面向电子商务的数据挖掘研究与应用:山东师范大学,2009

[28]王涛.一种基于Web日志挖掘聚类算法的研究:西安电子科技大学,2012

[29]朱林,雷景生,毕忠勤,杨杰.一种基于数据流的软子空间聚类算法[J].软件学报,2013,(11):2610-27

[30]王明星.数据挖掘算法优化研究与应用:安徽大学,2014

[31]申彦.大规模数据集高效数据挖掘算法研究:江苏大学,2013

[32]孟小峰,李勇,祝建华.社会计算:大数据时代的机遇与挑战[J].计算机研究与发展,2013,(12):2483-91

[33]徐莉.基于数据挖掘技术的电子商务推荐系统的研究:北京邮电大学,2013

[34]常凯.基于神经网络的数据挖掘分类算法比较和分析研究:安徽大学,2014

[35]陈秀娟.数据挖掘在电子商务中的研究[J].信息与电脑(理论版),2014(05):135

[36]孙二娟.基于隐私保护的数据挖掘技术与研究:浙江理工大学,2014

[37]周昊明.销量数据挖掘技术及电子商务应用研究:广东工业大学,2014

[38]王卫锋.电子商务中基于web的数据挖掘技术应用[J].河南科技,2014(17):28-9

Electronic Commerce;Big Data;Web Data Mining

Research on the Web Data Mining Based on Electronic-Commerce

ZHANG Su-zhi,QU Xu-kai,ZHANG Lin
(College of Computer and Communication Engineering,Zhengzhou University of Light Industry,Zhengzhou 450002)

国家自然基金项目(No.61201447)

1007-1423(2015)09-0012-07

10.3969/j.issn.1007-1423.2015.09.003

张素智(1965-),男,博士,教授,研究方向为Web数据库、分布式计算和异构系统集成

曲旭凯(1990-),男,河南洛阳人,硕士研究生,研究方向为数据挖掘与集成

张琳(1993-),女,河南焦作人,硕士研究生,研究方向为数据挖掘与集成

2015-01-04修改日期:2015-03-23

随着电子商务的高速发展,互联网、无线网络、移动网络的大面积覆盖,电子商务不仅潜移默化地影响着传统的商业模式,而且产生海量的Web数据,成为目前新的研究热点。电子商务“大数据”中隐藏的巨大的价值与Web数据挖掘技术在数据分析方面的作用使得二者自然的结合在一起。Web数据挖掘在电商巨量数据的分类、聚类、数据解释等方面发展迅速,与此同时,Web数据挖掘仍面临数据复杂性、计算复杂性、系统复杂性等方面的挑战。

电子商务;大数据;Web数据挖掘

With the rapid development of electronic commerce,and the large coverage of Internet,wireless network and mobile network,electronic commerce becomes the new research hotpots,which not only influences subtly by environment of the traditional business model but also produces an enormous amount of Web data.The huge value under the big data of electronic commerce and the effect of data mining technology in the data analysis makes them get together naturally.With the rapid development of the data mining technology in the classification,cluster,data interpretation of electronic commerce massive data.It still faces some challenges as complexity of data,computation and system at the same time.

猜你喜欢
复杂性页面数据挖掘
刷新生活的页面
答案
探讨人工智能与数据挖掘发展趋势
PFNA与DHS治疗股骨近端复杂性骨折的效果对比
简单性与复杂性的统一
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
应充分考虑医院管理的复杂性
一种基于Hadoop的大数据挖掘云服务及应用
直肠腔内超声和MRI在复杂性肛瘘诊断中的对比分析
高级数据挖掘与应用国际学术会议