一种无冗余的Web日志挖掘算法

2012-04-29 00:44:03秦东霞姚遥

智能计算机与应用 2012年1期

关键词：汇总日志页面

秦东霞姚遥

0引言

Web日志挖掘对于Web站点内部结构优化和页面内容的重新整合有重要的价值和意义。传统的Web数据挖掘方法如关联规则和聚类等先将挖掘出的结构进行分析，汇总后应用到具体网站中。这些应用主要包括对Web文档进行分类、Web页面的预取和聚类、优化查询功能及对客户信息进行分类汇总等。现有的基于关联舰则的Web日志挖掘算法都是基于所有频繁项的，这些算法存在两方面的问题：一个是往往产生大量的候选规则，另一个则是产生大量支持度和置信度相同的冗余规则。本文提出了一听十新的无冗余Web日志挖掘算法，该算法引入了频繁闭项集和最小关联规则的概念，在保证信息不丢失的同时实现无冗余挖掘，而且挖掘过程中候选规则也相对少得多。

猜你喜欢

汇总日志页面

刷新生活的页面

保健医苑(2022年1期)2022-08-30 08:39:14

常用缩略语汇总

医药与保健(2022年2期)2022-04-19 08:17:34

一名老党员的工作日志

华人时刊(2021年13期)2021-11-27 09:19:02

系统抽样的非常规题汇总

中学生数理化·高一版(2021年2期)2021-03-19 08:32:06

心声歌刊(2020年4期)2020-09-07 06:37:14

小学生(看图说画)(2017年6期)2017-11-06 06:48:08

供应商汇总

中国洗涤用品工业(2015年8期)2015-02-28 19:02:54

供应商汇总

中国洗涤用品工业(2015年2期)2015-02-28 19:02:03

一种基于粗集和SVM的Web日志挖掘模型

电子设计工程(2014年19期)2014-02-27 12:00:42

同一Word文档纵横页面并存

电脑爱好者(2011年11期)2011-06-22 08:20:18

智能计算机与应用2012年1期

智能计算机与应用的其它文章: 数据挖掘在教育教学中的应用综述; 利用OPC实现西门子S7-200PLC与上位机iFix以太网通信探索; 基于VOD视频点播的交互式远程教学系统研究与设计; 关于铁路售票系统的故障分析及改进策略; 多屏互动系统的研究与实现; 基于RFID技术的烟草物流系统分析与设计