一种无冗余的Web日志挖掘算法

2012-04-29 00:44:03秦东霞姚遥
智能计算机与应用 2012年1期
关键词:汇总日志页面

秦东霞 姚遥

0引言

Web日志挖掘对于Web站点内部结构优化和页面内容的重新整合有重要的价值和意义。传统的Web数据挖掘方法如关联规则和聚类等先将挖掘出的结构进行分析,汇总后应用到具体网站中。这些应用主要包括对Web文档进行分类、Web页面的预取和聚类、优化查询功能及对客户信息进行分类汇总等。现有的基于关联舰则的Web日志挖掘算法都是基于所有频繁项的,这些算法存在两方面的问题:一个是往往产生大量的候选规则,另一个则是产生大量支持度和置信度相同的冗余规则。本文提出了一听十新的无冗余Web日志挖掘算法,该算法引入了频繁闭项集和最小关联规则的概念,在保证信息不丢失的同时实现无冗余挖掘,而且挖掘过程中候选规则也相对少得多。

猜你喜欢
汇总日志页面
刷新生活的页面
保健医苑(2022年1期)2022-08-30 08:39:14
常用缩略语汇总
医药与保健(2022年2期)2022-04-19 08:17:34
一名老党员的工作日志
华人时刊(2021年13期)2021-11-27 09:19:02
系统抽样的非常规题汇总
扶贫日志
心声歌刊(2020年4期)2020-09-07 06:37:14
游学日志
供应商汇总
供应商汇总
一种基于粗集和SVM的Web日志挖掘模型
同一Word文档 纵横页面并存