景晓玲
摘要:本文首先对基于Web数据库的数据库挖掘技术和数据库挖掘的概念进行总结,对基于Web数据库的数据库挖掘技术种类、种类分类以及挖掘步骤进行分析,对Web数据库挖掘技术及应用进行研究,以期对于Web数据库挖掘技术的推广,起到一定的促进作用。
关键词:Web数据库;挖掘;网络;数据1基于Web数据库的数据库挖掘技术概述
1.1 基于Web的数据库技术
现阶段,利用Web技术和数据库技术相互结合,对动态Web数据库应用进行开发,这是目前Web技术研究的重要方向。Web数据库系统即是利用Web和数据库相互连接,形成基于数据库的动态信息页面,便于用户进行操作,而且不限制地域范围,在一定程度上实现了系统的远程监控。
1.2 数据库挖掘概念
数据库挖掘技术,顾名思义就是从许多数据中快速挖掘出有效的、可理解模式的信息资源的一种过程。然而,并非所有数据库信息发现的过程都称之为数据挖掘。比如说,通过数据库管理系统对某记录进行查询,这是信息检索领域。随着数学理论的发展,数据库挖掘技术也随之进步,通过统计学、人工智能、最优化理论、信息论以及可视化理念等技术,深入挖掘数据信息之间的潜在关系,提高数据信息的传递效率。
2基于Web数据库的数据库挖掘技术
2.1 技术分类
⑴Web结构挖掘,主要是指对网络链接和组织结构中寻找数据信息,并通过这类信息对页面进行重新排序,找到更加重要的页面。⑵Web使用模式挖掘,主要是在网页访问记录中对用户的兴趣点进行搜寻,尤其是网页中每一台服务器都会保留用户的交互、访问信息,因此利用对这些数据进行分析和挖掘可以在一定程度上理解用户的习惯和兴趣,便于为用户提供更优质的服务提供理论依据。⑶Web内容挖掘是利用文档描述对数据信息进行挖掘,比如说用概念索引的功能,以此为基础的资源都默认归为这类方法。
2.2 种类分类
基于Web数据库的数据库挖掘技术按照用户对数据信息的兴趣可以分为:网络用法挖掘、网络结构挖掘以及网络内容挖掘。以上三种分类,网络用法挖掘的对象和其他有所区别,主要是面对的用户在网络的交互信息,包括服务器的日志、简介、交易、对话以及访问记录等,对这些数据挖掘的过程,即可以揭开用户网络行为的神秘面纱,对于促进网络数据库的发展具有重要意义。
2.3 挖掘的步骤
⑴资源搜寻。资源搜寻的任务是在目标文档中获取数据,其中需要注意数据资源并非局限于在线文档,还包括电子文档、电子邮件以及网站日志的数据等内容。⑵信息的预处理和选择。信息预处理和选择的任务是在已获取资源中进行筛选,剔除无用信息,对抽取数据进行整理,比如说剔除多余格式标记、广告鏈接等无用信息,然后进行数据整理和组织。⑶模式确定。模式的确定是一种自动的确定行为,范围并非仅限于一个站点内部进行。⑷模式分析。模式分析步骤是对已经确定的模式进行解释和验证,工作方式包括人员交互和机器自动两种。
3Web数据库挖掘技术及应用
3.1 Web数据库挖掘技术
⑴粗集方法。粗集技术主要是针对简单的数据信息,方便进行运算表达,然而准确度上有些偏差。通过粗集方法对数据信息进行处理,类似于二维关系,以集合论的数学理论基础,无法直接进行处理连续属性,粗集法挖掘技术在实际数据库挖掘过程中依然存在很大的制约。⑵模糊集方法。模糊集方法是在对实际问题进行解决的过程总,通过模糊集合的理论对数据信息进行模糊辨别和分析。一般而言,数据库系统的复杂程度和模糊性成正比,对模糊事物的属性进行描绘时,模糊集合理论大多是选择隶属度进行。目前,模糊集方法已发展成为云模型和云理念。⑶覆盖正例排斥反例方法。这种方法是以覆盖所有正例为指导思想,也可以理解为剔除所有反例,对潜在关系进行挖掘。具体方法是在所有正例中挑出一个正例种子,和反例种子进行对比,如果和字段取值在选择上有一定的相似性,那么剔除相似内容,如相反则保留。利用这种方式寻找正例可得出正例规则。⑷统计分析法。统计分析法就是利用数据库字段的关系进行统计和分析,分析出数据库中数据的内在关系,其中涉及到相关分析、差异分析等方法。
3.2 Web数据库挖掘技术的应用
⑴电子商务应用。随着网络技术的发展,电子商务体现出越来越强大的作用,也存在许多缺点,包括客户量大、难以处理、信息不安全等问题。在电子商务方面利用Web数据挖掘技术,对客户信息进行深度挖掘,根据标准分类后获取用户特征,确保企业可以全面的掌握客户信息,提供更加优质的服务。还可以利用关联分析功能对潜在客户资源进行挖掘,从而创造更大的收益。⑵网络教育应用。现阶段,互联网技术已经渗透到各行各业,教育行业也不例外,不断向网络化发展。利用网络技术,学生可以在及时获取有用信息,学校可以按照学生的需求进行个性化教学方式的安排,Web数据库挖掘技术可以从诸多信息资源中准确寻找该学生的兴趣点,为学生提供便捷的网络教育服务。
[参考文献]
[1]郑保平,郭荣宁.数据库技术研究综述[J].军事通信技术,2003(01).
[2]熊曾刚,张学敏,陈建新.关于数据库技术研究及发展现状的探讨[J].工矿自动化,2004(01).
[3]陈良维,谭斌,高江锦.简述提高网络数据库访问效率的方法[J].乐山师范学院学报,2006(05).
[4]韩鲲,薛辉.Web数据库的安全审计机制[J].信息安全与通信保密,2011(06).