陈双飞 田富鹏
[摘要]数据挖掘使用的技术和方法广泛来自人工智能。对人工智能的发展及其最基本的技术:知识表示、知识推理、搜索,以及数据挖掘进行详细介绍。给出数据挖掘的定义,论述数据挖掘与人工智能的联系,并指出其发展前景。
[关键词]人工智能数据挖掘前景
中图分类号:TP2文献标识码:A文章编号:1671-7597(2009)0820031-01
人工智能目前在各个领域的发展都得到了极大的应用,数据挖掘就是其中之一。数据挖掘使用的技术和方法广泛来自人工智能,其在应用领域的应用得到了巨大收益。本文综述了人工智能和数据挖掘的产生、发展及其相互联系。
一、人工智能的发展
首先,对于人工智能是什么这个问题——也就是对人工智能的定义,我们还是比较难以统一的。在本文中,我们只是讨论性质的,应此并不要求严格定义。因而,我们尽可能涉及到多种理解。就目前对人工智能的定义大多可划分为四类,即机器“像人一样思考”、“像人一样行动”、“理性地思考”和“理性地行动”。这里“行动”应广义地理解为采取行动,或制定行动的决策,而不是肢体动作。人工智能是在计算机科学、控制论、信息论、神经心理学、哲学、语言学等多种学科研究的基础上发展起来的。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
在1956年的达特矛斯会议上,由麦卡锡提议正式采用了“人工智能”这一术语。随后人工智能的研究取得了许多引人注目的成就。例如,1956年塞缪尔研制出了跳棋程序,6年之后击败了一个州的跳棋冠军;1957年,纽厄尔、肖和西蒙研制了逻辑定理理论机的数学定理证明程序;1958年,麦卡锡建立了行动规划咨询系统;1997年,IBM公司制造的“深蓝”号计算机系统战胜了国际象棋大师卡斯帕罗夫等。
人工智能早期的研究领域有:专家系统、机器学习、模式识别、自然语言理解、自动定理证明、自动程序设计、机器人学、博弈、人工神经网络等;目前已涉及到以下研究领域:数据挖掘、智能决策系统、知识工程、分布式人工智能等。其中数据挖掘的出现使得人工智能的研究在应用领域得到了广泛的发展。
二、数据挖掘
DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科,它强调对大量观测到的数据库的处理。它是涉及数据库管理,人工智能,机器学习,模式识别,及数据可视化等学科的边缘学科。该领域对商业,工业,及科学研究都有极大的影响,且提供了大量的为促使新方法的发展而进行的研究工作。
三、数据挖掘与人工智能技术的联系
在此前,多数人认为数据挖掘是人工智能的一个分支。因为,在人工智能的研究中诞生了数据挖掘,数据挖掘中的重要理论都来自于人工智能的最基本的理论。其中最基本的三种技术知识表示、知识推理、搜索在数据挖掘中得到了体现。然而,随着数据挖掘的发展,我的看法是:数据挖掘本身已经成为一个独立的系统,它和人工智能固然有联系,但不是从属关系。数据挖掘本身内容丰富,理论方面除了和人工智能、机器学习外,和统计分析、OLAP、决策支持系统及专家系统等都有联系;应用方面除了web挖掘,还有文本挖掘、数据库挖掘、序列模式挖掘等等;数据挖掘本身的分类、关联规则、聚类等算法都博大而精深。将数据挖掘从人工智能里面独立出来,有助于我们更好的研究数据挖掘。
四、展望
目前人工智能存在以下几个发展趋势:
1.更新的理论框架
目前人工智能的研究棉铃很多困难,我们需要寻找和建立更新的人工智能框架和理论体系。
2.更好的技术集成
要集成的信息技术除数字技术外,还包括计算机网络、远程通信、数据库、计算机图形学、语音与听觉、机器人学、过程控制、并行计算、量子计算、光计算和生物信息处理等技术。
3.更成熟的应用方法
人工智能方法必须支持人工智能系统的开发实验,并允许系统有组织地从一个较小的核心原型逐渐发展为一个完整的应用系统。
目前数据挖掘存在以下几个发展趋势:
1.性能方面:数据挖掘涉及的数据量会更大,处理的效率会更高,结果的正确性会更精密。
2.工具方面:挖掘工具将越来越强大,汇合的算法越来越多,预测类算法将吸纳颇具新意的算法(支持向量机、粗糙集、云模型、遗传算法等),并将实现算法的自动选择和参数自动调优。
3.应用:数据挖掘的应用除了应用于大型专门问题外,还将走向嵌入式,更加智能化。
我们将使用人工智能与数据挖掘技术,去解决更多地实际问题,改善我们的生活。
参考文献:
[1]姬翔、杜文静,《人工智能论析》[J].中山大学学报论丛,2006年第26卷,8.
[2]Samuel L.Some Studies in Machine Learning Using the Game of Checkers[J].IBMJournal Research and Development,1967,11(4):601-618.
[3]郭萌、王珏,数据挖掘与数据库知识发现[J].模式识别与人工能,1998,11(3):292-299.
[4]Tukey,J.W.(1962),数据分析的未来,Ann.Statist.33,1-67.
作者简介:
陈双飞(1977-),男,汉族,甘肃省兰州市人,西北民族大学计算机科学与信息工程学院2007级计算机应用硕士研究生;田富鹏(1963-),男,西北民族大学现代教育技术学院教授,硕士生导师。