刘武萍
(佛山职业技术学院,广东 佛山 528237)
随着现代信息技术的迅速发展,世界掀起了信息化的浪潮。人们面临着大量的数据,但很难找到所需的信息和有益的知识,这是“信息爆炸”引起的混乱。数据挖掘技术是通过人工智能、数学统计和并行计算等技术的开发和集成而研发的。数据挖掘广泛用于金融、零售和通信等领域[1],已成为有效利用信息资源的方法和途径。
决策树主要基于感应分类数据的属性值,分类中常用的分层结构是“if-hen”原则,其主要优点是直观。决策树方法和神经网络的主要区别在于它可以解释决策过程,缺点是在处理复杂的数据时有很多要点,难以管理。同时,数据的基本处理也存在问题,其中决策树的用途是提取分类规则,进行分类预测,其决策树的生成如图1 所示。
图1 决策树的生成
贝叶斯网络是基于数据统计处理的方法,通过在网络上链接不确定的事件,可以预测与其他事件相关的事件的结果,可以在培训示例中显示或隐藏网络更改。贝叶斯网络具有分类、聚类和分析功能,其优点是容易理解,有良好的预测效果,缺点是对低频下的事件预测效果不好。贝叶斯网络在医疗制造领域取得了良好的成果。
粗略的集合论是在1982 年提出的数学工具。该方法在数据挖掘中起着重要的作用,它可以处理模糊和不确定性,检测与不准确和嘈杂数据的固有结构连接,并可用于功能衰退和关联分析。拉塞特可以被认为是模糊概念的数学模型[2],由于它们不需要有关的初始数据,广泛用于分类和收集不确定、不完整的信息。
关联性分析是一种基于大数据检测数据库中各种信息之间连接的分析方法。关联性分析法分析收集到的数据的关联性,挖掘无法直接应用的信息,挖掘隐藏信息,实现数据的优越性。由于该分析方法具有良好的准确性和针对性,因此经常用于数据的准确分析,如管理归档信息。
遗传算法适合于数据的聚类。通过时间相似性对比和空间相似性对比,可以使复杂的信息数据系统化,了解数据之间的内部关系,为获得有用的概念和模式而进行配置。构建数据模型时,将遗传算法与神经网络结合起来,可以加深对模型的理解。遗传算法广泛应用于自动控制、机器学习、模式识别、检索、调度和组合优化。
近年来,数据挖掘技术得到广泛使用。该技术可以提升企业和部门的各项能力甚至是核心竞争力,是未来规划和战略决策中不可缺少的技术。目前,数据挖掘技术作为电子商务的核心技术,在信息资源的开发中具有很大的优势。该技术被广泛应用在医疗、工业、金融等领域。
目前数据挖掘技术的应用在零售行业比较活跃,在数据挖掘技术的帮助下,明确了解顾客的喜好和购买趋势,对确立零售行业未来的销售战略有重要作用。关联规则经常用于捕获客户数据,根据客户反应的有效性分析客户的特性,进行后续的销售工作,并作为广告工作的指导原则。利用数据挖掘技术,可以有效分析客户的忠诚度,根据分析结果实时调整数据和产品类型,并根据客户喜好调整销售服务[3]。这个过程不仅有助于稳定现有顾客,而且有助于持续探索潜在顾客。因此,在零售行业应用数据挖掘方法可以进一步扩大本公司的销售规模和范围,从根本上增加销售量。
数据挖掘技术首次应用于商业领域以来,数据挖掘在金融中的应用相对成熟,数据挖掘技术的应用在社会和经济上都有着良好的效益。数据挖掘技术基于模型,有效分析金融市场波动的主要因素,据此建立相应的预测模型,避免市场波动带来的不利影响,为后续投资及相关决策提供合理科学的基础。预测模型应该综合客户培训水平、薪资收入、个人评价等多种因素,分析影响信用的主要原因,以更好的方式调整贷款政策[4]。另外,根据信用欺诈等不同类型的信息建立对应的预测模型,有助于银行潜在地规避风险,防止银行资金的不正当损失。通过建立预测模型,也有助于银行尽可能利用潜在和宝贵的客户,进行跨地区销售业务,使用户与银行的关系最大化。在证券交易过程中,可以科学预测股票,避免严重的经济损失,也可以尽快找出会计成本和过高的收益率等问题。
在医疗行业,医疗和生物技术在基因分析的过程中需要处理大量的遗传数据。数据挖掘技术的应用,可以探索遗传数据的潜在价值。在医疗领域,数据挖掘技术可以用于一些不雅疾病的研究,基于此,可以建立相应的医疗数据模型。另外,数据挖掘技术也可以应用于医疗记录数据的处理,根据数据的分析,制定相应的治疗计划。
近年来,物联网和云计算等信息产品记录了人们的行为轨迹,构建了各种大数据平台,促进了数据挖掘技术在各个管理领域的应用。例如,数据挖掘技术可以有效地应用于大学的管理。大学人口密度很高,在信息化时代,学生的数据信息形成了海量的数据,使得高校难以管理数据信息。数据挖掘技术对众多学生的信息进行挖掘分析,其分析结果适用于大学入学、教育评价、学生的意识形态政治工作等[5]。例如,使用数据挖掘方法分析教学效果,分析结果是评价教学效果的依据,也可以监测教师是否执行有效的教学任务。数据分析有助于教师更好地了解教室里学生混乱的地方,帮助教师改进教育计划,实施针对性的教育,提高教育效果。另外,应用数据挖掘方法,使用移动学习模式分析影响在线教学效果的多种因素,包括学生的学习进度、问题学习和其他相关数据。该分析可以帮助教师改进线上教学方法,提高移动学习模式下的教学有效性。
数据挖掘方法主要用于挖掘、分析和应用存储的数据。首先,它将出现在提高行业竞争力的领域[6]。数据挖掘技术的分析方法可以发现数据的内部价值,大大缩短科学研究的时间,提高产业竞争力。例如,通过现有的人工智能技术收集和分析信息,根据分析结果向消费者推荐自己喜欢的产品,从而提高行业的竞争力。
科研机构进行科学研究时,需要分析大量非常复杂的实验调查数据,用于数据分析的现有工具已不再适用。数据挖掘技术具有高层次的智能化,是非常强大的自动分析工具,与科学研究领域的数据分析工具要求相一致,促进了科学研究领域的应用和发展。
数据挖掘技术的发展对各个行业的发展都有着深刻的影响,该技术可以带动各个领域中模式的改变,虽然现在的发展还不是很好,但该技术的进步将会带来多个行业效率的提高。该种技术的问世是不易的,但其作用是显而易见的,为解决当今时代数据大爆炸打下了基础,特别是在如今的自媒体时代,数据呈指数增长,这项技术更是有了用武之地,笔者相信,随着人们对该技术的不断开发,它会给人们一个惊艳的结局。