夏英明
摘要:数据挖掘自诞生之日起就成为信息产业的热点研究领域,从大量数据中挖掘有潜在价值的信息对商务、生产、科学探索等活动具有现实价值和重要意義。随着数据挖掘技术在不同领域的不断深入应用,获取有用信息的过程越来越快速、高效、便捷。
关键词:数据挖掘;技术方法;应用
中图分类号:TP311.13 文献标识码:A 文章编号:1672-9129(2020)16-0081-01
1 数据挖掘
数据库系统的成功使事务处理具备了更高效便捷的工具,然而人们更希望计算机能够对丰富的数据进行分析理解,为决策提供依据,于是数据挖掘就成为了处理信息的更高需求。数据挖掘不同于简单的数据搜索,从多种数据源中提取关键性数据只是挖掘的第一步,分析这些数据表达的规则、概念、内在联系等才是其核心目标[1]。作为一门发展极快的边缘性学科,数据挖掘从多门其他学科领域汲取营养,借鉴经验,也促进这些交叉学科的蓬勃发展。
2 数据挖掘技术方法
2.1统计学。统计学是利用统计模型完成数据的收集、分析、解释和表示,一些成熟的统计学技术,如主成成分分析、聚类等已经被广泛应用到数学、物理等科学领域。数据挖掘过程也经常利用统计学的相关理论,例如,描述统计学可以作为分析数据总体客观规律的基础;而借助推断统计学可以对已知的随机样本数据进行建模,以样本推断总体,提取结论。
2.2机器学习。机器学习是计算机向人工智能转化的主要途径,包含决策树、神经网络等多种技术方法[2]。机器学习在实际应用过程中限制较少且具备自动化、可自定义等优点,因此也受到数据挖掘的重视。例如,目前已有将神将网络用在部分疾病特征分类、识别上的医疗数据挖掘和将支持向量机用于葡萄酒品质分析的食品数据挖掘。
2.3信息检索。信息检索是搜索文本或多媒体信息的科学,通常以关键字作为主要查询目标,使用主题模型表达一个文本文档集词汇表的概率分布模型,方便对文本信息的理解分析。由于数字化应用和网页应用的快速普及,针对文本和多媒体信息的有效搜索和分析也成为数据挖掘的主要任务之一,因此信息检索技术的集成也变得尤为重要。
2.4数据库。大部分数据挖掘任务都涉及对大型数据集的处理,有些高要求任务更是需要挖掘能够实时处理。很多数据库系统已经集成了数据建模、查询优化、存储索引等功能,在处理相对结构化的大型数据集上有巨大优势。因此数据挖掘可以利用数据库的优点获得处理大数据集的高效率和可伸缩性。
3 数据挖掘技术应用
3.1市场营销。对于市场营销而言,如何更好的理解顾客、市场供求、市场资源和竞争对手等背景信息至关重要,由此数据挖掘是应用在市场营销分析层面的重要工具。举例来说,分类挖掘可以为市场形势、供应等方面提供依据;聚类挖掘可以划分相似顾客,为顾客提供更优质的服务;特征挖掘分析顾客喜好,选择性推送更符合顾客喜好的资讯或产品。
3.2工业制造。工业4.0时代的核心是智能制造,而智能制造同样离不开数据挖掘。工业制造过程会产生大量生产、测试数据,利用数据挖掘对数据进行科学分类、统计对比,得到产品的合格率、质量特性等信息,不仅可以提升制造效率,也能保证产品优质程度,创造更大效益,推动智能制造的发展。
3.3科学研究。科学研究的首要步骤就是从海量数据中获取有效信息,其次要进行不断的实验尝试和改进,最后要归纳、分析、总结实验数据,可以说数据是科研工作成败的关键。数据挖掘可以快速筛选、甄别有效信息为科学研究提供基础[3],还可以对实验数据进行不同形式的处理,剖析数据内在联系,为科学研究的决策提供重要参考。
3.4网络安全。对互联网安全问题的探讨自互联网技术应用至今从未停止,而数据挖掘为非法入侵的检测和预防提供了新的技术手段。防护过程主要针对攻击特征和网络异常进行检测,数据挖掘可以根据已知数据导出分类模型、正常行为模型检测入侵和行为异常;可以构建关联模式挖掘网络数据的内在联系,选择更有利于检测的属性;还可以通过流数据分析、分布式挖掘等,提供更全面的预防手段。
4 数据挖掘技术发展
4.1定向应用。最早应用数据挖掘技术的就是各类购物网站,电商平台收集用户搜索、浏览、购买等数据信息,分析用户的购买习惯、消费水平、个人喜好,推送相关产品的广告达到宣传目的。随着技术的不断成熟,数据挖掘也会探索其他应用领域,如金融、医疗、教育、电信等。由于特定应用领域问题具有不同的特征和挖掘需求,因此数据挖掘也会针对不同应用环境开发定向的系统和工具,降低传统技术系统的局限性。
4.2完善技术。不同的挖掘需求对数据挖掘技术的发展提出了很多极具挑战性的研究问题,比如针对不同类型数据(时间空间数据、多媒体数据、生物医学数据等)要不断完善、改进挖掘技术,完成高效挖掘。此外,为了防止利用数据挖掘技术恶意侵犯个人隐私数据的行为出现,使用数据挖掘要遵循的技术规范和安全机制也需要更多关注。
4.3集成化。作为一种数据分析手段,数据挖掘还需与其他技术工具集成,提高可扩展性和更丰富的功能。例如,数据挖掘可以和数据库、搜索引擎、云服务等主流的信息存储、处理、计算系统耦合成统一架构,也可以内置高级用户图形界面等可视化工具对挖掘过程和挖掘结果进行显示。
5 结论
数据的爆炸式增长使有效信息的获取不能再仅仅依靠传统数据处理技术,数据挖掘作为功能更强大的通用工具应运而生,也成功应用在多个领域,成为信息化社会不可缺少的重要技术。本文简要介绍了数据挖掘借鉴的部分技术,列举了数据挖掘的几类应用领域,并对数据挖掘未来的发展趋势进行了分析。
参考文献:
[1]胡佳宇.数据挖掘技术应用与研究[J].信息通信,2020,(8):128-129.
[2]马琳,董智鹤,夏嵩,等.数据挖掘技术综述浅析[J].数字技术与应用,2019,37(10):230-231.
[3]郭伟伟,吴文臣,隋亮.大数据时代的数据挖掘技术与应用[J].数字技术与应用,2020,38(8):103-105.