数据挖掘技术在气象预报研究中的应用

2020-01-17 06:47贾志明王东峰
黑龙江科学 2020年8期
关键词:气象预报数据挖掘气象

贾志明,王东峰,程 智

(中国人民解放军93381部队,黑龙江 五常 150223)

0 引言

气象预报学是现代基础科学中难度最高、挑战性最强的一门综合性学科,作为一种预测性质的学科,气象预报极易受到天气系统变化、天气因素干扰、天气状况作用等要素的影响,会让天气现象在一定程度上不按照常规演变生成,使气象预报的不确定性进一步加大。目前,国际上已经借助先进的电子计算机高速算法和数据挖掘技术来改进天气预报的算法模型,进而提高天气预报的预测能力。从目前数据挖掘技术在气象研究领域的发展来看,主要集中在两个方面:一是包括统计分析、关联度分析和回归分析在内的统计学数理统计方法,二是包括数学建模、空间数据研究和气象模式分析等在内的机器学习和软计算方法。

1 数据挖掘相关理论概述

1.1 数据挖掘技术

数据挖掘技术主要应用于商业数据的统计领域,是一种新型的挖掘操作技术,主要是从海量、无序、随机和无价值的数据中挖掘出对自我需求有意义、有价值和特定的知识信息,这是一个连续查找有用知识的过程。最终被查找到的数据信息一定是客户所需要且乐于接受和易于理解的知识信息。但这些知识信息并不是在任何范围内都被需要,只是在特定的场合被需要的用户所利用。

1.2 数据挖掘的流程

一个数据的挖掘项目会有一个数据信息被挖掘的过程,而这个过程主要由六个环节组成。第一。需求提供。对一个数据挖掘的项目而言,要从业务的角度去理解客户的需求,同时将数据挖掘的技术问题转化为一个有具体特征的知识信息,进而完成项目目标的初步计划。第二,采集分析数据。采集数据主要体现在对数据信息的理解方面,通过处理和识别等手段对采集到的数据质量进行评估和分析能够了解采集到的数据的各种属性。第三,数据预处理。在采集分析完数据后应进行数据预处理,对无用数据进行清理,记录及归纳客户所感兴趣的数据。第四,建模。在这一阶段应选择应用各种模型技术对数据进行重新整理和分配,使之成为相应技术所需要的数据格式。第五,模型评估。对建立的模型要用科学的方法进行评估,以确保建造模型的可行性,进而完成数据挖掘的最终目标。第六,实施。建造完模型后需要继续发挥模型清理数据的作用,找到有用的知识信息,满足客户的连续需求,及时提供报告以供操作人员及客户使用。

2 数据挖掘技术的基本分析方法

2.1 分类和数值预测

基于问题预测理论有两种表现形式,一个是分类,另一个是数值预测。预测分类能够识别出描述内容中所确定的数据类别,然后检索出客户所需要的数据集合。预测分类是一个可以监控连续不断数据内容的过程,可以用连续的数据集合来区分和识别出有描述意义的数据信息。

2.2 聚类分析

聚类分析就是通过物理和数据集合的形式对研究对象进行细致分组,然后针对这些分组信息进行类似与相似性分析。聚类分析主要是通过相似性原则查找出想要的和有价值的数据信息,然后将其进行区分和提取。聚类分析可以把与目标数据相关的类别数据全部提取出来,所以被广泛应用在气象、统计、医学、营销、心理学等领域。

2.3 遗传计算法

遗传计算法是一种全新的搜索算法,主要按照生物遗传的方式进行计算。遗传计算法被广泛应用在气象预报之中,能有效提升预报的准确率,并得到相关的集成性结果。但这种算法也有一定缺陷,就是搜索数据信息的能力不强,只能通过局部搜索的方式进行,搜索数据信息所需的时间较长。

2.4 关联规则法

这种方法的主要原理是对以往的数据信息进行分析研究,可以在大范围和大领域内获得客户需要的数据信息资料。此方法可以对以往的天气数据信息进行有效分析,能够达到精准预测气象变化的要求,提升了气象预报的准确度。此方法也有缺点,在面对众多候选集时,可能发生数据库重复扫描的问题,如果解决不好这个问题,在气象预报中就无法应用这种方法,也就预测不到相对准确的气象信息。

2.5 向量机方法

向量机方法具有精确度高、运行速度快等实际特点,对较小规模的数据信息处理具有一定优势。对于复杂气象条件下的气象预报工作,通过这种方法能获得更多准确度较高的数据信息,所以向量机方法被广泛在气象预报工作中应用。但向量机方法也存在一些缺陷和不足,在处理数据规模较大和种类较多的问题过程中,其处理速度和反映能力变差,无法在全领域应用。

3 数据挖掘技术在气象预报研究中的应用策略

3.1 构建数据信息库

在数据挖掘时,要利用数据信息库对原始数据信息进行分类和整理,可以用数据库技术来实现数据集合的目标。数据信息库主要从事务型数据库中采集数据,并用采集到的数据信息形成数据集合。在气象预报中,世界各地的气象信息数据是完全共享的,通过这个庞大的数据信息资源可以获得世界上任何一个地方的天气预报数据,能够为气象预报的预测提供气象服务资料依据。数据信息库可以为各个气象预报平台提供原始的天气数据资料,也可在气象预报的分析决策中为客户提供综合分析的变量和结果,更能为气象预报员提供具体的气象信息数据分析方法,使气象预报员在天气预报分析中的操作更为简单和快捷,能够充分满足客户在气象信息资料和气象预报信息分析方法上的需要。

3.2 完善气象决策服务过程

在气象预报分析过程中,气象预报的准确程度并不能保证百分百有效,其预测结果具有不可测属性。要想提高气象预报的准确度,就必须选用适当的气象预报分析模型。气象决策服务模型的建立大多具有技术标准高、时空变化快捷和决策提供科学等特点。气象决策服务过程主要包括:第一,问题的提出。了解区域内的天气变化规律,实现气象保障的需求目标。第二,数据预处理。对大数据信息进行区分和加工,检验数据信息的完整性和信息度,用科学方法进行评估预测,并将数据信息处理结果用客户能够快速理解掌握的方式进行呈现,以便解读。同时,在数据挖掘过程中要不断对数据信息进行优化处理,以满足客户对时空气象变化的要求。

猜你喜欢
气象预报数据挖掘气象
改进支持向量机在特征数据挖掘中的智能应用
气象树
龙江气象预报服务团队助力北京2022冬奥会
《内蒙古气象》征稿简则
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
我国海洋气象预报业存在的问题及对策
关于影响气象预报准确率的因素分析
大国气象
美丽的气象奇观