魏爽 吴书成 杨明 张驰 刘熔熔
(浙江省气象信息网络中心 浙江省杭州市 310017)
气象资料存储检索系统是气象部门开展业务工作的基础。目前,伴随着气象资料服务需求的不断提升,国内各级气象部门都相继建立了存储与检索系统,提供实时更新的常规及特色气象服务。国家气象局[1]依托“短期气候业务系统工程建设项目”,采用数据库和文件系统相结合的方式,分别建立了实时数据库和综合数据库以解决气象资料的规范化存储和实时业务使用需求。河南省气候中心[2]根据本省实际业务需求,构建了气候业务数据库系统,保证了气象资料的安全性和一致性。广东省气候中心[3]以优化任意时段累年气候数据统计检索效率为切入点,提出了优化的数据逻辑分解流程,应用于广东省农业气象业务系统,优化了用户体验。刘樱等[4]基于Spring Boot 框架,建立了气象风参数的查询服务平台,为重大基建工程中的抗风设计提供有效的数据服务。浙江省各级单位[5-7]都建立了满足各级业务需求的资料存储检索系统,但各数据库分散存储、表结构类型不统一等问题约束了气象业务、科研查询与服务的发展。因此,本文以地面资料为基础,采用云存储技术,建立地面日、旬、月、年统计应用数据库,在此基础上,构建气象地面实时与历史资料查询服务系统,提供任意时段统计、实况快报、在线生成等值线图等功能,为气象业务应用提供数据服务。
本文以支撑气象数据查询统计及预报、科研应用需求为目标,历史地面资料查询服务系统采用四层设计框架,分别为数据层、业务层、服务层和表现层,如图1 所示。
梳理省级历史基础数据资源,设计统一的数据存储环境,根据业务需求存储3 类数据,包括国家站建站以来,经过台站级、省级质控后的日、侯、旬、月、年统计数据及1971-2000年、1981-2010年30年整编数据;区域站建站以来的小时原始观测数据;外省共享的国家站和区域站小时观测数据。所有数据均经过统一的存储和管理,采用SQL Server 数据库进行存储。
根据相应业务需求对存储数据进行清洗和加工处理,形成满足各类业务场景的成品数据。对省级气象资料业务系统质控结果同步至数据库中,剔除地面降水、气温、气压、相对湿度、能见度等要素错误数据,完成数据清洗。在此基础上,完成区域站日、旬、月、年可靠数据的加工,根据标准统计算法规范进行实时统计更新。提供任意时段各类统计值的查询和服务、历史同期对比和评估、年值变化情况、各类气候值查询等实现逻辑,发送数据查询请求。
图1:系统总体框架
表1:各要素统计精度表
该层提供包括气象要素区域分布、空间插值、等值线图、历史统计等主要功能,可以为历史地面资料查询系统提供多种服务形式。并且,提供生成多种要素实况快报功能,及时提供气象要素最新动态。
采用HTML +CSS + Javascript 技术,提供常规统计、历史同期统计、任意时段统计等功能,并实现定制服务系统、用户管理等内容。
另外,日志系统和监控系统作为服务系统不可或缺的组成部分,同样承担了重要的角色。日志系统生成各环节日志记录,并可以在线查看错误日志,当发现系统中出现错误日志记录时,将发送报警提示,保证每个处理环节的正常运行。监控系统包含检测服务器CPU、内存、数据相应时间、SQL 语句查询时间等,通过监控检测信息,能够清晰定位到系统的问题点。
为获得高质量的区域站统计资料,除了需要保证数据的完整性之外,也需保证统计方法的合理性、科学性和一致性[8]。本研究中统计方法的制定参考中央气象局编写的《全国地面气候资料(1961-1990)统计方法》[6]和2004年版《地面气象观测规范》中有关地面气象观测资料的统计方法和不完整记录的处理规定。
表2:实时统计表结构
建立统一标准的历史地面观测数据与统计应用数据存储规范,将原来分散各数据库存储、表结构类型不统一的历史地面数据整合迁移上云,满足其他业务系统和用户对数据的各类应用需求。
针对结构化的历史地面数据,设计云存储策略和云关系型数据库存储方法及DRDS 分库分表技术,由每个分库负责数据读写操作,有效分散整体访问压力,从而提高数据存储和服务效率。
时制是气象观测项目所采用的记录时间,常用的时制有:真太阳时、地方平均太阳时、北京时。不同的气象要素采用了不同的时制,因而也有不同的日界。为了观测方便和应用需要,一般以北京时20 时为日界,对于降水,也用北京时08 时为日界。
数据的统计精度遵守《地面气象观测规范》规定,存储各要素值不含小数点,统计值尾数均四舍五入,具体规定如表1 所示。
为满足气象决策服务、气象预警信息、农业气象、气候评价等业务领域对灾害性天气,如台风、暴雨、干旱、寒潮等对区域站气象资料的应用统计需求,以实时统计表为例,表结构如表2 所示,日、旬、月、年表结构类似。
本文基于四层设计架构介绍了气象地面资料历史查询服务系统的模块设计和实现方法,并提出了区域站关键统计实现算法。实际业务应用后发现,该系统能够为气象业务和科研人员提供便捷的数据统计和查询服务,提高了气象地面数据的支撑服务能力。在下一步的工作中,要继续加强统计场景、算法的积累,研发多源数据快速质控加工算法,针对各类业务服务工作需求,增加新的查询算法和数据种类。