董国平
摘 要:气象科学数据是国家基础信息资源的重要组成部分,不仅在国家宏观决策、国民经济发展、国家安全保障中发挥着不可替代的作用,而且还是支撑大气、海洋、农业、生态等诸多领域科技创新的基础数据资源。充分重视和共享气象科学数据,不仅可以减少国家的重复投资,推动科学研究的进步,而且还将为业务部门提高预测与预报的准确性提供科学的方法和依据。
关键词:数据集;元数据;共享
1 气象科学数据的重要概念
气象科学数据是指使用各种观(探、遥)测手段直接获取的大气状态和现象及其变化过程的记录,以及由这些记录加工所获得的各种统计值。它是大气科学中不可缺少的重要的数据资源,由气象科学数据加工、分析而产生了气象信息,如各种天气、气候分析、预报产品,气象服务产品等。
气象科学数据集是气象资料按照一定规则组织起来的一系列数据文件和描述数据相关信息文件的集合体。数据集由数据集实体、元数据和数据集说明文档三部分组成。气象数据集实体是由一系列数据文件组成,是数据或图形的集合,也是数据集的主体。元数据是关于数据与信息资源的数据,即关于数据与数据集的内容、质量、状况和其他特性的信息。元数据为我们实现数据的实时在线、可扩展的共享管理提供了一种强有力的手段。
2 实施发布策略
依据气象科学数据的加工形态,省级气象科学数据分为原始数据、基础数据、加工统计数据三种类型:
原始数据:指通过观测、探测、遥感、试验、实验、调查、考察等技术手段直接获取并且未作任何处理的原始记录;
基礎数据:在原始数据基础上进行质量控制和初步加工处理形成可以直接应用的数据;
加工统计数据:对基础数据进行进一步加工处理和统计的数据。
依据气象科学数据的公开和保密特性,省级气象科学数据分为公开数据、国家内部数据、部门内部数据、保密数据四种类型:
公开数据:指可以向国内外提供、进行国际交换的气象数据;
国家内部数据:指可以在国内进行发布和交换的气象数据;
部门内部数据:指可以在气象部门内部进行发布和交换的气象数据;
保密数据:指涉及国家一般秘密、重要秘密或国家核心机密的气象数据(参照国家保密规定)。
从气象科学数据发布策略的角度,综合气象科学数据的特点、社会需求、安全保障、数据管理状况等因素,对气象科学数据的共享范围进行等级划分,共分为四级。
零级数据:是指基本气象资料中的当前数据。
一级数据:是指基本气象资料中的历史数据。
二级数据:国家内部数据。
三级数据:限制性协议使用的气象数据。
依据用户对气象科学数据使用的不同需要,气象科学数据服务针对的用户有:普通用户、会员用户、核心用户、内部用户、特别用户。
2.1 普通用户
国内外公众通过上网,需要进行注册,均可以成为气象资料共享服务的普通用户。普通用户可在气象资料共享网站上无偿下载、浏览、查询网上发布的气象资料共享零级数据以及国内外数据资源动态,数据集产品介绍等相关信息。可获得零级科学数据;
2.2 会员用户
国内公众通过网络在线方式申请,均可成为气象资料共享服务的会员用户。会员用户在网上与数据发布单位签定数据使用协议,为数据的终端用户。会员用户可以在气象资料共享网站下载、浏览和查询气象资料共享零级、一级数据。以其他离线方式(光盘拷贝、复印等)获得气象资料共享零级、一级数据。
2.3 核心用户
国内从事非盈利性气象工作的个人、国内从事省部级以上非盈利性科研项目的研究人员等均可申请成为气象资料共享服务核心用户。核心用户以离线方式与数据发布单位签定数据使用协议,为数据的终端用户。核心用户可以在气象资料共享网站下载、浏览和查询气象资料共享零级、一级、二级数据。以其他离线方式(光盘拷贝、复印等)获得气象资料共享零级、一级、二级数据。
2.4 内部用户
政府部门和气象部门内部工作人员,因工作需要都可以申请成为气象科学数据共享服务气象部门内部用户,可以获得零级、一级、二级、三级气象科学数据。
2.5 特别用户
公务用户,以及参与气象资料共享建设而与负责气象资料共享发布工作的单位达成特定资料交换或共享服务协议的机构和组织,或其他有特殊需求的个人或机构,可以通过签订特别协议而成为气象科学数据的特别用户。公务用户,按用户需求和指定的方式在线或离线获得气象资料各级数据。公务用户之外的用户按协议提供气象资料各级数据。
其中:
无条件共享指用户使用数据不受任何条件限制,可以转让。
有条件共享指用户只能作为终端用户使用数据,除另有协议规定的以外,不能以任何方式转让给第三方、或发布该数据。
协议共享指数据发布者与用户通过签订特别的数据提供使用协议,来明确双方的权利和义务。
如需保密数据须经有关上级主管部门批准。
3 后续工作
目前完成各类数据集16个,网站访问量近22万人次。气象数据的用户来自全国各地,分布在不同行业、从事不同的工作,许多用户索取气象资料的用途是未曾预料到的,不仅有自然科学领域的用户,还有社会科学领域的用户,这充分说明了气象资料应用的广泛性及其在科学研究和国民经济建设中的基础性地位。
首先,当用户获取到基本的气象资料后,又对气象资料的质量提出了越来越高的需求,主要表现在:一是对气象资料在时间上要求长序列,在空间上要求高分辨率;二是需求几乎涉及到气象资料的各种类型,除了常规的地面、高空气象观测资料外,气象灾害资料、卫星和雷达气象探测资料、大气成分资料也是用户经常提出要求的资料;三是在共享方式上,希望以网络在线检索和下载资料为主,以节省获取资料的时间。
其次,共享数据的加工水平和质量是影响数据共享质量的重要因素。气象科学数据共享不仅要提供广泛、详细的气象资料,更重要的是要对资料进行一定的深加工,制作各类用户可以直接使用的数据集产品,同时要确保所提供资料的质量,即资料的完整性和正确性。
总之,气象数据的加工和质量控制是具有相当难度的科学问题,数据的综合集成、数据挖掘、数据的质量控制、历史气象序列的均一性检验订正等均是数据分析处理方面的前沿科学问题。
参考文献:
[1]赖志斌,程承旗.元数据和数据集一体化管理模型及应用研究[J].测绘通报,2001(05).
[2]刘爱容.气象信息共享平台的开发技巧[J].气象与环境科学,2007(S1).
[3]赵文涛,郭晓利.元数据技术研究[J].舰船科学技术,2011(S1).