(南京信息工程大学滨江学院马克思主义学院,江苏无锡 214105)
当今时代被称为大数据时代或智能化时代,而智能化水平取决于数据的开放、共享和利用。可以说,大数据已经成为一种重要的战略资源和新基础设施的重要元素,与工业化时代的资源及基础设施一样重要。数据资源是全社会的公共资源,政府及相关部门是数据资源的最大拥有者。在气象领域,气象数据的最大拥有者无疑是气象部门及气象台站。气象科学及天气预报预警、气候预测等各项气象业务都以气象数据为基础展开,可以说,气象工作就是数据工作,气象数据与其他行业的融合能够催生新的行业形态。为了充分实现气象数据的经济价值,在保障国家秘密、商业机密及个人隐私的前提下,气象部门需要加强气象数据基础设施建设,大力推动数据资源的开放共享,以利国计民生。
气象数据是记录地球大气物理状态的资料,主要分为实况数据和模式数据[1]3。气象大数据则是气象数据与新的数据理念、数据特征、数据技术及其应用相结合的产物。气象大数据既具有一般大数据的特征,也具有特有的行业特征。从一般大数据的角度看,气象大数据具有以下四个特征。(1)数据规模巨大。我国气象部门已积累海量数据资源,气象数据持续爆炸式增长,每年新增数据量达到PB 级。据预计,部门内外气象数据到2022 年将达到45 PB,日增量40 TB[2]。(2)数据类型多样化。气象数据来源广、类型多,既有观测数据也有各类产品数据、业务运行数据及互联网数据等;既有结构化数据、半结构化数据,也有非结构化数据。(3)数据流转速度快。随着监测更加精密化和多源数据的广泛汇集,气象数据采集、传输、分析和处理的速度更快,时效更强。(4)价值密度较低。气象数据拥有海量规模,但利用价值不高,需要进行深入挖掘并与经济社会生活相融合,才能产生更多的衍生价值。气象大数据还具有时序性、多尺度性、多维性等行业特征。所谓“时序性”,是指气象数据是通过连续不断观测获得的,蕴含着时间序列[3]9;所谓“多尺度性”,是指不同的气象观测设备的数据采集周期不同,采用的时间尺度也不同;所谓“多维性”,是指气象大数据是多维度观测的结果,涵盖气温、气压、湿度、能见度、风、云等要素,既有平面分布的数据又有垂直分布的数据。
气象数据开放共享不仅仅是气象部门的事情,而且牵涉与气象行业相关的其他政府部门、企业、科研机构,乃至社会公众。在气象数据开放共享方面,气象部门、与气象相关联的其他政府部门、气象服务企业、科研教育机构、气象研究组织和社会公众,都是利益相关者。因此,分析气象数据开放共享问题,利益相关者理论可以作为理论依据。利益相关者理论于20世纪60 年代兴起于美国、英国等国家,最早运用于企业管理领域,其后逐步应用到其他领域。利益相关者理论认为,企业是所有利益相关者的企业,企业不仅仅涉及股东,还涉及管理者、雇员、债权人、顾客、供应商,乃至政府、公众、环境、媒体、社区等。这些相关方与企业之间相互影响,都承担了企业经营的某些风险,因此应当拥有相应权利且其权利应当得到企业的保障[4]。
以往,我国政府电子政务建设相关文件多用“政府信息公开”一词来指称数据开放共享相关事务。信息一般都经过加工、整理与分析,而数据则是指更原始的记录。一般来说,政府信息公开主要针对文本形式的文件或统计报告,而政府数据开放共享则针对原始的、电子化的数据集。政府气象信息公开以规范性文件、财政资金、行政审批事项、灾害性天气预警、建议提案办理情况等信息为重点内容。气象数据开放共享则是气象部门根据相关法律法规的规定,通过一定途径以不同形式向其他政府部门、企事业单位、公众个人等提供气象数据。现阶段,我国政府正推动由政府信息公开向数据开放共享的转变,并进一步引导数据增值利用。政府数据开放共享还可以细分为政府数据共享与政府数据开放。简单来说,政府数据共享是指行政机关因履行职责而使用其他行政机关的政府数据,或者为其他行政机关提供政府数据的行为。而政府数据开放则指行政机关面向公民、法人和其他组织提供政府数据的行为。因此,“数据共享”是在政府部门内部进行的,而“数据开放”则是政府面向社会的行为。一般来说,这两个概念可以合并使用,不需要做刻意区分。
1.我国气象数据开放共享拥有法律法规和制度保障
无论中央还是地方,都针对包括气象数据及其管理平台在内的政府数据开放共享出台了相关法律法规及政策,如《中华人民共和国气象法》《气象资料共享管理办法》《促进大数据发展行动纲要》《关于全面推进政务公开工作的意见》《政务信息资源共享管理暂行办法》《气象信息服务管理办法》《气象大数据行动计划(2017—2020 年)》《风云气象卫星数据管理办法(试行)》《气象大数据云平台业务管理规定(试行)》等。此外,国家和地方还成立了气象信息中心等组织管理机构,为落实相关法律法规和政策提供了保障。
2.我国气象数据开放共享拥有界面友好的数据开放平台
气象数据是政府数据开放共享的第一个数据类别,在所有类别数据中开放共享程度较高,具有规模与质量的优势。
目前,国家层面的数据平台主要有三个。(1)中国气象数据网。中国气象数据网是中国气象局面向社会开放共享基本气象数据和相关产品的门户网站,向全社会和气象信息服务企业提供气象数据及相关产品服务。《中国气象局2018 年度政府信息公开年度报告》显示,2018 年中国气象数据网共享数据量超过500 TB,累计用户数突破24 万,累计访问量超过2.8 亿人次,支持各类项目4600 多项,惠及3600余家科研教育机构,以及政府、行业、国防部门[5]。(2)风云卫星遥感数据网。风云卫星遥感数据网是中国气象局向社会和公众提供卫星遥感数据服务的门户网站,2019 年数据服务总量为5.4 PB。据《2019 年度风云卫星服务年报》介绍,我国已经成功发射17 颗风云卫星,其中有7 颗提供在轨业务服务[6]。风云卫星数据已实现与全球100 多个国家和地区的共享,在台风、暴雨、沙尘暴、森林草原火灾等自然灾害监测中发挥了重要作用。(3)中国天气网。中国天气网是中国气象局面向社会公众提供公益服务的气象服务门户网站,由中国气象局公共气象服务中心主办。中国天气网下设31 个省级站和澳门特区站,以及台风网、英文网两个子网站。中国天气网开设了预报、预警、临近预报、专业产品、资讯、气候变化、科普、生活、交通、环境等20 余个频道共200 多个栏目,并与人民网、新华网、百度、淘宝、腾讯、网易、凤凰等30 多家网站深度合作共建天气频道,向公众提供更加精准及时的天气预报、实况信息和天气新闻。
在地方层面,各省(直辖市、自治区)及所辖地级市一般将气象数据整合在政府开放数据平台中。上海是数据开放共享程度较高的城市,早在2012 年就设立了全国首个政府数据服务网站——上海市政府数据服务网,上海气象局准备建立专门的气象数据开放网[7]。2015 年8 月17 日,深圳气象数据网上线,致力于打造“深圳气象云”服务平台,与国家超级计算深圳中心共同挖掘深圳海量气象数据的深层价值。《2020 年中国地方政府数据开放共享报告》显示,截至2020 年4 月底,我国有130 个省级、副省级和地级政府上线了数据开放平台,其中省级平台17 个,副省级和地级平台113 个[8]。在专门的气象数据网方面,深圳作为首个气象数据开放共享试点城市,走在全国前列[9]。气象数据开放共享平台为用户提供各种引导及可视化便捷服务,用户可根据不同需求,锁定并下载需要的数据。此外,气象数据开放平台还设置了互动交流版块,可以推送相关讯息,并对用户的留言反馈及时予以回应。
3.气象大数据云平台的建设获得了快速发展
国家及省级层面气象大数据云平台“天擎”脱胎自全国综合气象信息共享平台(CIMISS),重点针对气象领域内各业务单位、业务系统之间的“信息孤岛”和“应用烟囱”等问题,实现数据集约和业务集约。此外,陕西建立了中国气象大数据异地备份中心。其他省份大数据应用中心也在建设中。云南省作为《气象大数据行动计划(2017—2020 年)》首批试点建设省,在2020 年8 月完成了气象大数据云平台建设的前期工作。重庆在2018 年7 月发布《重庆气象信息化工作实施方案(2018—2020 年)》,提出到2020 年建设成市、区(县)一体化气象大数据云平台。
4.数据开放共享应用及市场化步伐日益加快
以开放共享为基础的气象数据应用系统,在防灾减灾、智慧城市打造和生态文明建设及应对极端天气等方面发挥了重要作用。气象数据开放共享可以应用于社会与民生的各个行业领域,比如气象数据与农业、交通、物流、医学等行业相结合,可以为发展智慧农业、智慧交通、智慧城市提供助力,能有效促进产业发展、激发市场活力,为社会提供优质气象服务。我国气象数据开放与利用也融入了全球气象大舞台,在全球范围内实现了气象信息共享,为共同应对气象灾害、提升气候治理水平做出了应有的贡献。
天气APP 应用开发与推广方面取得的成效更加突出。当前市场主流第三方天气类移动应用的代表有新浪天气通、中国天气通、最美天气、墨迹天气等。其中,中国天气通是中国气象局官方气象服务手机客户端,与中国天气网、中国气象频道并列为中国气象局三大气象服务品牌。墨迹天气在所有天气类APP应用中表现突出,属于该类APP 排行榜第一方阵,持续占据天气类软件第一的位置。墨迹天气与美国气象局、欧洲气象局和中国气象局及其下属的专业气象机构开展合作,每天可以获得500 G 量级的气象数据,为近5 亿的用户提供服务。墨迹天气开设的时景社区每天约有数十万张天气照片上传,实时海量气象数据图片资源可以达亿级[10]。
目前,我国气象数据开放共享距各行业及社会公众的需求仍存在较大差距。
首先,数据沉睡现象仍然突出。各级气象部门的数据没有得到有效规划与开发利用,数据观测渠道如气象数据社会化观测还有待拓展。此外,数据开放共享的数量、质量仍需进一步提升。
其次,气象数据服务精准供给水平不高。气象数据服务与用户的互动不活跃,气象“神经系统”不敏感。用户需要可以直接使用的数据产品,如常规气象资料、气象探测数据、气象灾害数据、大气成分数据等,但目前海量气象数据服务以传统数据下载为主,缺乏数据分析加工平台,给数据需求方带来存储与处理困难,限制了数据应用的广度和深度。此外,政府及相关部门无法提供互动式、跟进式数据服务,限制了数据价值的发挥;缺乏气象数据下载流通后的授权、溯源和认证体系,妨害了数据应用的权威性和真实性[11]。
再次,公众获取数据的渠道、方式和数量受限。大数据下载权限只赋予实名制用户,专业化定制数据下载步骤略显繁琐且单日下载量受限。有些数据格式不是可机读格式,在开放共享授权方面受到一定的限制。笔者调研发现,部分科研工作者宁可利用国外相关数据网站获得免费气象数据,也不愿登陆国内网站获取相关资料,主要原因是这些网站需要繁琐的注册审核程序,有时通过注册审核后仍然无法免费获取需要的数据。
最后,气象数据领域存在“信息孤岛”“应用烟囱”现象。气象数据挖掘不深,市场化程度较低,与其他行业融合度不高,信息服务产业规模有待进一步发展。我国《气象信息化发展规划(2018—2022 年)》指出,2015 年,欧洲、美国、日本的气象数据挖掘应用的产值已分别达2600 亿美元、1600 亿美元、100 亿美元,而我国气象数据应用产值不足15 亿美元[11]。美国、日本等国的气象数据公司在专业数据市场发挥了巨大作用,是交通、能源、金融、物流、零售等行业重要的合作伙伴。在新的经济形势下,我国众多行业领域需要专业的气象数据服务,气象数据市场化应用空间十分广阔。
气象部门要强化主体责任,树立安全意识和开放共享理念,加快气象数据开放共享进程。气象数据开放共享涉及数据安全和数据主权,以及数据规范使用、知识产权等问题,必须接受健全的数据安全制度的制约。相关部门要不断加强法律法规和制度建设,对气象数据的收集、存储、管理、开放、开发、应用等环节进行规范,保障气象数据的安全流通和规范应用;要不断丰富气象数据来源类型,拓宽气象数据采集渠道,完善互联网气象数据获取制度,为社会各行业与民众获取气象数据提供方便。
理想化的气象数据开放共享,应该以迅速获取、可机读、便捷读取为追求。各级气象数据观测与收集节点要与定义的元数据标准格式进行对比,并进行准确校正和正确转换,切实保障数据开放的完整性、高质量[12]4。气象数据服务网站可以降低数据获取门槛,在保障数据安全的前提下简化会员注册程序,在不影响国家利益的前提下减少限制措施,所用的气象数据应用软件要做到界面友好,对数据下载和使用有详细说明,并根据公众的需求加大互动式数据供给。研究机构要加强气象数据关键技术的研发,综合运用数据关联分析、机器学习等技术,推进气象数据的跨行业、跨领域价值挖掘,实现由数据服务到知识服务的转变[13]52。
气象数据开放共享是以政府部门为主导,社会、企业和公众多方参与的系统工程,因此需要建立多元主体协同机制,明确合作方式和各方权责,并对数据开放共享的绩效进行评估,以高质量气象数据服务社会民生和经济发展。政府要关注市场需求,可以通过购买服务或业务外包等方式引导企业和相关机构参与数据开发与利用,弥补政府人力、财力、物力及服务能力的不足。气象部门可以免费提供气象数据和相关模型,发动社会力量挖掘气象数据价值;可以向大数据开源社区、大数据联盟、数据应用协会等民间组织提供政策扶持和资金补助,推进气象数据技术的传播和应用;可以与相关行业合作,加大行业融合力度,实现共赢互利。民间气象组织要积极参与气象数据价值的挖掘和利用,为公众提供公益性服务产品。相关行业和企业要充分利用市场竞争机制,拓展气象数据应用范围,保障气象数据使用安全。
公众要积极争取气象数据使用权利,根据国家数据开放共享的相关规定,呼吁气象部门制定合理、合法、合规的气象数据开放使用与共享的制度及协议,明确气象数据使用权,保障使用者顺利获取、利用、分享气象数据。公众可以通过网站对话模块、留言版面、微博、微信和移动客户端等平台或渠道,与气象部门开展互动交流,提出自身数据需求,行使知情权、参与权,并以社会监督的方式督促气象部门及相关服务机构完善应用产品。