杨雪
除了下雨天出门要带伞,天气到底还在多大程度上影响着我们的日常生活?彭博社曾在他们的报道中提到过几个例子:2014年春夏巴西大旱,高温不退,对于全球最大的咖啡连锁店星巴克来说,这意味着巴西这个主要的咖啡豆产区产量骤降,国际咖啡豆价格上涨。2014年6月,星巴克宣布上调旗下几款咖啡的价格。跨国食品公司的采购部门需要掌握全球整体气象情况,努力将风险降至最低。
相关统计表明,流通类商品销售额的65%取决于天气,因为天气直接影响人的生理、心理,支配他们的消费行为。在德国,气温超过22摄氏度,啤酒开始劲销,气温再每上升1摄氏度,大瓶装的啤酒每天会多销230万瓶,德国气象公司由此开发了相关的啤酒指数。此外,还有乘车指数、冰激凌指数、泳装指数、食品霉变指数等,商家可据此提前制订生产营销计划。
弗里德黑姆·施瓦茨在其著作《气候经济学》中指出,天气在全世界五分之四的经济活动中扮演着决定性的角色。
显而易见,气象服务是一个巨大产业。天气经济咨询公司在美国有500家,日本有80家。但很遗憾,这样的产业盛况在中国并没有发生。
长期以来,中国气象部门一直免费提供气象信息服务,气象预報的发布权被气象部门垄断,未经官方许可媒体也不得擅自转播、转载。这种免费的公益服务导致中国的气象服务发展了30年,却仍处于幼稚的起步阶段,没有形成规模,更没有形成产业。
这一现状得以改变是2015年。当年6月,气象局颁布27号令:开放中国气象信息,并于2020年完全放开,鼓励民营资本和气象局合作。官方数据垄断的局面正在改变。
2015年的9月29日,中国气象数据网正式上线对外服务,该站将成为中国气象局对社会开放基本气象数据和产品的共享门户。
当深度学习遇到气象创业
彩云天气是第一个受益于此的民间组织。2014年4月,当气象爱好者、工程师袁行远将自己开发的天气App彩云天气提交在App Store后,很快拿到了苹果商店新品推荐的第一名。2014年的6月份北京一共下了十场雨,彩云天气将每一场雨都精确预测到了。气象从业者大喊“狼来了”,然后意识到,商业气象这件事是可行的。
2014年9月,中国气象局主动找到彩云天气开始合作,后者成为第一个受惠于官方气象数据的民营组织。
传统的天气预报方式,通常是分析雷达卫星收集的图片,然后人工总结规律与经验,从而进行天气预测。小时候我们等着看的《新闻联播》之后的天气预报环节的数据就是这样得出的。“局部天气有阵雨”—没有人说的清楚哪里是局部,阵雨是多大雨。
如何把预报做的更精确—从城市精确到地点,从天精确到分钟,从区域精确到经纬度?传统的解决方案是写规则。假设风往西边吹,那么人为推测出雨也可能往西边移动。很明显,这个规则不仅不符合潮流,而且精确程度十分有限。
袁行远的解决方案是利用计算机和图像识别技术的完成更精确的算法。把雷达探测到的图像交给计算机,让计算机判断判断云的移动和走势,它会计算出云层一定的位置和速度,根据这个结果人就能判断什么时候雨会到达。
这也是深度学习发挥作用之处。计算机能看比人更多的图,这个“多”是成千上万倍。对于降雨而言,把所有天气信息和天气的雷达图分成两类,一类是会导致下雨的图,另一类是不会导致下雨的图。
处理了足够的图片与数据之后,计算机就能计算出,一类天气情况下雨的概率是多少,另一类概率是多少。所谓深度学习,就是计算机不再需要人告诉它第一步、第二步该怎么做,告诉它问题与答案,它就能够自己写程序,实现中间的过程。
技术变革给天气预测带来显著效果,结合图像识别与机器学习之后,预测天气的精确概率相比人工操作提高了20%。
这样做的前提是有足够数据来源。彩云天气目前的主要数据来自中国气象局官方以及日本、美国气象卫星的部分开放数据:天上的卫星,空间的探空气球,高山上的气象雷达,地面上的探测站都是气象数据的来源。除此以外,彩云天气的用户也可以实时在App里反馈数据,更新到其数据系统当中。
从用户角度来看,彩云天气用独有的图像识别算法实现了精确到分钟的天气预测。“彩云天气的打开率在雨天尤为显著,不夸张地说,每一次雨天就是我们的双11。”袁行远说。
更精准的气象数据及其商业价值
天气数据的意义不止在于指导人们出门是否带伞,其更重要的使命是为企业提供决策依据。简单的几个例子可以让我们更加清晰的理解彩云天气所做事情的价值:滴滴出行在降雨期间的动态路线规划、饿了么配送员的配送任务安排,都会参考彩云提供的天气数据。
依靠iOS和 Andriod 两个平台的300多万用户(免费版+付费版),以及为上千家企业提供数据,彩云天气已经实现了收支平衡。他们将免费的API接口开放给大众,只有每日调用数据次数超过一千次才收取一部分费用,而付费者一般是企业用户。目前,彩云天气每天提供给用户和开发者数据调用次数超过了5000万次。
中国气象局官方App和很多省级气象局都在使用彩云的分钟级数据。彩云还每年都为观测司提供气象雷达数据质量分析报告和建议。你能想到的天气类应用几乎都在调用彩云的数据,包括百度旗下的91、奇虎360,手机厂商小米、金立、酷派,O2O企业比如饿了么、滴滴以及传统的物流、交通运输行业企业以及飞常准这类航班预报软件。
提供天气预报是商业气象服务中最基础的。企业们通常希望这些气象服务公司能给他们提供更多服务。以一个船舶运输公司为例,他们往往不仅想知道恶劣天气什么时候结束,而是希望气象公司能够给出具体的应对方案,一趟船开出去的风险是多大?如果有台风如何绕着走?绕着走的路线应该怎样设计?概言之,根据天气预报然后给出相应天气的服务方案有更具潜力的商业前景。
在这方面,美国成熟的气象市场为中国创业者们提供了可供模仿的范例。在美国,活跃着350家左右的商业气象服务公司,整个市场超过60亿美元,并且保持着每年近25%的增长率。气象数据不仅能够被应用于种植业、畜牧业、交通运输业、金融保险以及服装厂家等等都对精确的气象预测有需求。
在中国,目前没有一家气象服务公司的数据处理能力能够超越彩云天气,其主要原因在于彩云天气的团队在图像识别与自然语言处理上的技术能力。创始人袁行远写了超过二十年代码,曾在淘宝做过三年的广告推薦算法工程师,在机器学习领域有丰富经验。在美国,为用户提供天气预报的App Dark Sky已经有800多万用户。两家公司的内核相似,也有人将前者视为中国版的Dark Sky。
气象创业者的机遇与挑战
对于中国的创业者来说,在基础数据来源不会有格外优势的前提下,考验的是公司们对于数据处理的能力以及将数据与行业需求融合的能力。
蓝驰创投的合伙人朱天宇持有这样的观点:中国气象服务市场的主要挑战不在于数据,更关键的是如何把数据应用到场景当中去。
之前气象数据都是国家气象局以及各地的气象站应用在很有限的场景中,要么是天气预报要么是封闭体系内使用。在此前的中国,可应用的场景比较少,这方面的人才也比较少。在国外,航空航运、农业、能源等领域都有几十年的发展。像美国就是二战之后,很多气象兵转做气象服务。气象是先天大数据,是最早应用大型设备的领域。数据处理能力强一定有优势,但是对于中国气象服务创业者来说,更关键的是怎么将数据结合到商业需要的场景中,怎么找到真正为数据付费的价值点,怎么把数据呈现出的商业价值包装成为有人愿意买单的产品或服务—这才是更核心的挑战。
在提供数据服务这件事情上,另一家公司心知天气比彩云更加商业化。心知天气诞生于2006年,它基于海量基础天气数据的汇集以及基础数据分析和可视化平台,为零售、交通、能源提供实时的天气信息和商业BI服务。心知天气正在为中国很多500强企业服务,类似的公司在美国有非常巨大体量的存在。但在中国,它的商业化刚刚兴起。
按照朱天宇作为投资人的标准,彩云天气与心知天气结合的团队才是更具商业优势的,“我更看好什么样的团队?原先在气象体系内为一些行业场景服务的人员,加上对数据、技术比较熟悉的人,这样的团队组合是比较丰满的。”
当然,彩云天气和心知天气只是一个案例,通过这样说明我们能够得知的是:开放的气象数据是未来的趋势,以及在此趋势之下,气象服务在当下的中国是一个不可忽视的创业蓝海。