张佳星
衛星虽被形象地称为“天眼”,事实上卫星数据的应用,却难以做到“尽收尽用”。
近日,清华大学理学院院长、地球系统科学系主任宫鹏介绍,在高性能云计算的支持下,通过数据建模、人工智能算法等手段,清华大学地球系统科学系制作完成了首套中国30米逐日无缝遥感观测数据集,以及逐季节土地覆盖和逐年土地利用的数据集,让“拼图无解”的卫星“废片”能够成为高分辨率的地图资源。
“传统的对地卫星观测,拍下来的照片是不同时间采集的,拼在一起并不完整,使用门槛很高。”宫鹏解释,卫星直接获得的图片不能拿来直接用,因为卫星图片不是自然连续的,很可能像100块的拼图,有时候是少50块的效果,也有可能同样的拼图来了好几块。
不止如此,卫星轨道的偏差还会造成同一地方不同时间拍摄的图片难以重叠,云彩的遮挡、雾气不均匀的散射都会导致大量的卫星遥感数据难以反映地表的真实情况,而成为难用的“废片”。基于此前完成10米分辨率全球地表覆盖制图数据处理过程中积累的经验,清华大学地球系统科学系团队自主研发了时空数据融合重建的技术。
“我们构建了人工智能需要的知识库,其中包括世界首套全球全季节普适样本库和相关领域知识。库中分为训练样本库和完全独立的验证样本库。”清华大学博士生刘涵介绍,团队设计了一套适应遥感大数据的深度遥感特征学习和分类模型,利用机器学习和数据建模对人工智能系统进行了训练,使其能够“理解”或者说“推断”出缺失的图块,进而补缺。
“就好像现在一些APP身份验证时,会有一个补图的步骤,经过训练的模型,也可以大规模分析现有的卫星图片,自动补图,且做到数据与真实情况相符合。”刘涵说。
通过训练,模型可完成高性能的推理,把不完整的“拼图”重建成时空一致的图像库,建立起这一深度遥感制图模型的“超能力”,完成各种不合格“废片”的补片工作,从而生成与真实情况相匹配的遥感观测数据集。例如通过人工智能技术可识别路面是沥青、土路还是水泥路面等地表覆盖类型。