赵晓莉,苑 跃,黄晓龙,刘相全
(1.四川省气象灾害防御技术中心,四川 成都 610072;2.四川省气象探测数据中心,四川 成都 610072;3.重庆众仁科技有限公司,重庆 408000)
自20世纪60年代初,全国逐步开展风向风速自动观测,主要使用EL型电接风向风速计和达因式风向风速观测仪器,并以自记纸的形式保存了近40 a的风向风速历史资料[1]。风自记纸是宝贵的客观表征风向风速日变化的唯一实测的基础资料,进行数字化处理后,这些资料对于研究我国风向风速特征研究具有重要意义[2];将为开发利用风能资源、预防风灾以及城市建设、环境保护等提供权威的基础气象科学数据[3-9]。
全国已完成EL电接风向风速自记纸的图像扫描工作,数字化自记纸图像中数据的自动识别将成为亟待解决的问题。本文根据《地面气象观测规范》(2003版)[10]中对EL型电接风自记纸整理规范要求,研究EL型电接风自记纸风向数字化识别方法,并对该方法开发的风向提取软件的风向识别效果进行检验。
EL型电接风向风速计是一种由风速风向传感器、指示器和记录器3部分组成的风向风速有线遥测仪器。记录器由8个风向电磁铁、1个风速电磁铁、自记钟、自记笔、笔挡、充放电线路等部分组成[11-14]。每两个磁铁为一组控制一支记录笔,当控制风向记录时刻的继电器吸合时,与风向标所在方位的方位块相对应的电磁铁吸动,控制相应的记录笔记下风向标所在方位。
EL型电接风向风速自记纸上的数据是记录器记录所得,分为两个部分:上部为风向,由4根平行线分割成8份,按照从上到下的顺序分别表示S、N、NE、SW、E、W、SE、NW 8个风向,剩余8个风向(NNE、ENE、ESE、SSE、SSW、WSW、WNW、NNW)则通过记录器在同一时间两个记录笔同时画下的风向线组合得到;下部为风速,按空气行程200 m电接1次,风速自记笔相应跳动1次来记录,正点前10 min内的风速根据迹线通过自记纸上平分格线的格数(1格相当于1.0 m/s)计算[15-22]。
根据《地面气象观测规范》(2003版)对EL型电接风向风速计自记整理的要求,自记纸从各正点前10 min内的5次风向记录中挑取出现次数最多的。如最多风向有两个出现次数相同,应舍去最左面的1次划线,而在其余4次划线中来挑取;若仍有两个风向相同,再舍去左面的1次划线,按右面的3次划线来挑取。如5次划线均为不同方向,则以最右面的1次划线的方向作为该时记录。
风自记纸经扫描后形成的自记纸数字图像会有轻微的倾斜或变形,需要通过图像预处理纠正这些错误,以保证数据的精度。通过局部投影取极值,找长直线,即对应边界线的准确位置;再根据找出长直线的倾斜角,获取图像的倾斜角,并对图像进行倾斜校正。
根据业务要求,观测员每天需对风自记纸进行整理,并将人工从自记纸上读取的数据记录在风自记纸上,这样势必造成人工字迹影响风向、风速迹线的情况。因此,需要删除干扰迹线的人工字迹,以保证后续迹线自动识别的准确性,一般通过对红(R)、绿(G)、蓝(B) 3个颜色通道阈值的设置区分人工记录的铅笔字迹与风向、风速自记迹线。
风向风速自记纸扫描要求24位彩色,标准扫描分辨率为200 DPI,为了提高图片质量,扫描分辨率一般大于200 DPI。计算机图像处理中,图像的色彩是通过对红(R)、绿(G)、蓝(B) 3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。自记纸图像中,底色和坐标的红色分量较大,绿色和蓝色分量较小,而风向、风速迹线的红色分量相对较小,绿色和蓝色分量较大;综合效果看,曲线与底色、坐标色的灰度差异不如单纯的红色差异显著。因此,区分底色与风向、风速迹线采用红色分量作为阈值条件。一般情况下,以小于等于200判定为风向、风速迹线,大于200判定为底色和坐标背景信息,以此来区分自记纸底图坐标与迹线,最终提取风向迹线,如图1所示。
根据风向线自记纸的特征将风向线数据提取分成4个子图单独处理,每个子图处理包含2个步骤:①根据风向线与底图分离后风向线点集自动获取风向线所在位置;②人机交互。
根据记录器每2.5 min记录一次瞬时风向的规则,设有风向为1,无风向为0。将风向轴线上下1/3轴线距矩形区域(如图2所示)是否有竖直投影作为风向的判别依据。若同一时次风向轴线上部、下部均有投影,则根据投影值的大小进行判别,投影值大认为有风向记为1,对应时次投影值相对小的则记为0;若同一时次风向轴线上部、下部均无投影,则对应时次均记0。以图2风向线子图中14时30分风向迹线为例,以风向轴为分界线,分别计算该时刻风向轴上部和下部风向迹线的像素点之和,而后求差值,结果小于0,说明下部投影值大于上部,故下部风向应记1,上部风向记0。
将4个风向线子图同一时刻风向判别结果(即8×1的数组),作为该时刻瞬时风向记录。以某站17时正点前10 min风向自记为例(如图3所示),绿色框内的8×1的数组为17时正点的瞬时风向数组,利用风向组合规则(如表1所示),判断该时刻瞬时风向为ENE。按照上述方法判断17时正点前10 min内的5次瞬时风向均为ENE,故17时10 min风向为ENE。
图1 风向迹线提取前后对比图Fig.1 Contrast map before and after wind direction trace extraction(a, Part of wind self-recording paper, b, Recognition of the wind direction trace)
图2 风向线子图处理区域示意图Fig.2 Subgraph of wind direction line processing area diagram
图3 瞬时风向判别示意图Fig.3 Diagram of instantaneous wind direction discrimination
表1 瞬时风向识别对照表Tab.1 look-up tab of Instantaneous wind direction recognition
人机交互是通过人工手动操作的方式修正自动跟踪错误的风向线的过程,包括对风向线进行增加、删除及修改。通过鼠标点击风向记录线的方式进行个别风向线增加和删除。人工修改大面积风向线通过绘制等距风向线实现:鼠标框选需要修改的风向线大致范围,在鼠标点击附近搜寻第一根和最后一根风向线位置,根据风向线间最大长度以及搜寻的第一根风向线和最后一根风向线之间的长度综合计算风向线平均间距,等间距绘制新的风向线用于替换修改区域内原有风向线。
根据上述EL型电接风自记纸风向数字化识别方法研发了EL型电接风自记纸数字化软件,并随机对11个台站100张EL型风速风向自记纸(如表2所示)共计2 400个风向正点值进行了效果测试。
表2 测试台站及测试EL型风自记纸数量Tab.2 Test station and EL wind self-recording paper quantity
为了验证风向识别方法的可用性,将软件识别的正点10 min风向与全国地面气象资料A6文件中的数据进行对比,其中,A6文件中的正点10 min风向为人工整理EL型风自记纸读取的记录。风向完全一致认为软件提取风向数据正确,不一致则需要人工核查风自记纸,判断是否是由于人工读数错误造成不一致。如表3所示,风向一致率较高,软件提取风向数据正确率达97.2%;人工读取错误导致的不一致占2.7%;软件读数错误仅占0.2%。软件读取风向错误主要与图像中迹线的清晰程度有较大的关系,图像迹线越清晰软件读取正确率越高,且正确率优于人工读取。以绵阳站(56 196)为例,该站自记纸图像较为清晰,风向线整齐有序,测试该站1个月的风自记纸图像,仅有15个风向与A6文件不一致,经核查这15个风向均为人工读数错误。
表3 测试结果与A6文件对比Tab.3 Comparisons between test results and A6 files
本文主要介绍软件风向识别算法,算法以《地面气象观测规范》(2003版)中EL型电接风自记纸整理规范为依据,参考人工读取EL型电接风向风速自记纸方式建立。利用该识别算法开发的EL型电接风自记纸数字化软件,从测试结果可见,基于风向识别算法开发的EL型电接风自记纸数字化软件风向识别正确率达97.2%,表明本文研究的风向识别方法可以应用到EL型电接风自记纸数字化处理中。