基于Tableau的铁路轨道检测数据分析

2023-03-06 02:56曾祥富
科技创新与应用 2023年5期
关键词:工务可视化轨道

曾祥富

(武汉铁路职业技术学院,武汉 430205)

工务轨道检测数据包括动态检测数据和静态检测数据。检测数据管理包括数据采集、预处理、入库集成和智能化展示[1]。目前,国内铁路检测数据分析主要依托工务安全生产管理信息平台,形成相对固化的数据采集处理分析模式[2]。

1 传统分析模式分析

而随着数字化发展,轨检数据分析已不满足于简单的数据统计和报表生成,更需要拥有丰富的可视化、自动分析甚至智能洞察功能。而数据分析人员也面临着大量的本地数据需要处理、多种维度不同层次参与分析及不断变化的业务需求等问题。传统定制模式下的轨道检测数据分析面对这些问题时存在着明显不足。

1.1 部署开发周期过长

目前国铁集团范围内使用的工务安全生产管理系统功能齐全,体系庞大,但需求更改、功能完善流程繁琐、周期漫长。通常工务部门提出分析需求,软件开发人员需要首先理解业务,再根据需求进行建模制表,如果系统过于庞大、使用人数太多,开发者需要权衡需求变更对其他用户的影响及对整个系统其他功能的影响。因而其不能适应快速变化的业务需求,特别是自定义式数据分析要求。

1.2 需增强问题研究和层次分析

传统的数据分析,基本上是被动满足分析需求,或受限于工具。主要表现为,一是对问题的解析不够,思考不够,很难超越单一图形,未深入对数据进行钻取。二是缺少结构化思维、层次思维,以致于分析不成体系。比如轨检数据分析得出线路质量稳中有升,而添乘晃车数据显示质量下滑,两者结果不能有效印证。比如在分析各线路区段轨道不平顺质量指数(Track Quality Index,TQI)对比的同时,未引入不同大机捣固车队作业的比例信息。

1.3 数据洞察验证不足

一是规律洞察不够。传统的三图一表仍是主要的分析方式。所谓三图一表,即条形图、折线图、饼图和交叉表。而大数据分析通常强调大数据样本的宏观特征、分布规律和相互关系,对应的直方图、盒须图和散点图等高级图形应用较少。二是数据交互不足。阅读者经常只能被动地接受分析结果,而不同的决策层所关注的重点又有所不同,对比的层次也不尽相同,这时候就需要一些假设性检验,所以也需要更多的交互。

1.4 展示违背可视化原理

工务系统数据分析工作者大多都不太注重可视化原理运用,对图表选择、可视化展示较为随意,分析报告不能符合表达分析逻辑。比如在条形图和柱状图选择上不区分变量类型,在表示时间趋势的折线图和表示占比关系的饼图中分析对象过多。

Tableau作为一款数据可视化分析工具,独创VizOL技术,具有SQL查询的综合性功能,操作简单,易于上手,能够满足业务人员常规数据分析需求,同时通过可视化增强分析手段,能够快速形成辅助决策的图形依据[3]。为弥补传统数据分析方案的不足,适应自定义数据分析需求,笔者提出基于Tableau的工务检测数据自定义式可视化管理解决方案。

2 基于Tableau Prep的数据治理

2.1 本地数据规范管理

在轨道检测数据分析中存在大量本地Excel表,需要对这些数据进行规范管理、规范记录。

2.1.1 理清明细表与汇总表的关系

汇总表中通常存在多行表头,要大量合并单元格,这在进行数据分析时需要对单元格进行拆分才能进一步地筛选或者作数据透视处理。而数据分析时需要的是1张二维明细表,其应符合以下原则:①每一行应是1条单独的记录。每一条记录根据其特性不应重复。②每一条单独记录应是完整的不可拆分的单元,一个完整的业务流程。③每一列代表1个单独属性,尽量避免大宽表。④尽量保证数据记录完整,杜绝合并单元格,删除多重表头。标题不能为空、不能重复,尽量不要用数字作为标题。⑤数据字段应包含关键字段,即数据库各表中的主键字段,比如记录设备状态信息,那么不同表数据的关联可以选择设备编号作为主键。⑥明细表中应避免计算引用过多,导致表格打开过慢。明细表中不使用数据有效性、条件格式和数组公式等。

2.1.2 规范数据管理记录格式

1)规范本地数据文件命名。统一按照结构门类制定命名规则。

2)规范日期文本记录方式。日期应统一采用“XXXX年XX月XX日、XXXX/XX/XX、XXXX-XX-XX”,文本内容中间尽量不留空,字段意思不重复。

2.2 基于Tableau Prep的数据处理

采用Tableau Prep对数据进行字段清理和结构调整。其中字段清理包括对里程信息进行校正、不同数据类型格式调整和无效字段剔除等。结构调整包括对不同数据表进行并集、连接操作,按照不同层次进行预先聚合等。Tableau Prep对轨检车检测原始数据进行预处理如图1所示。

图1 利用Tableau Prep对轨道检测数据进行预处理(截图)

3 基于Tableau Destktop的可视化分析

工务检测数据分析应当是基于可视化的自定义分析。可按以下路径来实现。

3.1 基于业务合理构建图形

轨道检测数据可视化分析应遵从基本的可视化原理。一是依据视觉前意识属性选择数据表达的方式。所谓视觉前意识,即人类感受视觉信号的强弱,通常的敏感程度为:位置大于长度或颜色大于角度大于形状改变大于颜色的递减。二是服从基于可视化原理总结出的图形选择的一般规律。比如在研究某一区段TQI随时间变化趋势时,可以选择柱状图和折线图,但这两者之间是有区别的。如果观测的时间是离散型变量,比如1月、3月、5月和7月这样的时间序列,且表达的数量不超过12个时,可以选择柱状图。但是如果观测的时间是连续性变量,比如1月15日、2月21日和3月24日,观测的时间点甚至多于12个时,则优先选择折线图。轨道检测数据分析图形选择建议见表1。

表1 不同数据关系对应的图表选择

3.2 运用结构化思维洞察数据规律

工务轨检数据结构化分析思维主要是针对轨检车检测的几何参数(轨距、水平、三角坑、高低和方向)、舒适度指标(横向加速度、垂向加速度)及辅助评价参数(TQI、T值报表)等进行分析[4]。从统计学角度来说,主要是运用了应用统计学中描述性统计学和推断统计学内容进行分析,并将其归类于峰值指标、均值指标和轨道功率谱分析。这是根据数据本身特点,运用统计学基础知识对轨道检测数据的利用基本分析,对轨检车检测数据结构本身进行多维度拆解分析。

但对生产组织管理者来说,还需要引入生产元素层次,真正实现利用轨检数据指导生产[5],将轨检数据分析纳入“检查—分析—计划—作业—验收”这个闭环管理的大的结构层次,见表2。

表2 不同生产环节轨检分析内容

结构化分析应超越单一图形本身,从多个角度分析业务,分析不同问题之间的结构相关性。可以通过标记、参考线、分布区间和仪表板互动来实现,高级的结构化分析则是在一个视图中引入多个层级的聚合。

3.2.1 利用颜色增加结构分析层次

如需要比较各条线TQI在不同年份的差异。可以通过颜色增加分析层次。如图2所示。

图2 通过增加差异列及颜色方式增加分析层次

3.2.2 利用形状增加分析层次

在Tableau中利用标记的形状可视化增强方式来增加分析层次。如图3所示。

图3 不同轨道单元TQI通过长方形大小区分

3.2.3 利用参考线、参考区间和分布区间等增加对比分析层次

在轨检目标达成分析中可引入参考线等增加分析层次。

3.3 通过高级交互探索信息呈现

高级交互主要是在进行数据分析时,通过样本控制、假设验证等手段洞察轨道检测数据的异常及规律。比较常见的是数据钻取与追踪分析。

3.3.1 数据钻取

现有不同类型线路TQI值数据,将2021年TQI值与TQI目标值进行对比。由图4可见,会认为繁忙干线、干线及支线TQI均超标了。但再引入TQI差值汇总对比维度,就会发现在支线里还有2021年TQI小于目标值的线路。

图4 引入不同层次发现明细差异

3.3.2 追踪分析

在分析某些区段时,需要动态观察这些区段的变化情况,特别是追踪分析一些大值区段。由图5可知,追踪TQI最后5名设备单元,可以看到武穴蔡山160区段设备在2013年8月以后设备质量明显改善,可深度分析是否对该设备单元进行综合整治。

图5 追踪不同设备单元变化趋势

4 结束语

总结规律、发现异常和预测趋势是数据分析的主要目的,交互验证分析是以Tableau为代表的敏捷BI与传统分析的最大区别。工务轨道检测数据分析应从业务出发,基于实际问题的解决,运用数理统计知识、结构化思维方式对数据进行深度有效挖掘,以适应工务轨检数据辅助决策的要求。

猜你喜欢
工务可视化轨道
基于CiteSpace的足三里穴研究可视化分析
思维可视化
关于地铁工务施工及质量管理的探讨
浅谈铁路工务防洪工作
基于单纯形法的TLE轨道确定
基于CGAL和OpenGL的海底地形三维可视化
CryoSat提升轨道高度与ICESat-2同步运行
朝美重回“相互羞辱轨道”?
“融评”:党媒评论的可视化创新
LKJ电务类、工务类数据结合部问题分析