有效监控容器的好方法

2018-03-16 00:24严立忠

中国信息化周报 2018年7期

严立忠

容器的使用正在迅速增长。Cloud Foundry和ClearPath Strategies在2016年6月进行的一项调查显示，64%的受访者表示计划在明年将容器的使用主流化。随着容器使用量的不断增加，解决监控问题以提高容器的性能、使用和故障排除能力至关重要。然而，有效的监控需要一种由分析驱动的方法，不仅能通知开发人员和运维部门正在发生的情况，还能够帮助这些团队挖掘其容器使用情况和性能数据，从而获得可行的洞察力。

当出现错误时会发生什么？出现问题时，快速了解事件的具体细节至关重要。在容器中运行的应用发生错误是容器问题最常见的来源，但并非唯一来源。容器问题也可能由操作系统、存储、网络、数据库或其它部件等底层基础架构的问题引起。因此，容器监控解决方案必须具有可见性和分析能力，帮助用户确认问题的根源。如果不能快速准确地做到这一点，可能会引发更长的停机时间，从而给组织造成重大成本和风险。

容器具有獨特的特征，将对组织应选择的监控解决方案产生影响。比如，容器是短暂的，可以在几秒钟内启动和停止这一事实。这需要一个监控解决方案，可以利用日志记录和度量值界面，并在该容器不再运行后保留相关信息。此外，容器监控解决方案不仅要具备分析容器的能力，而且还要能够提供对应用堆栈其他组件可用性、性能和使用情况的洞察力。

对于有效和高效的容器监控来说，最重要的要求也许就是拥有一个源于容器的解决方案。日志记录驱动程序是有关容器的关键信息来源，可以通过简单配置容器定义或运行方式来实现。使用嵌入式解决方案可以获得更好的性能，因为监控工具不会与其他程序争夺资源。

有效解决方案的最后一个组成部分是基于分析的方法，可以更轻松地对监控解决方案所显示的信息进行评估并采取行动。仪表板通常会成为修复容器中出现问题的起始点。此外，仪表板还必须支持深入了解日志和指标的能力，以获取有效修复所需的详细信息。

Splunk Enterprise或Splunk Cloud可以为容器监控提供起点。通过为Docker使用Splunk Logging Driver，机器数据可以轻松地从容器传送到Splunk软件。使用该驱动程序，可以从容器中检索Docker容器信息并对日志进行无缝监控。这个任务很简单，因为Splunk的Docker驱动程序被内置到了Docker中。为了实现最佳的容器监控，分析容器中的所有数据源至关重要，这些数据源包括容器/微服务日志、容器度量/事件、容器集群、节点和应用、应用日志和线路数据。使用上述Splunk产品后，可以将容器数据与来自其他层的数据相关联，从而描绘出环境的全貌。

其结果就是为容器监控提供一个全面的解决方案，可以轻松部署和快速实现价值，并且可以与企业正在使用Splunk软件处理的其他数据源相关联，从而为企业提供端到端的视角。