严立忠
容器的使用正在迅速增长。Cloud Foundry和ClearPath Strategies在2016年6月进行的一项调查显示,64%的受访者表示计划在明年将容器的使用主流化。随着容器使用量的不断增加,解决监控问题以提高容器的性能、使用和故障排除能力至关重要。然而,有效的监控需要一种由分析驱动的方法,不仅能通知开发人员和运维部门正在发生的情况,还能够帮助这些团队挖掘其容器使用情况和性能数据,从而获得可行的洞察力。
当出现错误时会发生什么?出现问题时,快速了解事件的具体细节至关重要。在容器中运行的应用发生错误是容器问题最常见的来源,但并非唯一来源。容器问题也可能由操作系统、存储、网络、数据库或其它部件等底层基础架构的问题引起。因此,容器监控解决方案必须具有可见性和分析能力,帮助用户确认问题的根源。如果不能快速准确地做到这一点,可能会引发更长的停机时间,从而给组织造成重大成本和风险。
容器具有獨特的特征,将对组织应选择的监控解决方案产生影响。比如,容器是短暂的,可以在几秒钟内启动和停止这一事实。这需要一个监控解决方案,可以利用日志记录和度量值界面,并在该容器不再运行后保留相关信息。此外,容器监控解决方案不仅要具备分析容器的能力,而且还要能够提供对应用堆栈其他组件可用性、性能和使用情况的洞察力。
对于有效和高效的容器监控来说,最重要的要求也许就是拥有一个源于容器的解决方案。日志记录驱动程序是有关容器的关键信息来源,可以通过简单配置容器定义或运行方式来实现。使用嵌入式解决方案可以获得更好的性能,因为监控工具不会与其他程序争夺资源。
有效解决方案的最后一个组成部分是基于分析的方法,可以更轻松地对监控解决方案所显示的信息进行评估并采取行动。仪表板通常会成为修复容器中出现问题的起始点。此外,仪表板还必须支持深入了解日志和指标的能力,以获取有效修复所需的详细信息。
Splunk Enterprise或Splunk Cloud可以为容器监控提供起点。通过为Docker使用Splunk Logging Driver,机器数据可以轻松地从容器传送到Splunk软件。使用该驱动程序,可以从容器中检索Docker容器信息并对日志进行无缝监控。这个任务很简单,因为Splunk的Docker驱动程序被内置到了Docker中。为了实现最佳的容器监控,分析容器中的所有数据源至关重要,这些数据源包括容器/微服务日志、容器度量/事件、容器集群、节点和应用、应用日志和线路数据。使用上述Splunk产品后,可以将容器数据与来自其他层的数据相关联,从而描绘出环境的全貌。
其结果就是为容器监控提供一个全面的解决方案,可以轻松部署和快速实现价值,并且可以与企业正在使用Splunk软件处理的其他数据源相关联,从而为企业提供端到端的视角。