Nagios 被动主机状态转换

介绍

当Nagios Core从远程源(即分布式或故障转移设置中的其他Nagios Core实例)接收到被动主机检查时,远程源报告的主机状态可能无法从Nagios Core的视图中准确反映主机的状态。由于分布式监控和故障转移监控安装相当普遍,因此提供一种机制来确保Nagios Core的不同实例之间的准确主机状态非常重要。

不同的观察角度

下图显示了故障转移监控设置的简化视图。

  • Nagios-A是主要的监控服务器,并且正在主动监控所有交换机和路由器。
  • Nagios-BNagios-C是备用监控服务器,并且从Nagios-A接收被动检查结果
  • 这两个路由器-C路由器-d遭受失败和处于脱机状态。
被动状态翻译

Router-CRouter-D当前处于 什么状态?答案取决于您询问的是哪个Nagios实例。

  • Nagios-A认为Router-D为DOWN,而Router-C为UNREACHABLE
  • Nagios-B应该看到Router-C为DOWN,而Router-D为UNREACHABLE
  • Nagios-C应该看到两个路由器都处于关闭状态。

每个Nagios实例都有不同的网络视图。备用监控服务器不应盲目接受主监控服务器的被动主机状态,否则它们将掌握有关网络当前状态的错误信息。

如果不转换来自主监控服务器(Nagios-A)的被动主机检查结果,则Nagios-CRouter-D视为“无法连接” ,但根据其观点,它实际上是“ DOWN”的。类似地,应该从Nagios-B的角度翻转Router-CRouter-D的DOWN / UNREACHABLE状态(从Nagios-A的角度来看)。

 注意:在某些情况下,您不希望Nagios Core从本地Nagios Core实例的角度将DOWN / UNREACHABLE状态从远程源转换为其“正确”状态。例如,在分布式监控环境中,您可能希望中央Nagios Core实例知道分布式实例如何看待它们各自的网络部分。

启用状态转换

默认情况下,Nagios不会从被动检查结果中自动转换DOWN / UNREACHABLE状态。如果需要,您将需要启用此功能。

被动主机检查状态的自动转换由translate_passive_host_checks变量控制。启用它,Nagios将自动将远程源的DOWN和UNREACHABLE状态转换为Nagios本地实例的正确状态。

觉得文章有用?

点个广告表达一下你的爱意吧 !😁