Nagios 计划停机时间

介绍

Nagios Core允许您为要监视的主机和服务安排计划内停机时间。如果您实际上知道要关闭服务器进行升级等,这很有用。

安排停机时间

您可以通过extinfo CGI安排主机和服务的停机时间(查看主机或服务信息时)。单击“为此主机/服务安排停机时间”链接以实际安排停机时间。

安排主机或服务的停机时间后,Nagios Core将在该主机/服务中添加注释,表明已计划在您指定的时间内停机。经过这段停机时间后,Nagios Core将自动删除它添加的注释。

固定停机与灵活停机

当您通过网络界面安排主机或服务的停机时间时,系统会询问您停机时间是固定的还是灵活的。这是“固定”和“灵活”停机时间有何不同的解释:

固定停机时间以您在计划停机时间时指定的确切开始时间和结束时间开始和停止。

灵活停机时间用于您知道主机或服务将在X分钟(或几小时)内关闭但您不知道何时开始的时间。当您安排灵活的停机时间时,Nagios Core将在您指定的开始时间和结束时间之间的某个时间开始安排的停机时间。停机时间将与您安排停机时间时指定的持续时间一样长。这假定您为其计划了灵活停机时间的主机或服务在指定的开始时间和结束时间之间的某个时间关闭(或变得无法访问)或进入非OK状态。主机或服务转换为问题状态的时间决定了Nagios Core实际开始停机的时间。然后,停机时间将持续您指定的持续时间,即使主机或服务在停机时间到期之前已恢复。这样做是有充分理由的。众所周知,您可能会认为已解决问题,但是必须重新启动服务器十次才能使其正常运行。

触发停机

安排主机或服务停机时间时,可以选择使其“触发”停机时间。什么是触发停机时间?通过触发的停机时间,停机时间的开始是由其他一些计划的主机或服务停机时间的开始触发的。如果您要为大量主机或服务安排停机时间,并且停机时间段的开始时间取决于另一个停机时间条目的开始时间,这将非常有用。例如,如果您为特定的主机安排灵活的停机时间(因为要停机进行维护),则可能要为所有主机的“子代”安排触发的停机时间。

计划的停机时间如何影响通知

当主机或服务处于计划的停机时间内时,Nagios Core将不允许发出有关主机或服务的正常通知。但是,将向主机或服务发出“ DOWNTIMESTART”通知,这将使所有管理员意识到他们不会收到即将到来的通知。

计划的停机时间结束后,Nagios Core将允许再次向主机或服务发送正常通知。系统将发出“ DOWNTIMEEND”通知,通知管理员计划的停机时间已结束,他们将再次开始接收通知。

如果计划的停机时间被过早取消(在其到期之前),则“ DOWNTIMECANCELLED”通知将发送给适当的管理员。

重叠的计划停机时间

我喜欢称其为“我去,不工作”的综合症。你懂的。当你关闭服务器以执行“常规”硬件升级,之后才意识到操作系统驱动程序不起作用,RAID阵列崩了,驱动器映像失败并使原始磁盘成一堆废铁。故事的寓意是,在服务器上进行任何日常工作很可能要花费您最初计划的三到四倍的时间。

让我们来看看以下情形:

  1. 您可以在星期一的7:30 pm-9:30pm安排主机A的停机时间
  2. 您在星期一晚上7:45 pm左右关闭服务器,以开始硬盘驱动器升级
  3. 在浪费了一个半小时解决SCSI错误和驱动程序不兼容之后,您终于使机器启动了
  4. 在9:15时,您意识到分区中的一个已关闭或似乎不在驱动器上的任何位置
  5. 知道您已经待了很长的夜晚,您可以返回并安排主机A的其他停机时间,从星期一晚上9:20 pm到星期二早上1:30。

如果您为主机或服务安排了重叠的停机时间段(在本例中为7:40 pm-9:30pm和9:20 pm-1:30am),Nagios将等到预定的停机时间结束之前允许发送有关该主机或服务的通知。在此示例中,主机A的通知将被抑制,直到星期二上午1:30。

觉得文章有用?

点个广告表达一下你的爱意吧 !😁