Q1。为什么需要连续监控?
我建议您遵循以下流程:
连续监视可以及时发现问题或弱点,并采取快速纠正措施来帮助减少组织的费用。持续监控提供的解决方案可解决以下三个运营准则:
持续审核
持续监控
连续交易检查
Q2。什么是Nagios?您可以通过首先提到Nagios是监视工具之一来回答这个问题。它用于在DevOps文化中连续监视系统,应用程序,服务和业务流程等。如果发生故障,Nagios可以提醒技术人员该问题,使他们可以在故障影响业务流程,最终用户或客户之前开始补救流程。使用Nagios,您不必解释为什么看不见的基础设施中断会影响组织的底线。
现在,一旦定义了什么是Nagios,就可以提及使用Nagios可以实现的各种功能。
通过使用Nagios,您可以:
在过时的系统导致故障之前,计划基础架构升级。
在出现问题的第一个迹象时就响应问题。
检测到问题后自动修复问题。
协调技术团队的响应。
确保满足组织的SLA。
确保IT基础架构中断对组织的底线影响最小。
监控整个基础架构和业务流程。
这就完成了这个问题的答案。可以根据讨论的方向添加其他优点(如优势等)。
Q3。Nagios如何工作?Nagios在服务器上运行,通常作为守护程序或服务运行。Nagios会定期运行驻留在同一服务器上的插件,它们会与您的网络或Internet上的主机或服务器联系。可以使用Web界面查看状态信息。如果发生问题,您还可以接收电子邮件或SMS通知。
Nagios守护程序的行为就像是在某些时刻运行某些脚本的调度程序。它存储这些脚本的结果,如果这些结果发生更改,它将运行其他脚本。
现在期待有关Nagios组件(如插件,NRPE等)的一些问题。
Q4。Nagios中的插件是什么?通过定义插件来开始这个答案。它们是可从命令行运行以检查主机或服务状态的脚本(Perl脚本,Shell脚本等)。Nagios使用插件的结果来确定网络上主机和服务的当前状态。
定义插件后,请解释为什么我们需要插件。当需要检查主机或服务的状态时,Nagios将执行插件。插件将执行检查,然后将结果简单返回给Nagios。Nagios将处理从插件收到的结果,并采取必要的措施。
对于此答案,请简要介绍插件。NRPE插件旨在允许您在远程Linux / Unix计算机上执行Nagios插件。这样做的主要原因是允许Nagios监视远程计算机上的“本地”资源(例如CPU负载,内存使用情况等)。由于这些公共资源通常不会暴露给外部计算机,因此必须在远程Linux / Unix计算机上安装NRPE之类的代理。
我将建议您根据下图说明NRPE体系结构。NRPE附件由两部分组成:
check_nrpe插件,位于本地监视计算机上。
NRPE守护程序,在远程Linux / Unix计算机上运行。
监视主机和远程主机之间存在SSL(安全套接字层)连接,如下图所示。
Q6。您在Nagios中进行被动检查是什么意思?据我说,答案应该从解释被动检查开始。它们由外部应用程序/过程启动和执行,并且被动检查结果被提交给Nagios进行处理。
然后说明被动检查的必要性。它们对于监视本质上异步的服务很有用,并且不能通过定期轮询其状态来有效地监视它们。它们还可以用于监视位于防火墙后面且无法从监视主机主动检查的服务。
确保在解释过程中坚持提问,所以我建议您遵循以下提到的流程。Nagios在以下情况下检查外部命令:
由主配置文件中的command_check_interval选项指定的固定间隔,或者
事件处理程序执行后立即。这是对外部命令检查的常规周期的补充,并且在事件处理程序向Nagios提交命令时可以立即采取措施。
Q8。****Nagios中的主动和被动检查有什么区别?对于这个答案,首先要指出主动和被动检查的基本区别。主动检查和被动检查之间的主要区别在于,主动检查由Nagios启动和执行,而被动检查则由外部应用程序执行。
如果您的面试官不满意上述说明,那么您还可以提及主动检查和被动检查的一些关键功能:
被动检查对于监视以下服务很有用:
本质上是异步的,因此无法通过定期轮询其状态进行有效监控。
位于防火墙后面,无法从监视主机主动进行检查。
Actives检查的主要功能如下:
主动检查由Nagios流程启动。
主动检查会定期进行。
Q9。Nagios如何帮助进行分布式监视?