nagios监控linux服务器, 因为监控都是依靠插件去完成的,而监控linux主要使用NRPE插件,本文首先简单介绍一下NRPE监控基础,及监控过程,然后一步步的配置一个实例实现监控linux服务   1.NRPE监控插件基础   NRPE总共由两部分组成:   插件,运行在监控主机上。   运行在远程的linux主机上(通常就是被监控机)   整个的监控过程:(如下图)   &n            
                
         
            
            
            
            服务器宕机排查记录 
     问题症状:服务器内存占用持续增长,性能低下,并发上不去,隔几天宕机排查思路:分析出内存泄露模块,分析出性能瓶颈,调优JVM使用工具:jconsole、jprofiler           使用jconsole连接,经过测试得到如下图表,可能为JVM配置不当或内存泄露                          通过thread dump发            
                
         
            
            
            
            简单的添加被监控的Linux主机和服务主机和服务都在这一个文件里添加一个主机主机组里添加主机名所有的服务都依次添加主机名就行了connects.cfg里添加邮箱template里可以有很多的设置ping服务,其它的类似添加然后重启服务,就可以看到主机和相应的服务了安装NRPE监控Linux主机上下载解压进入目录编译如果不行就用提示没有SSL,因为NRPE客户机和服务器通过SSL加密数据安装了OPE            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-10-14 12:13:11
                            
                                4阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            Linux系统中常常使用的性能检测与优化命令top指令uptime指令free指令iostat指令mpstat指令sar指令vmstat指令time指令tload指令lsof指令fuser指令cpuspeed指令在使用Linux服务器的过程中,有16个命令可以帮助你全面了解你的服务器的运行状况。你需要很熟练地掌握这些命令。01 – iostatiostat命令显示的是显示CPU使用情况,也可以看到            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-21 12:15:19
                            
                                65阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            在Linux监控过程中我们经常会用到一些命令,这些命令是我们的工作更高效,缩短了工作时间,使我们在获取行动时更加轻松。 watch 命令 watch 是一个用来轻松地重复检测 Linux 系统中一系列数据命令,例如用户活动、正在运行进程、登录、内存使用等。这个命令实际上是重复地运行一个特定的命令,每次都会重写之前显示的输出,它提供了一个比较方便的方式用以监测在你的系统中发生的活动。 首先以一个基础            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-29 23:36:46
                            
                                75阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            第一篇    使用crontab指令的shell脚本实现服务监控报警重启  这两天做了一个服务监控报警重启的脚本。本质就是用一个shell命令去监控服务状态,如果宕机就会自动重启,并向指定邮箱发送邮件对管理人员进行提醒,再使用crontab命令设置每隔一分钟运行一次这个shell脚本,实现对服务的监控。    本来很简单,以为半            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-07 13:21:20
                            
                                204阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            watch、   top 和   ac 命令为我们监视 Linux 服务器上的活动提供了一些十分高效的途径。  为了在获取系统活动时更加轻松,Linux 系统提供了一系列相关的命令。在这篇文章中,我们就一起来看看这些对我们很有帮助的命令吧。watch 命令watch 是一个用来轻松地重复检测 Linux 系统中一系列数据命令,例如用户活动、正在运行进程、登录、内存使用等。这个命            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-11 16:54:10
                            
                                57阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            问题现象:最近遇到不同的业务正常运行时出现了宕机(物理机、虚拟机),查看日志是指向的怀疑是内存问题。 业务都是部署的Kubernetes(容器集群管理系统)。初步日志排查:message日志信息反馈(下面是虚拟机的日志信息): 这些日志重复循环到问题宕机。Oct 16 00:51:51 uos-PC kernel: [4307490.033245] Tasks state (memory valu            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-01-25 16:39:41
                            
                                407阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            宕机通俗的点说就是服务器不堪负重,或者其他等原因而死机或者关机的状况。宕机怎么读?其汉 语拼音为dangji,还有人叫down机,当机,甚至直接称死机,这样就好理解的多了。  宕机通常都有哪些常见原因?  1、服务器环境的客观原因。比如机房断电导致的服务器断电、机房温度过高,导致的服务器死机、关机等。不过这种情况一般很少发生,因为像鼎峰新汇BGP机房等数据中心,通常都有很好预防措施,比如备用电路、            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-09 20:23:43
                            
                                170阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            案例环境操作系统 :Oracle Linux Server release 5.7 64bit 虚拟机硬件配置 : 物理机型号为DELL R720 资源配置 :RAM 8G Intel(R) Xeon(R) CPU E5-2690 8核案例描述早晨发现桂林那边一台Linux服务器(虚拟机)网络无法ping通,于是联系那边的系统管理员通过Lync共享桌面给我,通过他的电脑VMware vSphere            
                
         
            
            
            
            监控服务器是否宕机的脚本:$ sudo vi ping.sh按a或i进入编辑模式#!/bin/bashDate=`date +%m%d%y`touch /log/Ping/$Date.logServer="ming1 ming2 ming3 ming4 ming5"for Server in $ServerdoPing=`/bin/ping -c 4 $Server | grep % | awk            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2014-08-01 13:47:10
                            
                                2138阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            软件性能测试过程中经常要对服务器性能指标(比如CPU、内存、磁盘IO及网络IO等等)进行监控以分析出软件在此服务器上的性能瓶颈以便进行后续的服务器调优及软件性能优化。下面为大家介绍一款小编认为比较好用的Linux系统服务器性能监控分析工具:nmon for Linux。 从nmon工具包中选择监控服务器匹配的nmon监控可执行文件(如下图所示:小编使用的是nmon_linux_x86_64) 将n            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-25 15:27:54
                            
                                75阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            0.概述:    一般情况下,为了提高游戏速度,在线玩家的数据都会缓存在内存中。如果有数据更新的时候,只更新内存中的缓存数据,而不是直接更新数据库。缓存数据会定时写回到数据库中(比如:5分钟写入一次)。 当服务器宕机后,从上次更新数据库到宕机前的所有数据更新都将丢失,即所谓的回档。这部分数据永远也找不回来了,通常都是服务器重启后给予所有玩家一定的补偿。 1.引子:&n            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-02 06:34:50
                            
                                94阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            背景知识  对于 Linux 系统管理员来说,没有比 shell 脚本编程更有用处的了。通常,Linux 系统管理员每天需要完成无数项任务,从监视系统磁盘空间和系统用户到备份重要文件。Shell 脚本可以让系统管理员的工作变得非常轻松!使用简单的 shell 脚本就可以自动化执行所有基本的系统管理任务。  管理计算机是个复杂的工作,具体来说系统管理员要做以下几方面的工作:  ①设置整个计算机系统,            
                
         
            
            
            
            # dos2unix ./test.sh
权限
# 
  chmod a+x ./test.sh 
  
语法 
  
变量 
  
var="111" 
  
echo $var 
  
echo ${var} 
  
运算 
  
no1=4; 
  
no2=5; 
  
let result=no1+no2 
  
echo $result; 
  
自增自降低 
  
let            
                
         
            
            
            
            转自: Linux 服务器系统监控脚本 Shell - 今日头条(.toutiao.com)://.toutiao.com/i6373134402163048961/ 本程序在CentOS 6 下运行成功 其它系统请自行修改参数 monitor_man.sh 主程序 check_            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2017-01-12 14:05:00
                            
                                137阅读
                            
                                                                                    
                                2评论
                            
                                                 
                 
                
                             
         
            
            
            
            本文将介绍两大Linux监控工具,这些工具被大部分Linux数据中心管理员看成为“必要”工具。Linux监控工具CactiCacti介绍:Cacti是一个免费开源基于Web的实时网络Linux监视工具。它基于RRDtool,提供一套前端界面,使用SNMP协议来收集数据。它允许用户在一定的时间间隔检查服务运行状态,并使用易于阅读的图形格式展示一切数据。Cacti提供快速轮询、高级图形模板、多种数据采            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-26 21:11:19
                            
                                27阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            目录1、top命令的使用1、系统统计信息2、系统进程信息2、free命令使用:内存3、df命令的使用:磁盘4、ps命令的使用5、crontab 命令6、查看端口的命令1、netstat:查看监听的端口2、lsof:查看端口被占用情况3、ss:显示更多更详细的有关 TCP 和连接状态的信息4、nc和nmap:扫描别人机器上开放了哪些端口。7、查看系统资源使用情况 1、glances:监听系            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-01 12:39:45
                            
                                54阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             
 1、查看http的并发请求数及其TCP连接状态: 
 
  netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'  
 结果分析: 
 
   TIME_WAIT 1---等待线程连接 
   
   ESTABLISHED 45--当前已经建立的连接 
    
  2、CPU负载   # cat            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-22 19:49:00
                            
                                65阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            本节书摘来自华章计算机《高性能Linux服务器构建实战:系统安全、故障排查、自动化运维与集群架构》一书中的第2章,第2.2节,作者:高俊峰著, 更多章节内容可以访问云栖社区“华章计算机”查看。2.2 网络流量监控与分析工具Ntop和Ntopng对于单台服务器网络故障的排查,iftop工具可以轻松实现,但是在监控一个庞大的服务器网络,并且要分析每台主机以及端口的网络状态时,iftop就显得爱莫            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-13 12:17:01
                            
                                28阅读
                            
                                                                             
                 
                
                                
                    