#!/usr/bin/env python # Version = 3.5.2 # __auth__ = '无名小妖' import os import time import sendmail import psutil import collections disk_used = collections.OrderedDict() cur_time = time.time() # curre
转载 2023-06-17 12:57:13
147阅读
前段时间集中处理了一批磁盘空间报警类问题,让人有些恼火,因为报警了,不处理还不行,处理的话一方面是碎片的时间,处理步骤八九不离十,二来是非工作时间处理,我非常不喜欢这种被骚扰的状态,于是决定做一些改进。关于磁盘空间报警有哪些常见的问题呢,我总结了下,刚好借此把牢骚归归类。周末,节假日临时报警非工作时间(尤其是凌晨)报警报警未处理没有及时提醒没有问题处理的知识库,很多问题处理过程是相似的绝大多数报
 #!/bin/bash disk_cciss=`df -h |grep /dev/mapper/vg-root |awk '{print $5}' |cut -f 1 -d "%"` # 设置报警的免费硬盘容量是80%,如果目前的硬盘使用的80%以上,即时邮件提醒   if [ $disk_cciss -gt 80 ] then echo &q
原创 2012-12-06 14:34:07
310阅读
问题抛出:当一台主机硬盘满了或者达到一定程度时候,报警,该怎么做?A、怎么查看硬盘信息:如果是监控一些文件的大小,如日志文件,要如何获取文件大小?知道的方法有如下两种:1、ls -lh     2、du -sh *  发现两个方法得出的文件大小并不完全一致,这是因为:du不是显示文件的大小,而是显示文件所占用的block大小,默认Linu
二、一次Nignx的502页面的错误记录 (1)错误页面显示错误日志:2017/07/17 17:32:57 [error] 29071#0: *96 recv() failed (104: Connection reset by peer) while reading response header from upstream, client: 101.226.125.118, server:
内存用量报警全文分为五个章节:此脚本的作用及注意事项脚本的内容,文本版和图片版(方便工作时,直接复制到生产环境)脚本的执行效果脚本内容解释抽象总结作用:此脚本的使用是当内存的使用量达到80%之后向root邮箱发送报警信息,提示root尽快处理。注意:此脚本单独使用时作用并不明显,需要要和定时任务搭配才有显著效果!脚本内容(CRT):#!/bin/bash #When Memory Use 80%
想必大家都经历过手机、电脑等电子设备出问题的情况,跟手机、电脑一样,服务器运转过程中也会出点故障。作为承载了企业各种业务的平台,服务器出故障的影响非同小可,严重时可能危及业务开展,而如果故障发现不及时,企业就会蒙受更大的损失。经常有人询问,如何才能快速发现服务器出了故障。对此目前主要有两种方案,一是通过集中管理平台管理大量设备,定期对其进行检查,发现问题再处理;二是只要服务器出现问题,就第一时间发
ID1:Critical Warning警告状态 RAW数值显示0为正常无警告,1为过热警告,2为闪存介质引起的内部错误导致可靠性降级,3为闪存进入只读状态,4为增强型断电保护功能失效(只针对有该特性的固态硬盘)。正常情况下ID1的RAW属性值应为0,当显示为1时代表NVMe固态硬盘已经过热,需要改善散热条件或降低工作负载。属性值为2时应考虑返修或更换新硬盘,当属性值为3时硬盘已经进入只读状态,无
转载 2024-07-19 21:40:55
100阅读
磁盘负载监控告警
原创 2018-12-24 17:07:03
828阅读
  磁盘是计算机系统中最重要的存储设备,其中含有绝大部分文件。对文件的操作直接涉及到磁盘的访问,磁盘IO的速度效率和可靠性将直接影响系统的性能。因此,好的磁盘调度算法、优越的冗余技术,都是提高磁盘系统性能的切入点。磁盘调度算法1.先来先服务:按照进程访问磁盘的先后顺序进行调度。  优点:公平、简单  缺点:效率低,平均寻道时间较长2.最短寻道时间优先:要求访问磁道与当前磁头的磁道距离最近。  优点
本实验是在《Zabbix分布式监控(3)——Zabbix监控httpd、nginx服务》实验基础上进行的,已经配置好了zabbix-server和zabbix-agent主机,并关闭了自动注册目录实验部分:    步骤一:创建报警媒介    步骤二:设置报警媒介    步骤三:添加触发器 &nbsp
在Kubernetes(K8S)集群中,磁盘空间的监控和告警是非常重要的,可以帮助管理员及时发现磁盘空间不足的情况,避免应用程序因磁盘空间耗尽而崩溃。对于刚刚入门的开发者来说,如何实现K8S磁盘告警可能会比较困难,本文将为您详细解释整个过程。 ### K8S磁盘告警流程 以下是K8S磁盘告警的实现流程,我们可以通过Prometheus和Alertmanager这两个工具来实现磁盘告警: |
原创 2024-03-08 10:48:35
177阅读
服务器告警机制配置技巧 避免草木皆兵 现在的服务器都配置了成堆的传感器,一旦任何传感器发生状况都会发出告警,令人头昏目眩。但是管理员必须尽早知道:服务器监控工具产生的告警不一定都重要。   现在的服务器都配置了成堆的传感器,一旦任何传感器发生状况都会发出告警,令人头昏目眩。但是管理员 必须尽早知道:服务器监控工具产生的告警不一定都重要。如果服务器动辄发出警报,那你会在短时间内被迫接
您是否在监控Linux网络带宽使用方面遇到问题? 你需要帮助吗? 重要的是,您能够可视化网络中发生的事情,以便了解和解决导致网络运行缓慢的任何问题,或者只是密切关注您的网络。在本文中,我们将回顾16个有用的带宽监控工具,以分析Linux系统上的网络使用情况。如果您希望管理,排除故障或调试网络,请阅读我们的文章 - Linux系统管理员网络管理指南,故障排除和调试下面列出的工具都是开源的,可以帮助您
Linux系统中需要监控磁盘各分区的使用情况,避免由于各种突发情况,造成磁盘空间被消耗殆尽的情况,例如某个分区被Oracle的归档日志耗尽,导致后续的日志文件无法归档,这时ORACLE数据库就会出现错误。监控磁盘空间的使用情况,其实有许多工具,例如Nagios等
下列系统监视计数器来检测物理磁盘级IO瓶颈:物理磁盘对象:磁盘队列平均长度(Avg.Disk Queue Length) 指的是抽样间隔内所选中的物理磁盘上排除等待的物理读/写请求的平均数据。如果IO系统超负荷了,更多的读/写操作就会陷入等待。如果每个物理磁盘磁盘队列长度总是超过SQL Server巅峰使用期时的数值2,那么很可能就出现了IO瓶颈。物理磁盘对象:磁盘每次读/写平均用时(Avg.D
使用linux的df命令显示磁盘空间使用情况作者:清晨这篇文章将为大家详细讲解有关使用linux的df命令显示磁盘空间使用情况,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。df命令的英文全称即“Disk Free”,顾名思义功能是用于显示系统上可使用的磁盘空间。默认显示单位为KB,建议使用“df -h”的参数组合,根据磁盘容量自动变换合适的单位,更利于阅读。日常
我们服务器搭建了cacti进行监控,一次通过查看磁盘IO图像的时候,发现每天凌晨3:20-3:35的时候磁盘IO一下飙的很高,然后想知道到底是哪个进程占用那么高的IO,下面是解决方法:写个检测脚本check_io_process.sh,当磁盘IO占用高的时候进行磁盘IO读写进程次数的检测:#!/bin/bash# Date: 2013/8/20# Author: zhangkai# Descrip
转载 2024-08-01 17:52:41
250阅读
环境介绍:Centos 6.3运行在ESXi 5.5中分了两块虚拟磁盘,一块大小为IDE 20G,另外一块为SCSI 73G。lsb_release -a查看版本为CentOS release 6.3(Final)这套环境是之前的人员部署的,里面跑的是unison同步SVN版本的服务,从一台windows server 2012 R2同步过来。查看了挂载到根分区的磁盘/dev/sda2大小15G,
原创 2016-09-27 16:34:17
2007阅读
1点赞
思路:for循环判断出四种磁盘使用情况,并根据四种情况赋值case语句进行邮箱报警。#!/bin/bashLANG=ENdir=/tmp/diskd=`date+%F`py_dir=/usr/local/mail.py#定义python路径e_mail=abc@123.com#邮箱地址[-d$dir]||mkdir$dir#判断目录是否存在date+%F/%T>>$dir/$d.log
原创 2020-11-01 01:12:59
483阅读
  • 1
  • 2
  • 3
  • 4
  • 5