前言监控是每个公司必不可少的部门,通过监控我们能实时的观察设备的运行状态,保证业务稳定运行。当业务出现问题时,监控及时给各负责人发送告警,从而我们能够快速定位问题,及时止损。所以监控就像是眼睛一样,帮我们时刻盯着各个设备的工作情况。目前市面上有很多的监控软件,比如老牌的nagios、cacti、zabbix,新兴的prometheus、open-falcon、夜莺等,收费的监控宝、solar wi            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-29 19:05:13
                            
                                111阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            近期遇到项目需要定制开发运维监控软件,考虑到监控的规模比较大,数量比较多,所以不能随随便便找个开源的监控软件就能应付了事的,还是要认真对待。N年以前笔者曾经使用过Nagios,catti以及MRTG等相关软件,但是随着近几年虚拟机、容器等新技术的应用,原来的这些软件也有点逐步落伍了。查阅N多资料和网上文档,提到的比较多的两个运维监控软件是Zabbix和Prometheus。笔者亲自安装测试了一番,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-10 17:52:00
                            
                                83阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Progain ITM-Pro(简称:ITM-Pro),是北京网利天成信息技术有限公司所自 主研发的一款即插即用的硬件 IT 架构监测管理设备,对用户的 IT 架构环境进 行 7×24 小时不间断的监测,监测范围包括:网络交换机、路由器,防火墙、 服务器、数据库、操作系统、中间件、软件、服务、网站、进程、端口、日志文 件和用户自定义的脚本和 SNMP 监测。Progain ITM-Pro 不仅集多            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-05 19:54:13
                            
                                61阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            Open-Falcon 从写下第一行代码,应该是在 2012 年的冬天,开源于 2014 年。Open-Falcon 在设计之初,沉淀的主要是互联网公司在运维大规模物理机时代的优秀方法论,在简单易用、扩展性、性能方面倾注了较多的心思,凭借于此,开源之后迅速成为国内开源监控系统的首选,服务了上千家企业用户,并影响了国内互联网运维圈子一个阶段对于监控系统系统的设计思路。然而在过去的十年,微服务架构与            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-07 13:57:35
                            
                                25阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            商用运维监控系统篇***************************************************************************************************  监控宝 推荐星级:★★★★★ 监控宝是云智慧为用户提供IT性能监控(IT Performance Monitoring)的SaaS产品,包含网站监控、服务器监控、中间件监控、数据            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-08 19:45:22
                            
                                47阅读
                            
                                                                             
                 
                
                             
         
            
            
            
              IT监管和运行维护已成为企业经营的关键环节。本文将详细介绍IT监管和运行维护的必要性、主要功能和实施策略,帮助企业实现数据安全和高效运行。IT监管和运行维护的必要性   确保企业数据安全   IT监控系统可以实时监控企业网络、服务器、存储等关键设备的运行情况,及时发现异常现象,避免数据泄露、篡改或丢失。企业在面对硬件问题、自然灾害等突发事件时,可以根据及时备份和灾难演习,快速修复业务,确保企业            
                
         
            
            
            
            Zabbix是一款强大的开源监控系统,可以帮助运维人员实时监控服务器、网络设备等。本文将详细介绍如何在Zabbix Server的Web界面上配置Agent主机监控,帮助您更好地掌握Zabbix的运维技巧。Zabbix Agent是Zabbix系统的一个重要组成部分,用于在被监控主机上收集数据并将数据发送到Zabbix Server进行处理和分析。通过在Zabbix Web界面上配置Agent主机            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-09-09 07:26:08
                            
                                547阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目前很多企业信息化系统都有自己的监控平台和监控手段,无论是采用哪种手段去实现对系统的实时监控和故障告警,大多采用的方式也只有两种:一、集中式监控和分布式监控。博主根据自身公司监控存在的问题,总结了一些经验并提出一些在监控平台建设建议以供大家参考学习,如有考虑不周的地方还希望大家多多批评指正哦。为了更好、更有效的保障系统上线后的稳定的运行。对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-09 16:50:23
                            
                                582阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            日常IT运维遇到的问题 
         前段时间刚好和运营商网络运维中心的几位工程师进行了一次沟通,无意中聊到了平时是如何进行日常运维工作的话题,他们一致的感觉是又累又繁琐。便觉得很纳闷,经过了解才明白由于运营商级别对网络稳定的要求很高,每天都要实时了解网络中资源的运行状态,比如核心网络设备是否运行正常,关键应用服务器上的进程是否运行正            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-10 11:19:15
                            
                                103阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                Nagios是一款开源监控软件。利用Nagios可以监控本地或远程主机资源,如磁盘空间、系统负载等情况,也可以监控各种应用服务,例如HTTP服务、FTP服务等。当主机或服务出现故障时,Nagios还可以通过邮件、手机短信等形式在第一时间通知系统维护人员。      一. Nagios综述             
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-11 19:36:14
                            
                                43阅读
                            
                                                                             
                 
                
                             
         
            
            
            
                   作为一个运维,做监控的时候一定要了解我们需要监控的对象,我们监控的范围,以及我们根据业务判定监控要达到的精准度。监控对象:     1. 监控对象的理解:CPU是怎么工作的,原理     2. 监控对象的指标:CPU使用率 CPU负载 CPU个数 上下文切换     3. 确定性能基准线:怎么样才算故障?CPU负载            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-09 11:45:53
                            
                                109阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            一.监控对象  学习好监控:
  要对监控对象有理解,如果不理解,怎么能监控的好那?
  监控对象的指标,监控对象的指标是基于对监控对象的理解,才能知道具体要监控那些指标
  确定性能基准线,怎么样才算故障,或者cpu负载多少才算高?  二.监控范围  1.硬件监控
2.操作系统监控(cpu 内存 io 进程 网络流量)
3.应用服务监控
4.业务监控(当天多少人下单?有多少新建用户?)
5.监控            
                
         
            
            
            
            思通运维监控主要用来监控IT 基础设施组件的可用性和性能。监控项目是不受限制的,并且可以对IT 基础设施健康状态进行复杂分析。通过确定IT 系统问题的“来源”,使用户快速响应故障来降低宕机成本。 网络运维自动化:思通运维的远程命令是一种强大的可实现智能主动式监控的机制。如果你使用远程命令配置了一个指令,那么思通运维将会自动执行预定义好的脚本来解决问题。 采用开源解决方案:Zab            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-08 12:32:34
                            
                                42阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            首先从大的分类来讲:1. 设备物理监控系统监视硬件设备的物理健康特征,如温度、电压、风扇工作状态、电源状态等;2. 网络安全设备各大品牌的路由器、交换机、防火墙、IPS、IDS等;3. 存储设备磁盘阵列、光纤交换机;4. 操作系统AIX、BSD、HPUX、Linux、Solaris、Windows、虚拟化;5. 系统软件各类数据库、中间件、Web服务、DNS、AD、DHCP、存储备份系统;6. 应            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-12 16:16:06
                            
                                177阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一、运维监控基础1.报告网路/系统/业务运行状况2.提前发现被监控设备的问题二、监控的资源类别硬件监控:CPU、内存、磁盘I/O系统监控:存活状态、进程数、用户数、磁盘使用率网络监控:故障点监测、出站流量、入站流量应用监控:Web/FTP等服务、TCP/UDP端口检测三、监控服务平台Cacti---------基于SNMP协议的监控软件,强大的绘图能力Nagios-------基于Agent监控,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-11 17:16:48
                            
                                161阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            北京智和信通基于视频监控系统项目资源规模大、设备种类复杂、设备厂商众多、分布分散、维护人员繁杂等基本问题,再结合该单位的需求,采用智和网管平台SugarNMS开发视频监控事件预警及运维系统。实现跨型号、跨厂家、跨地域、跨平台的视频摄像头、网络设备、第三方系统的可视化综合运维及分析管理。赋能管理员做到事前预防、事中根源分析找到问题源头、事后统计分析的能力。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-27 11:01:33
                            
                                125阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            产品应用运维监控体系 by alvin,ethan  
    一、监控告警分类 
  
  监控告警包括:网络、机器、进程、业务逻辑四个层面的监控与告警。 
  
  底层 
  监控为网络与机器层面的监控。 
  上层 
  级别的监控包括:机器、进程、业务逻辑。 
  
   二、网络监控告警及处理 
  
  网络监控包括内网监控与外网监控。 
  
   三、机器监控告警及处理            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-11 19:28:39
                            
                                62阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            现状•小公司/ 创业团队< 500台服务器规模开源方案:Zabbix、Nagios、Cacti…云服务提供商:监控宝、oneAlert等•BAT级别> 10万台服务器投入大量的人力,内部自研,与业务严重耦合没法作为产品推出•中间阶层无从可选早期,选用Zabbix•Zabbix是一款开源的企业级监控系统•对其进行二次开发、封装、调优…•为什么选择Zabbix•Cacti•Co            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-04 10:38:34
                            
                                280阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            概括:主机监控、信息统计、硬件维护、系统维护、网络维护。分层运维计算机的广泛应用,是在于它的模块化设计,以及分层体系,PC的硬件是由CPU、内存、硬盘、主板、输入输出设备等组成。正是这些模块化的构造让人们对计算机的维护更加的方便,快捷。云计算时代,是必然的趋势,因为人们对信息自由的渴望,对资源合理利用的需要。云计算的发展也少不了用模块化,分层次的进行设计和优化。
云计算的分类 云计算可以认为包括以            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-20 23:06:59
                            
                                230阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            本文介绍几款Linux运维比较实用的工具,希望对Linux管理员有所帮助。1、查看进程占用带宽情况-NethogsNethogs 是一个终端下的网络流量监控工具可以直观的显示每个进程占用的带宽。 下载:sourceforge.net/projects/ne…[root@localhost ~]#yum -y install libpcap-devel ncurses-devel
[root@loc            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-26 21:55:17
                            
                                51阅读
                            
                                                                             
                 
                
                                
                    