线上故障主要会包括CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如 jstack、jmap 等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次 jstack、jmap 伺候,具体问题具体分析即可。CPU一般来讲我们首先会排查 CPU 方面的问题。CPU 异常往往还是比较好定位的。原因包
转载
2024-08-17 12:33:09
80阅读
在“高效运维”公众号中读到《运维自我提升:怎样做好企业IT运维工作》这篇文章,比较赞同,消化一下并记录下来,与大家交流。一、运维工作按工作层次划分:1.硬件运维2.桌面运维(helpdesk)3.系统运维(sa-systemadmin)4.数据库运维(dba)5.应用运维6.网络运维7.运维开发(devops)8.系统稳定性运维(sre)9.······二、运维工作好坏的评价标准运维工作给公司及业
原创
2019-02-19 10:21:36
4324阅读
点赞
概述
这里以负责 Zabbix 的员工离职为例. 实际上这是通用的, 你可以将 Zabbix 替换为任何业务系统, 任何运维工具, 任何其他场景.
为确保Zabbix监控系统平稳过渡,以下是离职员工必须移交的核心工作和资料清单,按优先级分类呈现:
一、基础访问权限移交
账户清单
Zabbix Web控制台管理员账号
被监控服务器的SNMP/Agent账号
数据库(如MySQL/Postgre
说到服务器虚拟化,首先给人感觉就是深奥而且有些神秘。其实从原理来讲,还是非常简单的。我们可以理解成将众多相互连接的服务器“变成”一台虚拟服务器,不会受到物理上的约束,更加方便管理。而处理器、内存、磁盘、I/O等资源可以进行动态管理,提高资源利用率,降低单台机器的负载,简化系统管理,从而实现“整合”的目的。 举
转载
2024-08-24 17:53:11
51阅读
1、监控的重要性听闻前辈所说,在监控不发达的时代,出行基本靠走,安全基本靠狗,那个时候没有自动化监控的概念,都是人工盯着机器,进行轮班;每天上班第一件事情就是去巡视一下,看看各项软件打印的信息是否有异常,顺便拿Execl记录一下。现在如今的企业中,运维就要负责成百上千台的机器,传统的方式依然不行,没有高大上的方法是支持不起这种规模的监控,服务器随时随地可能出库长,需要通过监控来让机器来管理监控机器
转载
2024-04-03 21:04:05
98阅读
IT运维的分类 IT运维,指的是对已经搭建好的网络,软件,硬件进行维护。运维领域也是细分的,有硬件运维和软件运维。 硬件运维主要包括对基础设施的运维,比如机房的设备,主机的硬盘,内存这些物理设备的维护。 软件运维主要包括系统运维和应用运维,系统运维主要包括对OS,数据库,中间件的监控和维护,这些系统介于设备和应用之间,应用运维主要是对线上业务系统的运维。传统运维痛点日程工作繁琐 日常运维工作是比较
转载
2024-05-26 20:08:22
65阅读
在Kubernetes(K8S)中,运维工作是至关重要的一环,它涉及到集群的维护、监控、扩展等工作。对于刚入行的小白来说,可能会觉得这些工作很复杂,但只要掌握了一些基本的概念和技巧,就能轻松应对各种运维任务。
首先,让我们来看一下K8S运维工作的整体流程:
| 步骤 | 操作 |
原创
2024-05-16 11:05:26
46阅读
各位51CTO的博友们、IT同仁们,你们好!我是吴光科老师,很高兴能够在这里和大家一起来交流IT技术,不知不觉在IT运维行业已经从事了近10年。曾在国企、京东、宜信等一线互联网公司担任过Linux运维架构师、运维经理,51CTO学院Linux特级讲师,担任国内多家知名社区&运维专家网站Linux版主。擅长系统高并发、超万台级别的服务器维护、服务器性能调优、企业安全运维、Openstack、
Kubernetes运维工作流程及代码示例
在开始介绍Kubernetes运维工作之前,首先需要了解什么是Kubernetes。Kubernetes是一个用于管理容器化应用程序的开源平台,它可以自动化部署、扩展和管理应用程序。在Kubernetes中,你可以使用一些关键词来实现各种操作,比如创建、删除、扩展和监控应用程序等。
下面是Kubernetes运维工作的整个流程及每一步需要做的事情:
原创
2024-01-25 20:49:25
104阅读
Linux运维工作与红帽
Linux运维工作是当今互联网时代中的一项重要职业,在IT行业中占据着举足轻重的地位。而红帽(Red Hat)作为全球领先的开源软件解决方案提供商,为Linux运维工作提供了许多强大的支持和便利。
Linux运维工作是指负责管理和维护企业或组织中运行Linux操作系统的任务。该工作涉及到操作系统的安装、配置、调试,以及应用程序的部署、升级和监控。由于Linux系统的开
原创
2024-02-04 10:27:13
59阅读
Kubernetes(K8S)是一种用于自动部署、扩展和管理容器化应用程序的开源系统。作为一名经验丰富的开发者,我将向你介绍关于K8S中运维工作内容的流程和实现步骤。
首先,让我们了解一下运维工作内容的整体流程,可以用以下表格展示:
| 步骤 | 描述 |
|---------------|--------------
原创
2024-05-23 10:45:23
137阅读
一、操作系统环境操作系统版本选择CentOS/RHRL/ORACLE Linux 5.x/6.x x86_64 发行版 建议磁盘分区规则MySQL 运行环境建议规范挂载点大小分区类型分区用途/boot100M系统默认即可/booswap4G-16Gswapswap/opt20Gxfs安装应用软件应用程序安装在 /opt/app/ 下的子目录,例如&
运维工作解释2017/3/9 PC小记:《运维之下》的文档作者对运维工作的解释清晰明了,有利于工作的划分和职业的规划,因而值得整理后分享。https://github.com/opera443399/ops/tree/master/doc/ARCHITECTURE/ops 【Q】:如何开展运维工程师的工作?A:推荐《运维之下》----------------【运维工作解释】-------
原创
2017-03-09 16:03:14
1992阅读
点赞
4评论
# 从头开始理解K8S的运维工作机制
随着云原生技术的普及,Kubernetes(简称K8S)已经成为了容器编排领域的翘楚之作。作为一名开发者,如果要在K8S上部署应用并进行运维工作,首先我们需要了解K8S的运维工作机制。本篇文章将从整体流程和具体代码示例两个方面来介绍。
## 整体流程
在K8S中,运维工作主要包括应用部署、监控、扩展、故障排查、升级等方面。下面是一些基本的运维工作步骤,我
原创
2024-05-16 11:04:09
33阅读
安全管理是顺应信息安全的需要而产生的。其主要目标是确保信息的安全性。安全性似乎只不易遭到已知风险的侵袭,并且尽可能的规避未知风险。1.1、目标安全管理的目标是要保护信息的价值,取决于机密性、完整性和可用性。机密性:保护信息免受未经授权的访问和使用。完整性:信息的准确性、完全性和及时性。可用性:信息在任何预定的时间内都可以被访问。目标1:满足服务级别协议中的安全性需求。目标2:提供一个独立于外部需求
转载
2023-12-12 22:26:54
90阅读
一、线上操作规范1、测试使用当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别,可是对真实环境的渴望日渐上升,不过虚拟机的各种快照却让我们养成了各种手贱的习惯,以致于拿到服务器操作权限时候,就迫不及待的想去试试,记得上班第一天,老大把root密码交给我,由于只能使用putty,我就想使用xshell,于是悄悄登录服务器尝试改为Xshell+密钥登录,
转载
2024-05-26 12:54:55
14阅读
0.大数据技术分类 1.批处理框架:Mapreduce 批处理历史数据 2.流处理框架:storm 一直处理源源不断的数据 3.混合处理框架:spark1.生态圈核心项目 1.HDFS分布式文件系统 2.yarn调
转载
2023-11-23 19:54:33
165阅读
互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。运维人员对公司互联网业务所依赖的基础设施、基础服务、线上业务进行稳定性加强,进行日常巡检发现服务可能存在的隐患,对整体架构进行优化以屏蔽常见的运行故障,多数据中接入提高业务的容灾能力。通过监控、日志分析等技术手段,及时发现和响应服务故障,减少服务中断的时间,使公司的互联网业
转载
2023-10-07 19:49:51
16阅读
原标题:IT维护主要做些什么工作?在现代社会中,IT已经深入到了每个企业的日常管理和运转中,为了保障整个系统的正常运行,IT维护就显得异常重要。以前的企业的管理模式是招聘网络管理人员,而今资源整合,越来越多的企业选择IT外包运维管理,这种专业的管理模式更加专业全面,让企业受益匪浅。那到底IT维护都要做些什么工作呢?1.设备的管理。这个设备包括所有计算机系统的硬件以及辅助设备,包括服务器、个人终端、
转载
2023-11-01 16:31:54
88阅读
笔者从事企业MIS/ERP开发、实施及维护工作多年,常为媒体上刊登的ERP类的精彩文章喝彩,同时感到报刊上的文章已经从ERP概念的引导发展到选型实施类报道。但对系统维护工作这部分在系统生存期内占用了很多时间、费用、工作量的环节介绍得太少。笔者认为,当ERP应用进入成熟期时,系统维护与发展将会成为关注焦点。全面认识ERP应用的整个生存期并客观评价
转载
2023-12-14 02:15:01
37阅读