1. 故障背景当一个网站打不开的时候,首先要收集信息,然后根据经验去判断问题所在,;
(跟去医院看病一个道理,医生询问病人情况,然后对症下药,如果一上来不闻不问直接开药,很容易草菅人命;)
考虑:
1. 确定网站打不开的范围,部分人打不开 还是 所有人打不开(全国/某个地区)
&nb
谢谢你,一直都在 我觉得我今天再吹水,估计小伙伴都跑光了,虽然公众号没开多久,但我觉得还是需要分享点干货给大家,下面是2021 Gdevops全球敏捷运维峰会-广州站的会场材料,感兴趣的小伙伴们可以自取。链接:https://pan.eflycloud.com/s/P6iNwyTzPzDF8T6密码是小堂运维笔记开启的第一天——20210915 愿每一个人都能成为一个自律上进努
原创
2021-10-26 11:03:48
471阅读
# Kubernetes 运维 技术分享
Kubernetes是一个开源的容器编排平台,用于自动化容器的部署、扩展和管理。它提供了一种便捷的方式来管理容器化应用程序的生命周期,包括部署、伸缩、升级和监控。本文将介绍Kubernetes的一些常用技术,并附带代码示例来帮助读者更好地理解和使用Kubernetes。
## 1. 安装和配置Kubernetes集群
安装和配置Kubernetes集
原创
2023-08-21 06:56:55
50阅读
文章目录职能划分应用运维安全运维(安全宝)监控运维系统运维 (阿里云)运维标准化1. 物理设备方面2. 操作系统层面3. 应用服务层面工具化1. shell脚本2. 开源工具web化好处服务化(API)智能化自动化扩容(虚拟机)触发机制->决策系统(决策树)工具工具2自动化缩容缩容服务降级故障自愈基于ITIL的运维管理体系服务服务管理ITSM(IT service manage)ITIL(
学员案例1:看到 数据库安装到/data/mysql 目录 方向旁边有些乱起一个什么mysql5.89乱七八糟文件 ,你觉得没用 直接 rm -rf 删除 , 现在是清爽了,, 一会 发现业务无非登录全部报错500 无法连接数据库 ?为啥呢 你把数据库干了! 数据库被删除 还不知道为啥呢 ?都是基础不行欠的账 ,所以做运维一定基础扎实。学员案例2:当初学习Linux的使用,从基础到服务到集群,都是
原创
精选
2022-06-23 21:13:29
5410阅读
ZooKeeper 是分布式环境下非常重要的一个中间件,可以完成动态配置推送、分布式 Leader 选举、分布式锁等功能。在运维 ZooKeeper 服务的以来,积累如下经验:1. 集群数量3台起,如果是虚拟机,必须分散在不同的宿主机上,以实现容灾的目的。如果长远来看(如2-3年)需求会持续增长,可以直接部署5台。ZooKeeper集群扩容是比较麻烦的事情,因此宁可前期稍微浪费一点。2. 客户端配
原创
2021-05-12 15:40:18
744阅读
linux运维发展路线常见的就是下面两条路线:第一条:运维应用-->系统架构-->运维开发-->系统开发第二条:运维应用-->应用dba-->架构dba-->开发DBA下面详细每个阶段的职位说明(以北上广为例):01.运维应用级别:这个阶段就是玩别人的软件,例如:linux,nginx,mysql,php,nagios 大多数的linux运
原创
2014-02-21 10:01:33
10000+阅读
点赞
13评论
linux运维发展路线常见的就是下面两条路线:第一条:运维应用-->系统架构-->运维开发-->系统开发第二条:运维应用-->应用dba-->架构dba-->开发DBA下面详细每个阶段的职位说明(以北上广为例):01.运维应用级别:这个阶段就是玩别人的软件,例如:linux,nginx,mysql,php,nagios 大多数的linux运维工程师,
转载
精选
2014-03-30 12:20:43
1266阅读
点赞
二. 运维和管理维护参考网址https://jimmysong.io/kubernetes-handbook/practice/install-kubernetes-on-centos.html1. node管理禁止pod调度到该节点上
kubectl cordon <node>
驱逐该节点上的所有pod
kubectl drain <node>
允许调度新的p
转载
2023-07-29 23:18:51
141阅读
随着企业迅速发展,需要的信息系统越来越多,出现数据孤岛,数据不一致等问题,面对这种情况公司推出基础数据治理方案进行解决。本文档针对数据治理项目总结项目运维的经验。
原创
2022-07-11 10:23:33
389阅读
运维工作关系到应用系统运行的稳定性,想要提高运维水平,应在工作中总结经验,并制定运维规则。本文笔者通过自己的运维经验,总结出基本运维规则进行分享。
原创
2022-07-11 10:52:17
1408阅读
目前很多企业信息化系统都有自己的监控平台和监控手段,无论是采用哪种手段去实现对系统的实时监控和故障告警,大多采用的方式也只有两种:集中式监控和分布式监控。本文作者根据自身公司监控存在的问题,总结了一些经验并提出一些在监控平台的建议,以供大家参考学习,如有考虑不周的地方还希望大家多多批评指正。为了更好、更有效的保障系统上线后的稳定的运行。对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有一
转载
2016-12-16 18:18:10
2053阅读
Linux运维人员如何学习python编程 从不会写代码,到自己独立能写代码解决问题 。这个问题很重要!盲目学习所谓的项目,最后还是不会自己写代码解决问题。首先解决了独立能写代码解决问题,再通过项目来加强训练。运维必须懂开发,特别是python开发,已经形成大家的共识,不懂开发的运维,路会越走越窄。 部分运维遇到的困难是:有的连书都不懂;有的书是可以看懂,别人写的简单代码也可以
转载
2024-04-10 10:30:20
26阅读
HULK虚拟化团队 360云计算女主宣言本文出自HULK虚拟化团队,该文主要是该团队与汽车之家和新浪交流分享的一个记录,整体分享不同于大会类型的高大上(吹bi性质),更多的是接地气,分享议题范围比较广泛,包括:资产管理,监控,代码发布,容器化,虚拟化,混合云,智能运维等,该文主要是先抛出一些我们团队的关注点,如果大家有对相关议题感兴趣的,可以留言回复,我们可以详细交流。PS:丰富的一线技术、多元
原创
2021-03-22 15:47:34
466阅读
本着开放共赢的精神,addops团队分别组织并参加了与“汽车之家”、“新浪”的技术交流分享会。此次交流不同于
原创
2021-08-04 14:40:29
878阅读
编辑Linux实用运维脚本分享?MySQL备份目录备份PING查询磁盘IO检查性能相关进程相关javadump.sh常用工具安装常用lib库安装系统检查脚本sed进阶编辑MySQL备份#!/bin/bash
set -e
USER="backup"
PASSWORD="backup"
# 数据库数据目录 #
DATA_DIR="/data/mysql"
BIN_INDEX=$DAT
原创
精选
2023-08-17 22:56:42
934阅读
点赞
1评论
我的运维心得分享
原创
2016-06-16 11:23:43
3239阅读
点赞
10评论
Kubernetes 4000 节点运维经验分享
转载
2022-04-07 11:11:47
291阅读
网站的日志文件随着每天的访问记录积累,会越来越大,特别是大型网站。
日志越来越大不仅影响储存容量从而影响网站性能,而且对我们做日志分析造成困难。
因此,我要对日志进行规范整理。
原创
精选
2016-12-08 16:56:38
1073阅读
点赞
Linux实用运维脚本分享
原创
2023-10-06 10:30:35
114阅读