kkltkklt的最近发布

第三篇：深入核心 - 解剖 Velero 的“三大法宝”：Schedules, Hooks & VolumeSnapshots

系列文章：《Velero ：Kubernetes 世界的“后悔药”与“救生艇”》第三篇：深入核心 - 解剖 Velero 的“三大法宝”：Schedules, Hooks & VolumeSnapshots本篇焦点：Schedules：从手动执行到自动化、周期性的备份策略，实现“一劳永逸”。Hooks：学习如何在备份前后执行自定义命令，解决数据库等应用的数据一致性难题。VolumeSnap

nginx

数据

Pod

原创 7天前 46 阅读 yyds干货盘点

第二篇：实战入门 - 部署你的第一个 Velero 并完成一次“时空穿越” 本篇焦点：

系列文章：《Velero ：Kubernetes 世界的“后悔药”与“救生艇”》第二篇：实战入门 - 部署你的第一个 Velero 并完成一次“时空穿越”本篇焦点：在本地安装 Velero 客户端（CLI）。以 AWS 为例，准备 Velero 所需的云资源（S3 存储桶与 IAM 用户）。在 Kubernetes 集群中成功部署 Velero 服务端组件。完整地执行一次“备份 -\> 模拟

nginx

AWS

html

原创 8天前 51 阅读 1点赞 yyds干货盘点

第一篇：为什么需要 Velero？Kubernetes 备份的困境与曙光

系列文章：《Velero：Kubernetes 世界的“后悔药”与“救生艇”》第一篇：为什么需要 Velero？Kubernetes 备份的困境与曙光本篇焦点：直面在 Kubernetes 中管理有状态应用时，数据丢失的真实风险。剖析 etcd 备份的局限性，解释为何它不足以保护我们的应用数据。建立 Velero 的核心价值认知：它是一个真正的、为云原生时代设计的“救生艇”。概览 Velero 的

数据

元数据

数据丢失

原创 9天前 75 阅读 yyds干货盘点

SRE 命令行兵器谱之终章：一次完整的线上故障复盘

SRE 命令行兵器谱之终章：一次完整的线上故障复盘SRE 的“战场”：风暴前夜周五下午四点，一个看似平常的时刻。突然，监控系统告警墙亮起一片红色：告警一 (核心指标): API Service P99 Latency > 3000ms (API 服务的 99% 请求响应时间超过 3 秒)告警二 (用户体验): Web App Error Rate > 5% (Web 应用错误率超过 5

数据库

API

mysql

原创 10天前 49 阅读 yyds干货盘点

tcpdump - 终极网络“窃听器”，在数据包层面揭示一切真相

SRE命令行兵器谱之七：tcpdump - 终极网络“窃听器”，在数据包层面揭示一切真相SRE的“战场”：真实故障场景一个新上线的“报表服务”需要连接后端的MySQL数据库，但总是连接超时。你已经用尽了浑身解数：在报表服务器上 ping db.example.com，网络是通的。用 dig db.example.com 查询，DNS解析出的IP地址 10.0.0.8 完全正确。你甚至让网络团队检查

IP

TCP

服务器

原创 11天前 88 阅读 yyds干货盘点

dig - 深入DNS的骨髓，诊断域名解析疑难杂症

SRE命令行兵器谱之六：dig - 深入DNS的骨髓，诊断域名解析疑难杂症SRE的“战场”：真实故障场景市场部刚刚上线了一个新的活动域名 promo.example.com，但多个城市的同事反馈页面无法访问，浏览器提示“无法找到服务器地址”。然而，你在公司的办公室里测试却一切正常。开发团队检查了服务器和应用，确认服务正在运行。运维团队也确认了Nginx配置无误。所有的证据都指向了一个“幽灵”般的问

DNS

服务器

.net

原创 12天前 69 阅读 yyds干货盘点

curl - 网络世界的“瑞士军刀”

SRE命令行兵器谱之五：curl - 网络世界的“瑞士军刀”SRE的“战场”：真实故障场景“订单服务”的开发团队报告，他们调用“库存服务”的deduct（扣减库存）接口时，频繁收到超时错误。他们认为是库存服务出了问题。而“库存服务”的团队检查日志后，坚称他们的服务一切正常，没有收到任何异常请求。作为负责维护平台稳定性的SRE，你需要介入调查，成为那个公正的“法官”。问题到底出在哪里？是订单服务发出

HTTP

服务器

数据

原创 13天前 201 阅读 yyds干货盘点

sed & awk - 日志分析中的“数据手术刀”

SRE命令行兵器谱之四：sed & awk - 日志分析中的“数据手术刀”SRE的“战场”：一个更棘手的真实故障紧急警报！运营团队发现，网站上的商品图片有部分无法显示。初级监控显示Nginx返回了大量 502 Bad Gateway 错误，但这次情况更复杂。为了方便调试，开发团队曾在Nginx日志的末尾追加了一个自定义的 details 字段，所有关键信息都“塞”在了这个非结构化的字符串

sed

IP

数据

原创 14天前 60 阅读 yyds干货盘点

grep - 日志海洋中的“精确制导”

SRE命令行兵器谱之三：grep - 日志海洋中的“精确制导”SRE的“战场”：真实故障场景客服团队反馈，用户（ID: u-1a2b3c）刚刚有一次下单操作失败，页面提示“系统内部错误”。为了安抚用户并定位问题，你需要在5分钟内从由几十个微服务组成的复杂系统中，找出这次失败请求的根本原因。每个微服务都在持续不断地打印日志，分布在多台服务器上。这次请求的ID u-1a2b3c 是你手中唯一的线索。手

搜索

3c

微服务

原创 15天前 70 阅读 yyds干货盘点

lsof - 解密“端口被占用”与“文件句柄泄漏”的终极侦探

SRE命令行兵器谱之二：lsof - 解密“端口被占用”与“文件句柄泄漏”的终极侦探SRE的“战场”：真实故障场景凌晨1点，你被一阵急促的告警声惊醒。新版本的核心应用A在生产环境发布失败，CI/CD平台挂着一个刺眼的红色“Failed”，日志的最后一行赫然写着：java.net.BindException: Address already in use。这是一个SRE职业生涯中必定会遇到的经典场景

文件句柄

java

80端口

原创 16天前 60 阅读 yyds干货盘点

精通top/htop - 从性能“体检”到瓶颈“解剖”

SRE命令行兵器谱之一：精通top/htop - 从性能“体检”到瓶颈“解剖”SRE的“战场”：真实故障场景下午三点，监控系统告警：“核心API服务响应时间（P99）飙升至5秒”。用户已经开始在群里抱怨接口超时。这是一个典型的线上性能问题，每一秒的延迟都在影响用户体验和公司收入。作为负责的SRE，你登录到服务器，敲下的第一个命令，几乎必定是 top。你的大脑已经准备好回答几个核心问题：系统是否过载

mysql

数据库

服务器

原创 16天前 88 阅读 yyds干货盘点

像SRE一样思考——命令行不只是工具，更是你的战友

SRE命令行兵器谱之思想篇：像SRE一样思考——命令行不只是工具，更是你的战友欢迎来到《SRE命令行兵器谱》系列。在深入研究 grep, lsof, tcpdump 这些强大“兵器”的细节之前，我们必须先回答一个更重要的问题：一个SRE（网站可靠性工程师）在黑色的终端窗口前，脑子里想的到底是什么？他和一个普通Linux用户的最大区别，不在于知道多少个冷门的命令参数，而在于他对待生产环境的态度——那

命令行

IP

服务器

原创 17天前 64 阅读 yyds干货盘点

终极实战 - 全链路排查一次“502 Bad Gateway”

《网络迷踪：SRE的TCP/IP故障排查艺术》系列最终篇：终极实战 - 全链路排查一次“502 Bad Gateway”“案发现场”：现在是周二上午10点，正值业务高峰。监控系统突然亮起一片红色，同时，你的即时通讯软件开始被雪片般的报警信息淹没：“核心业务webapp.mycompany.com出现大量502错误！”用户反馈，网站时而可以打开，时而显示一个冰冷的错误页面，上面写着“502 Bad

Nginx

服务器

IP

原创 18天前 383 阅读 yyds干货盘点

流量迷局 - 理解负载均衡(L4/L7)与CDN背后的“隐形路由”

《网络迷踪：SRE的TCP/IP故障排查艺术》系列第六篇：流量迷局 - 理解负载均衡(L4/L7)与CDN背后的“隐形路由”“案发现场”：你在排查一个问题时，让用户提供他ping你服务域名的结果。在北京的用户，ping app.mycompany.com，显示的IP地址是 111.222.1.100。在广州的用户，ping同样一个域名，显示的IP却是 111.222.2.200。更奇怪的是，这两个

IP

服务器

负载均衡

原创 19天前 154 阅读 yyds干货盘点

加固城防 - 用nmap和iptables审计你的网络安全

《网络迷踪：SRE的TCP/IP故障排查艺术》系列第五篇：加固城防 - 用nmap和iptables审计你的网络安全“案发现场”：你刚刚部署了一台新的应用服务器，并按照文档，在防火墙上只开放了80和443端口。一周后，安全团队在进行例行扫描时，突然给你发来一个高危告警：“你的服务器10.0.0.10上，发现了一个对外开放的Redis服务（端口6379），并且没有密码保护！”你大吃一惊：“这不可能！

服务器

Redis

redis

原创 19天前 102 阅读 yyds干货盘点

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客