阿铭Web运维实战
从理论到实战的Web运维知识体系
共15篇 | 阿铭linux
¥51.00 656人订阅
新人大礼包
小程序订阅 省¥12
专栏介绍
运维的核心能力是什么,不是你学过多少技术点,看过多少本书,而是解决问题的能力,当问题出现的时候,能够准确、高效、迅速的定位问题,解决问题,这才是运维最核心的竞争力,无论是小企业,还是大型企业,对运维的价值,都体现在解决问题的能力上。
那么如何提高运维人员解决问题的能力呢,一方面是要有充足的知识储备,另一方面还必须要有解决问题的思路,当问题出现的时候,如何根据所学的知识,结合问题的现象,一步一步抽丝剥茧,找出问题出现的原因,是本专栏给大家介绍的核心内容。
本专栏汇聚了作者10多年来工作经验的总结,作者将多年来运维工作中出现的一些典型故障进行提炼和归纳,通过15个具体的应用案例来分析每个问题出现的现象、原因以及解决的思路,需要说明的是,案例是陪衬,学习解决问题的思路才是专栏的核心,通过对这些案例的学习,读者可以学会对待具体问题的处理思路和方法,迅速提高自己的实战能力。
专栏入口
专栏订阅成功后,即可通过以下4个途径永久阅读
1.“51CTO订阅专栏”小程序端
2.“51CTO”微信服务号端
3.“51CTO博客”web端
4.“51CTO学院”Android App端
专栏目录
一、故障排查
1.Linux系统故障问题案例汇总(无法启动、忘记密码、丢失文件等)
2.偶遇"Too many open files"错误分析与处理实录
3.Linux遭遇"Read-only file system"错误分析与处理实录
4.不听话的Crontab,记一次Crontab计划任务失败案例
5.因OpenStack物理机故障引起的Linux系统无法启动案例
6.Linux系统内存又被吃光了,它去哪里了,记一次内存占用问题调查记
二、系统安全
7.回顾与总结:服务器遭受攻 击后的处理措施
8.IDC服务器遭遇黑 客侵入后的解决方法与原因分析案例
9.Linux后门入 侵检测工具chkrootkit、RKHunter应用案例
10.云服务器被植入挖矿病毒的处理与原因分析案例
三、性能调优
11.菜鸟运维初成长,记一次上线Linux服务器基础优化案例
12.对某电商平台动、静态网站的优化分析案例
四、运维案例
13.远离MySQL的MyISAM,记一次MySQL数据库故障的处理与原因分析
14.一次Java应用OutOfMemoryError故障的处理与原因分析
15.一次Java进程占用CPU过高问题的排查方法与案例分析
适用人群
1.Linux运维工程师
2.大数据分析工程师
订阅说明
1.本专栏为图文专栏,共计15篇
2.专栏定期更新,现已更新完毕
3.专栏一经订阅永久阅读, 可与作者留言互动
4.本专栏为虚拟产品,一经订阅,概不退款,请慎重订购
5.专栏阅读过程中,如有任何问题请联系51CTO小助手(微信:cto51boke/QQ:3591348659)
学习本专栏您能收获什么
1.故障排查:常见/经典运维故障的解决方案
2.系统安全:阻止网络攻 击,创建安全的Linux系统
3.性能调优:Linux服务器性能分析原则和优化方法
4.运维案例:15个运维实例学习解决问题的思路
专栏目录
前阵子有句话一直很流行,叫“知道了很多道理,却依然过不好这一生”,我们也经常拿这句话来打趣自己和身边的运维朋友。
1.Linux系统故障问题案例汇总(无法启动、忘记密码、丢失文件等)
处理linux系统故障的思路作为一名优秀的linux运维工程师,一定要有一套清晰、明确的解决故障思路,当问题出现时,才能迅速定位、解决问题,在开始本专栏学习之前,我根据多年工作和处理问题和故障的经验,总结出了一套处理问题的一般思路,供大家参考
2.偶遇"Too many open files"错误分析与性能调优实录
接到客户电话,说web后台不能添加数据了,只要添加数据就提示http500内部服务器错误,于是,赶紧登录系统查看日志。
3.“Read-only file system”错误与Linux日志文件系统故障案例分析
这个问题做运维的同行应该基本都遇到过,出现文件系统只读,可能是有如下原因导致的:磁盘故障,比如磁盘损坏。
4.不听话的crontab,一次crontab计划任务失败入坑记
一大早刚上班,研发同事跑过来说昨天的数据分析报告没有出来,他们查看了数据分析程序没有问题,让运维看看是怎么回事,于是,感觉登录服务器看看情况
5.一次触发OOM Killer导致系统故障案例以及Linux内存管理机制探究
现在是凌晨3点钟,已经醒来的我非常烦躁,谁这么晚打电话骚扰,起身拿起电话正准备训斥这个打电话的人,然而查看号码,发现是我们监控系统自动打过来的电话,好嘛,看来又不能睡个好觉了,根据监控系统发送过来的语音提示,是我们的一个线上数据分析应用出现了问题。作为一个经验丰富的运维老鸟,我首先打开煮茶器,这是正确处理问题的第一步。一杯绿茶在手之后,现在可以开始处理故障了。
6.一次OpenStack物理机故障而引发的故障排除追踪实录
一大早刚上班来,团队的同事说客户的一个私有云主机故障了,一个节点无法启动,于是赶紧跟进了解了一下情况
7.网站被植 入webshell导致网站瘫痪案例以及web安全防范策略
接到了客户打来的电话,说他们的网站挂(这个用词很不准确,但是感觉到问题的严重性)了
8.云服务器被植入挖矿病毒案例实录以及如何做redis安全防范
现在是周五下午6点,已经下班,正准备收拾东西回家,突然电话铃声响起,来电的是我们的一个客户,告诉我说他们的一个线上秒杀系统不能用了,看来又要加班了,这就是运维工程师的生活啊,想准点下班一次,都难啊!这难道就是所谓的黑五吗?
9.Linux后门入 侵检测工具RKHunter、ClamAV的使用以及应用案例
rootkit是Linux平台下最常见的一种木 马后门工具,它主要通过替换系统文件来达到攻 击和和隐蔽的目的,这种木 马比普通木 马后门更加危险和隐蔽,普通的检测工具和检查手段很难发现这种木 马。
10.服务器遭受攻 击后的处理措施以及SYN Flood、CC攻 击防御策略
安全总是相对的,再安全的服务器也有可能遭受到攻击。作为一个安全运维人员,要把握的原则是:尽量做好系统安全防护,修复所有已知的危险行为,同时,在系统遭受攻击后能够迅速有效地处理攻击行为,最大限度地降低攻击对系统产生的影响。
11.菜鸟运维初成长,记一次线上Linux服务器基础优化案例
从一个新手到接触线上应用环境,是需要技术和经验积累的,本文要给大家分享的就是我们公司对服务器上线部署、基础优化的一些操署、升级
12.系统性能调优规范以及对某电商平台动、静态网站的优化分析案例
系统的性能是指操作系统完成任务的有效性、稳定性和响应速度
13.一次java进程占用CPU过高问题的排查方法与案例分析
不久前的一个客户案例,客户的一个门户网站系统是基于java开发的,运行多年,一直正常,而最近经常罢工,频繁出现java进程占用CPU资源很高的情况,在CPU资源占用很高的时候,web系统响应缓慢
14. 记一次MySQL数据库故障的处理与原因分析以及存储引擎的选型
趁着现在有时间,赶紧总结下上周给客户处理的一个MySQL故障问题,这个事情可谓是一波三折,觉得很有学习和借鉴意义,所以记录下来分享给大家。
15. 一次Java应用OutOfMemoryError故障的处理与JVM内存机制探究
现在是周五23:40分,可恶的告警又响起了,拿起电话,发现是公司hadoop平台发过来的告警,告警内容是hadoop 20多个计算节点进入了黑名单,所谓进入黑名单,就是此节点发生了不可预估的异常,无法提供计算服务了,然后hadoop就将这些节点剔除分布式计算集群了,剔除后自动进入黑名单中。
支付成功
加入作者互动群
和作者近距离提问 &交流 &互动
扫描二维码 回复 ZL024 + 昵称 入群