前言之前导师给我推荐了这篇文章,当时不以为然(ps:当时沉迷算法导论写ACM),现在包括从校招的情况来看,还是要走运维的路线,所以记录学习一下,而且在阿里面试系统工程师的时候,也被星芒师兄问到了这个问题,当时答的乱七八糟,悔不当初啊,原文链接:First 5 Minutes Troubleshooting A Server, 中文翻译:在服务器上排除问题的头五分钟尽可能搞清楚问题的前因后果不要一下
转载
精选
2016-06-27 15:01:00
585阅读
尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白这台服务器有多少已知的情况,还有故障的具体情况,不然你很有可能是在无的放矢必须要搞清楚的问题:故障的表现是什么?无响应?报错?故障是什么时候发现的?故障是否可以重现?有没有出现的规律(比如每小时一次)最后一次对整个平台进行更新的内容...
转载
2014-08-29 14:47:00
49阅读
2评论
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如 CNN 或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。 遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手: 一、尽可能搞清楚问题的前因后果 不要一下子就扎到服务器前面,
转载
精选
2014-07-31 22:35:15
271阅读
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对
转载
精选
2015-09-07 02:58:26
256阅读
英文原文:First 5 Minutes Troubleshooting A Server,编译:@老码农的自留地 我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如 CNN 或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。 遇到服务器故障,问题出现的原
转载
精选
2013-03-29 14:28:25
597阅读
一、尽可能搞清楚问题的前因后果
不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况。不然你很可能就是在无的放矢。
必须搞清楚的问题有:
故障的表现是什么?无响应?报错?
故障是什么时候发现的?
故障是否可重现?
有没有出现的规律(比如每小时出现一次)
最后一次对整个平台进行更新的内容是
转载
精选
2013-04-13 16:38:10
304阅读
遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况。不然你很可能就是在无的放矢。必须搞清楚的问题有:故障的表现是什么?无响应?报错?故障是什么时候发现的?故障是否可重现?有没有出现的规律(比如每小时出现一次)最后一次对整个平台进行更新的内容是什么(代
转载
精选
2014-12-15 11:15:55
249阅读
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对
转载
精选
2015-08-30 10:48:26
996阅读
点赞
1评论
遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况。不然你很可能就是在无的放矢。必须搞清楚的问题有:故障的表现是什么?无响应?报错?故障是什么时候发现的?故障是否可重现?有没有出现的规律(比如每小时出现一次)最后一次对整个平台进行更新的内容是什么(代
转载
精选
2014-04-06 17:07:43
407阅读
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:▼尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对这
转载
精选
2015-08-27 10:10:45
453阅读
点赞
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对
转载
精选
2015-09-05 18:06:04
273阅读
点赞
在服务器上排除问题的头五分钟服我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎
转载
精选
2016-10-18 11:05:18
567阅读
点赞
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到服务器故障,问题出现的原因很少可以一下就想到。我们基本上都会从以下步骤入手:一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对
原创
2017-08-18 17:57:31
352阅读
程序员的成长之路互联网/程序员/成长/职场我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到...
转载
2019-11-26 00:00:00
104阅读
我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深……
转载
2021-07-06 13:38:02
133阅读
点 的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。遇到...
转载
2021-07-18 22:42:37
36阅读
一、尽可能搞清楚问题的前因后果不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况。不然你很可能就是在无的放矢。必须搞清楚的问题有:故障的表现是什么?无响应?报错?故障是什么时候发现的?故障是否可重现?有没有出现的规律(比如每小时出现一次)最后一次对整个平台进行更新的内容是什么(代码、服务器等)?故障影响的特定用户群是什么样的(已登录的, 退出的, 某个地域的
转载
精选
2014-08-22 14:45:52
412阅读
一、前言二、简介三、具体过程尽可能搞清楚问题的前因后果有谁在?之前发生了什么?现在在运行的进程是啥?监听的网络服务CPU和内存使用情况查看硬件I/O 性能挂载点和文件系统内核、中断和网络系统日志和内核消息任务计划查看具体应用的系统日志四、总结注,测试环境:操作系统 CentOS 6.4 x86_64。一、前言原文链接:http://devo.ps/blog/2013/03/06/troublesh
翻译
精选
2013-12-30 17:16:51
4598阅读
点赞
4评论
目录:一、前言二、简介三、具体过程尽可能搞清楚问题的前因后果有谁在?之前发生了什么?现在在运行的进程是啥?监听的网络服务CPU和内存使用情况查看硬件I/O 性能挂载点和文件系统内核、中断和网络系统日志和内核消息任务计划查看具体应用的系统日志四、总结注,测试环境:操作系统 CentOS 6.4 x86_64。一、前言原文链接:http://devo.ps/blog/2013/03/06/troubl
转载
精选
2014-08-19 17:48:49
358阅读
出自 http://freeloda.blog.51cto.com/2033581/1346789一、前言二、简介三、具体过程尽可能搞清楚问题的前因后果有谁在?之前发生了什么?现在在运行的进程是啥?监听的网络服务CPU和内存使用情况查看硬件I/O 性能挂载点和文件系统内核、中断和网络系统日志和内核消息任务计划查看具体应用的系统日志四、总结注,测试环境:操作系统 CentOS 6.4 x86_64。
转载
精选
2015-07-16 08:32:17
502阅读