2012-11-30我的运维生涯第3个错。

错误一:uninstall mysql

        解决办法:tube发现用户安装的mysql路径和我们的不同。然后根据原来的路径找到了数据。Tube说这是狗屎运。。。。。。

        铭记:要备份,备份,备份。。。。。

              数据库的操作一定要谨慎谨慎再谨慎。。。

    

错误二:告诉用户明天周末我休息。

        铭记:我们是7*24小时服务。绝对没有休息时间。。。。。。

 

昨天晚上查看系统发送有没关闭的工单。

看到有个单号没有关闭

单号说明是配置lnmp环境。

我登录到客户机器执行了netstat –lntp看到用户确实没有配置环境。

然后就给一键安装了一套lnmp

之后用户网站崩溃了。

今天一大早发现了客户回馈的一堆崩溃信息。

我的第一反应是我完蛋了。我的运维生涯要结束了。这才开始20天。

因为netstat –lntp 查不出来用户在跑的任务。之前我是不知道的。

现在需要研究一下netstat –lntp命令的用法

总结:以后登录用户机器时,

1.history看用户做了哪些操作。如果用户动过。请用户重置环境交给我们配置。

2. netstat –lntp看显示网络状态。

      -l--listening 显示监控中的服务器的Socket

      -n--numeric 直接使用IP地址,而不通过域名服务器。
-N
--netlink--symbolic 显示网络硬件外围设备的符号连接名称。

      -t--tcp 显示TCP传输协议的连线状况。

      -p--programs 显示正在使用Socket的程序识别码和程序名称。

3.service httpd status

    Service mysqld status

    …….

    查看服务的状态

4. ps –ef | grep httpd

  Ps –ef | grep mysqld

  …….

 看到是否有进程

 

今天用户的网站崩溃之后。我非常紧张。

我没有敢做任何操作,也不知道该做任何操作。

马上打电话给了我们的技术经理tube

Tube说遇到问题不要慌。不要害怕。先想一下如何解决问题。

然后非常淡定的帮我分析。

1.       由于是lnmp环境。

  我们默认的网页目录是/home/wwwroot

2.       正好原站的数据迁移也是我做的。但是客户发了2个工单。一个申请数据迁移,一个申请环境配置。

3.       我们找到原先迁移的网站文件在/var/www下面。文件还在。

4.       Tube说配置个nginx的虚拟主机把虚拟目录指向/var/www就可以解决了。

但是解决的过程中发现新的数据库mysql是没有文件的。

5.       我们启用了新的数据库。然后把截至到30号的用户数据备份导入到了新的数据库中。

6.       我发现mysql2个数据库都存在。

7.       但是2nginx不知道是怎么回事。到底新nginx有没有覆盖老的nginx?是2个并存还是只存在一个???

排错的过程中发现有280端口在使用。Nginx的端口号80.

无法start nginx

解决办法

1.# lsof -i:80

2.kill掉所有lsof列出的占用80端口的进程号。

3.脚本启动nginx

  /etc/init.d/nginx stop

  /etc/init.d/nginx start

8.       报错了301错误。重定向问题。错误 310 (net::ERR_TOO_MANY_REDIRECTS):重定向过多

 

出错感言:

1.       感谢耐心沉稳的领导tube,在第一时刻他告诉我不要害怕,要冷静的分析问题。还说了一句,我马上到公司,你先看一下错误日志报什么错。

2.       感谢热心的战斗在第一线的兄弟姐妹,他们在我非常紧张的情况下热情的帮我解决问题,分析问题,想办法。

3.       通过今天的错误我学到了很多东西。今天是做运维以来最痛苦的一天也是最开心的一天。

 

后记:最后的解决办法是用户重置机器,丢失了一周的数据。铭记于此!!!我的痛!!!