本月初,受托前往大漠某供电局实施系统灾备。从烟台起飞,到呼和浩特中转,内蒙古范围内还要坐小飞机。等到目的地机场,是傍晚5点多,天黑了,这是小机场,偏僻,出租车都很少,用滴滴查看,周围几公里都无车可叫。正好看见一辆大巴(车其实很小,比中巴稍微大一点),管它呢,先上车。片刻,司机准备发车。由于天气太冷,居然无法挂挡,折腾好一阵,也不行。司机打电话求助,来了三个人,也没解决,看着时间,已经滞留了一个多小时。有位修车的提议,把车厢中部一个盖子打开,直接安排一个人在那里,用一根铁杆翘底部传动机构挂挡。司机前面喊:“挂二档”,后边就搬一下,总算能开走了,由此有种预感,此处办事,可能会不太顺利。

按照计划,应该是我到的第二天,服务器就应该到实施机构的。第二天吃了早餐,就赶紧联系对方,问是否收到设备。答复说没见到,再问发货方要单号,支吾半天没给。后来得知,是根本没发货。白白耗了两天(到目的地后),才收到货!

是一台某想的2U服务器(本人十分反感这个品牌),型号是SR550。两颗cpu,4根16G内存(共64G容量);4块7200转sata硬盘。委托方交代,说是安装好了centos 7系统。我对厂商或者供货商安装的系统从来不放心,再去现场前的前一天晚上,自己下载了一个centos 7.5的ISO镜像,并用ultraISO刻录成可引导盘。
大漠折戟--记一次不顺利的灾备项目实施经历

服务器最终安放的场所是内部机房的机柜,按照规定,服务器所在的机房不能连公网,连办公网也不能与之连接。为了方便调试,客户方给我找了一间办公室,服务器放在窗台上,连接网络以后,是可以上公网的,这方便下载相关的依赖,而且能从工位上,用笔记本进行远程管理。等到调试没问题以后,更改ip地址成最终使用的,就可以搬到机房的机柜里。

接上电源、网线、显示器等,开机,果然安装了系统,嗯,centos开始加载...卡住不动了,再启,还是这样。看来供货商为了应付了事,匆忙安装,胡乱应付了事。

仔细查验为啥安装后,系统启动不了。发现四个硬盘,有两块亮黄灯。初步判断硬盘有问题,进bios查看,磁盘状态有两块显示的是ubad,其它亮绿灯的两块的状态是ugood。果然是坏了,拔出来,换槽位,还是这两个硬盘不正常。评估了一下客户的源系统容量,单块4T 的盘就足以容纳。于是就拔掉坏掉的盘,重新把每个盘都做成raid 0(不做raid,不能被识别)。

后台支持告诉我,那个灾备软件,目前对centos 7.2 兼容较好,对于centos 7.2以后的版本,还没做过规模化测试。因此建议安装centos 7.2 .我下载了两个版本的centos。开始用centos 7.2的引导,不能识别硬盘,如此几次,还是如此。大漠折戟--记一次不顺利的灾备项目实施经历
通过咨询某想技术支持,答复让安装windows或者centos 6以前的版本,否则驱动不好办。这个破玩意,兼容性真差,越发鄙视这个品牌。

换成centos 7.5 ,引导后,识别了两个4T的sata盘,安装得以正常进行。也能连接网络,切换到笔记本,远程管理这个系统。上传灾备软件,并进行了配置。还好,软件功能正常。这么一阵折腾,一天就过去了。

第二天,继续去现场。这天的安排是修改ip地址为最终使用地址,然后上架。为预防断网,直接在服务器上改好地址,关机。把服务器搬到机架,插上电源、网线、显示器等(不能从别的办公室远程连接,只能直接连显示器查看运行状态)。登录系统,ping网关地址,不通。以为设置不对,仔细核对,没问题啊!用ethtool检查,四个网口都是未连接状态。又把网络接口文件ifcfg* 检查一遍,担心onboot的值不是yes。

到机柜后部去查看网卡指示灯的状态,不亮,连黄灯都没有。换一个网卡,回到系统,重新配置网络,把ip地址配置到该接口,重启网络,还是不行。旁边有个客户,一直在盯着干活,压力有点大。没办法,使出大招,在机柜上重装系统,装完,网卡灯还是不亮。热心的客户,还用手机给我搜怎么解决网络问题,弄得我很难堪。就这样,一天又过去了。
大漠折戟--记一次不顺利的灾备项目实施经历

一大早,委托方让我直接给某想的技术支持电话。我通过加微信,让其远程协助。对方告诉我,这服务器的网卡,只能是千兆的,百兆的不能识别。在我的认知中,网卡不都是自适应的么?只好按他的说法,去问客户的负责人,了解到机房网络确实是百兆。我也通过查看服务接入的交换机品牌和型号,也证实了是百兆网络。于是我有个疑惑,为啥在办公室网络能正常工作,答曰:“办公室那里是千兆接入”。我看机房堆了一对设备,希望能从里边找到一个千兆交换机。还真找到一个只有两口的千兆交换机(其它为百兆口),又碰巧找到一根蓝色的六类线。赶紧跑到机柜后边,把此交换机连到服务器上,灯亮了!
大漠折戟--记一次不顺利的灾备项目实施经历
从系统看,亮灯的网卡状态显示link。再把机柜出来那根网线,接在这个千兆交换机的任意端口,灯亮。然后再继续ping服务器设定的网关,不通,再试其它同网段服务器ip,还是不通。担心是交换机设置vlan的问题,请客户帮忙,拿笔记本连接到此交换机,访问某想服务器,网络不通;而此笔记本通过此交换机再连接网关,正常。

只想尽快完成任务,电话请同来的销售代表帮忙,去市场上买一个全千兆的傻瓜交换机。买回来,接上,网卡指示灯亮着,但网络还是不通。试着换网口插,并把ip地址配置也配置其上。直到换到第四个网口的时候,网络通了。好吧,告诉客户,就暂时用这个吧。
大漠折戟--记一次不顺利的灾备项目实施经历
后边,部署和设置灾备不表。

本来预计半天齐活,结果人到了三天,设备才到。再加上这等垃圾服务器,兼容性太差,把大量的精力耗费在处理硬件与系统故障上,真是不爽之极,耽误了大量的时间。

以后出门干活,一定要问清楚情况,如果是某想的设备,宁可不挣这个钱,也拒绝去实施。如果有人问我推荐服务器,此品牌绝对是弃用之列。