服务器故障,能够第一时间发现并处理,是每一个网管都希望能够做到的事情。相对于软件故障,服务器硬件故障更让我们担心。服务器运行超过3年以上,硬盘、内存、电脑每一个组件都会让我们心惊肉跳。尤其是硬盘,故障率高,虽然有RAID保护,但如果一块硬盘损坏未及时发现,再坏一块硬盘将会付出惨重的代价。以RAID5为例,坏一块硬盘后,剩余硬盘压力会很大,如果没有热备盘或及时更换,很容易造成下一块硬盘的损坏。笔者曾亲历过2次1块硬盘损坏未及时发现,另一块硬盘再度损坏的场景。(还好有备机和数据备份,及时还原,仍是一身冷汗)。出了这种问题,数据是否可及时还原,还原后与原系统是否完全一致?不想承担这样的风险,就最好能及时监控、预警、处理,把大代价减成小代价。

     因此硬件故障后及时预警处理,就成为网管最希望达到的效果。目前市面上已经有很多商用的监控软件平台,但单从硬件的角度来说,笔者认为主流服务器厂商自带的监控管理平台更好用、简洁、廉价。如DELL的IDRAC和HP的ILO平台等。

     以DELL为例,为大家介绍一下IDRAC的功能和使用,注意:不论是DELL还是HP,远程管理模块都是可选件,在新购服务器时建议都选上,毕竟价格不贵(几百元搞定)。否则等需要时再去购买,安装配置都会比较麻烦,作为生产环境你一定不希望你的服务器关机或重起。

     DELL的远程管理卡在服务器的后面,写着IDRAC字样的网口就是,默认IP:192.168.0.120,账户:root 初始密码:calvin。用笔记本连上网线,将本的IP设成同一段,在IE中输入https://192.168.0.120即可看到登录界面。 管理地址可更改,建议新构网络时直接规划一个管理网段。

如下图:

1. 当前最新版本是enterprise7版本。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管

2. 输入用户名密码后:

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_02

 

3. 点击右边,启动按钮,看到如下图:

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_03

4.点击运行,即可看到远程桌面。此远程桌面通过IE打开,且是https加密码,安全性要比操作系统自带的远程桌面要安全得多。

       注意:初次登录要在IE中将此地址加入受信站点,并且开放ActiveX功能,才能正常打开。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_04

 

5. 点击上图中的宏按钮,点击ctrl+alt+del按钮,即可正常登录操作系统。采用此功能就不再需要开放微软的远程桌面了,安全性更好,同时对linux等操作系统也同样可远程管理。是不是很酷?……^_^

     比远程桌面更强大的是,此远程管理不光可看到操作系统桌面,还能远程重起进入BIOS,远程安装操作系统,即你在机房内直连到服务器的一切重起配置工作,在此管理界面都可完成。如果你的机房离办公地点比较远,那么除了更换硬盘、内存这些配件外,其他的所有配置调试工作你都可以远程完成了,你再也不用因为一点小事往机房跑了,你也不会因为服务器重起后没有起来,而不知所以。所有DOS界面下的东东,这里都可以呈现。

(下一章我会单独介绍一下如何远程进入BIOS及安装操作系统)

6.在管理概览页面,向下拉,可以看到服务器信息,如下图:

   这里服务器型号,操作系统版本、服务标签、快速服务代码等全部在这里了,你以后打DELL电话报修,再也不用趴到服务器上去找代码信息了,这里面全有了。

 

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_05

 

7.再往下拉,就是你最希望看到的:一列赏心悦目的绿勾,硬件日志:

看到这些,你的硬件CPU、硬件、内存等就没有任何问题,你就可以安心做其他工作了。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_06

 

8.再看左侧导航栏中的一些详细功能:

    电源功率、温度等信息在右边不同的标签页都可以看到,还可以手工设置报警值。这么详细的功能很人性化,硬件厂家自带的功能,你根本不用担心它的准确性。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_07

 

9. 虚拟控制设置,就是刚才看到的远程桌面具体配置,非常好懂的,自己看吧。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_08

 

9.警报功能: 这个功能很重要,当你的服务器很多时,每天都登上来看也很麻烦,那么不妨设置一下警报设置,这样当硬件出现问题时,你会收到一封通知邮件,警报设置如下图:

     首选选择已启用,警报筛选器中:具体哪些问题需要触发警报,自己选一下吧,如果你嫌鸡毛蒜皮的小事都给你发邮件比较烦,那么可以少选些,把严重勾选,只有标识为严重的问题才会触发警报。

这个根据实际情况自行定义哦!

     其他不太了解的选项就不要选,不要因为设置不当导致你的服务器重起。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_09

 

10. 下面这个是警报的邮件设置:

        下图这个设置,是当你有统一的SNMP管理平台时,需要设置的,它会把警报信息发给你SNMP网管理平台,然后由SNMP网管平台统一会发警报信息。如果没有SNMP统一网管那么继续往下看。

(DELL自带了一个免费统一网管软件,很好用。如果你的服务器很多,每天每台服务器都上来查看一遍也很浪费时间,那么可以安装此软件管理。以后的文章中再单独讲。)

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_10

 

11. 在上图中,继续往下拉,看到下面:

     下图就是你这台服务器需要发送警报的邮件地址设置了,输入SMTP地址,用户名密码,点击右边的应用即可生效。如果你的服务器不是很多,又没有统一的SNMP管理平台,可以在这里面来设置一下。(前提条件是你的管理网段能够向外面去发送电子邮件哦!相关端口要开放)

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_11

12.下面的配置比较重要:前面说过IDRAC卡的IP是可以自己修改的,就在如下界面下修改:

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_12

 

13. 在“硬件”导航栏里,所有的硬件详细信息,你都可以一目了然,以内存为例:

     如果你准备加内存,忽然忘记了,内存还剩几个槽,原来的内存频率是多少,是哪一代的内存,就到这里来看看吧。你再也不用去找你原来的采购合同了。你所要的硬件信息,这里全部都有。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_13

 

14. 点击“存储”,硬盘相关的信息都在里面了,多少块盘,状态如何?容量多少,RAID级别,RAID卡都型号及信息,这下面都有了。

服务器远程监控管理(一)-硬件篇_远程监控  远程管理  硬件监控 硬件管_14

 

以上是最常用的一些功能,IDRAC的卡的功能很强大,其他的功能大家可以使用的过程中慢慢体会。先介绍到这里,关于远程操作系统安装,IDRAC卡统一管理等功能,以及HP的ILO管理功能,在以后的章节中再去介绍。

 

      更多精彩课程,可到51CTO学院中学习,里面有更翔实的视频教程。

      通过代理平台,可享受85折甚至更高折扣。详情点击:http://xuexi.fx.51cto.com/

      i学习51CTO学院代理平台,享更多优惠,诚招二级代理。