在VMSKY上看到一编好文,特转来存档.

A

检查软件兼容性

vCenter Server软件版本号必需高于/等于置管ESX的版本

vSphere Client软件版本号必需高于/等于被访问的vCenter版本;

vSphere Client软件版本号必需高于/等于被访问的ESX版本

在使用Update Manager时必需保持vCentervSphere ClientUpdate Manager这三者的版本是一致的。

更多VI 架构组件的兼容性请查阅使用文档与以下软件兼容手册:

vSphere Compatibility Matrix

http://www.vmware.com/resources/compatibility/docs/vSphere_Comp_Matrix.pdf

VMware Infrastructure Compatibility Matrixes

http://www.vmware.com/pdf/vi3_35/esx_3/r35/vi3_35_25_compat_matrix.pdf

 

 

B

检查网络:

1.使用PING命令测试网络连接,如果PING命令测试不成功。请检查:

vCenterESX所在的Vlan

检查vCenterESX的网关与网络配置

物理链路检查

2.

检查虚拟交换机配置

esxcfg-vswitch –l

esxcfg-vswif –l

esxcfg-nics –l

3.

检查服务器端口开放情况

查看ESX防火墙端口开放:esxcfg-firewall –q

查看服务器端口使用情况netstat -na

4.

检查物理交换机QOS配置

5.

vCenterESX的网络是否经过NAT地址转换

C

检查存储状态,ESX是否BOOT FROM SAN

检查存储连接

vSphere Client –Configuration-Storage Adaptes

vSphere Client –Configuration-Storage

执行”esxcfg-mpatch -l”查看已连接的存储

执行”esxcfg-scsidevs –l”,查看已签名的SCSI设备

确认存储空间

ESX执行”vdf -h”检查各分区存储使用情况

vSphere 4服务控制台的文件系统

查看存放Service Console的虚拟磁盘

#vsd –l


vsa0:0:0
/dev/sda

查找Service ConsoleVMDK路径
#vsd –g

/vmfs/volumes/*/esxconsole-*/esxconsole.vmdk

D.

vCenterESX配置检查:

1.

vCenterESX系统的配置会影响到程序的正常运行

检查/etc/hosts文件的默认记录是否存在(hosts文件中127.0.0.1该条系统自带解析记录不可删除)

127.0.0.1

localhost.localdomain localhost

2.

查看HOSTDVPXA进程是否正在运行


#ps –ef | grep hostd


#ps –ef | grep vpxa

(如果HOSTDVPXA程序没有在运行,可直接执行以下命令启动:

启动HOSTD

# /bin/sh /usr/bin/vmware-watchdog -s hostd -u 60 -q 5 -c /usr/sbin/vmware-hostd-support /usr/sbin/vmware-hostd /etc/vmware/hostd/config.xml –u

启动VPXA

#/bin/sh /opt/vmware/vpxa/bin/vmware-watchdog -s vpxa -u 30 -q 5 /opt/vmware/vpxa/sbin/vpxa

3.

重新启动HOSTDVPXA检查程序是否异常

#service mgmt-vmware restart

#service vmware-vpxa restart

 

(重启如果提示如下,说明重启服务正常

[root@vsphere1 ~]# service mgmt-vmware restart

Stopping VMware ESX Management services:


VMware ESX Host Agent Watchdog
[
OK
]


VMware ESX Host Agent
[
OK
]

Starting VMware ESX Management services:


VMware ESX Host Agent (background)
[
OK
]


Availability report startup (background)
[
OK
]

[root@vsphere1 ~]# service vmware-vpxa restart

Stopping vmware-vpxa:

[
OK
]

Starting vmware-vpxa:
[
OK
]

 

它们的工作目录在/etc/init.d/,如果不能正常启动服务请查看KB :http://kb.vmware.com/kb/ 1003490

4.审核vpxa代理配置文件:

文件地址:/etc/opt/vmware/vpxa/vpxa.cfg

5.审核hostd配置文件:

文件地址:/etc/vmware/esx.conf

6.vCenter指定管理ESX的地址

Vi client—login to vCenter—Administration—vCenter Server Settings—Runtime Settings—Managed IP Address—vCenter Server Managed IP:

7.检查vCenterSSL验证

Vi client—login to vCenter—Administration—vCenter Server Settings—SSL Settings—去掉”vCenter requires verified host SSL certificates”的勾选。

 

 

综上:如果仔细检查并执行以上每一项没有问题,但是ESXvCenter中状态依旧不正常,请执行以下操作:

1.使用VI Client连接到vCenter

2.停止该cluster HADRS

3.右键有故障的ESX -> Disconnect -> 再次右键将该ESXvCenter上移除

4.使用root用户登录到ESX执行以下操作

i.执行命令停止系统管理服务的运行

service mgmt-vmware stop

service vmware-vpxa stop

ii.删除vpxa Agent程序

rpm –qa |grep vpxa

rpm –e <上一条指令返回的结果>

iii.vpxa旧的配置文件改名

Esx 3.5 配置文件的路径

mv /etc/opt/vmware/vpxa/vpxa.cfg /etc/opt/vmware/vpxa/vpxa.cfg.old

Esx 4.0 配置文件的路径

mv /etc/opt/vmware/vpxa/vpxa.cfg /etc/opt/vmware/vpxa/vpxa.cfg.old

 

5.登录ESX 的命令行终端:

#service iptables stop

# chkconfig --level 35 iptables off

 

6. service mgmt-vmware start

7.重新将ESX添加到vCenter

8.启用HADRS

 

最后,官方解决方案:

http://kb.vmware.com/kb/1003409