使用vCenter Server可以对ESXi主机进行集中管理,但有时会出现ESXi主机和vCenter服务器连接不顺畅时断时续的问题。一般情况下,vCenter服务器和目标ESXi主机建立从属管理关系后,vCenter服务器会接收来自ESXi主机上管理网络端口的心跳信息,使用的端口为UDP 902。这样,可以确认ESXi主机是否处于正常状态,还可以为HA功能做好准备。因此,如果上述UDP 902通讯端口出现问题,就很容易导致上述故障的发生。
当然,这可能有多方面的原因引发,例如当vCenter服务器上开启了Windows防火墙,并且防火墙规则禁用了该端口。如果vCenter服务器没有使用该端口来发送和接收心跳信息,而且ESXi主机Block阻塞了该端口,当ESXi主机和vCenter服务器之间的通讯线路出现拥塞等等,都会导致上述故障的发生。
了解了故障原因之后,就可以有针对性地解决问题。例如,在vCenter服务器上检查防火墙规则,来清除屏蔽该端口的项目,或者将防火墙关闭等。在vCenter服务器上检测是否启用了UDP 902端口,可以使用PuTTY等工具连接到ESXi主机上,执 行“less /etc/vmware/vpxa/vpxa.cfg”命 令,在该配置文件中检测是否存在“”一行,如果有的话,就要求vCenter服务器上也必须存在对应的配置信息。在vCenter服务器上打开“Heartbeat.xml”文件,在其中检测是否存在“
当vCenter服 务 器和ESXi主机之间网络通讯过于拥堵,很可能导致HeartBeats包被丢弃,可以使用多种网络流量分析工具,来监控实时网络通讯信息。例如在EXSi主机上执行“tcpdump-uw -i vmk0”命令,来查看指定虚拟网卡的流量信息等。或者干脆更换新的物理交换机,以及将vCenter服务器作为虚拟机,运行在ESXi主机中,在不跨越VLAN的情况下,可以大大降低故障发生的可能性。当使用vSphere Web Client来管理ESXi主机时,有时会出现目标ESXi主机无响应,造成无法管理的问题。该情况经常会出现在使用分布式虚拟交换机的场合中。
分布式交换机存在两层结构,包括I/O Plane和Control Plane。前者主要用于实现I/O传输,用于和虚拟机的数据通讯。对于后者来说主要实现vMotion接口、管理接口、存储连接接口等功能。由于分布式交换机的连接稳定性或者连通性导致上述问题的发生,可以在DCUI界面下选择“Netware Restore Options”项,并选择“Restore Network Settings”项,重置网络设置,管理网络会自动重置到标准虚拟交换机上。当然,这就导致之前网络配置参数的丢失。当故障排除后,可以恢复之前备份的分布式虚拟交换机配置信息。实际上,对于虚拟交换机的管理,最好从架构上进行优化,来规避这些问题,例如一台标准虚拟交换机负责管理方面的业务,一台分布式虚拟交换机承担虚拟机通讯业务等。