ESXi网卡问题导致业务缓慢

2019-06-28 03:45河北王春海
网络安全和信息化 2019年6期
关键词:网线适配器网卡

■ 河北 王春海

编者按: 笔者近期遇到部分网卡被识别错误的原因,造成了某些业务系统访问缓慢。虽然这种故障发生的概率很低,但也会影响单位的日常业务运转,对此问题也要有所了解。

某企业所有业务系统及应用运行在由5台安装了ESXi 6.0的服务器组成的虚拟化环境中,已经稳定运行了多年,基本上没有出过问题。

某天下午企业工程师联系笔者,说单位的业务系统访问很慢。在业务系统中ping网关的延时超过2ms,平常都是小于1ms。近期单位服务器与网络没有改动。

检查发现有台物理主机内存报警(提示第20个内存插槽的内存有问题),将这台服务器置于维护模式,迁移虚拟机到其他主机时提示“等待数据失败……”、“迁移被取消,因为虚拟机内存的更改量超过可用网络带宽……”,如图1所示。

图1 迁移失败

图2 部分网卡端口速率识别错误

图3 移动到待机适配器

如果手动迁移虚拟机到其他主机,原来需要几分钟的迁移迟迟不能完成(直到下午用了3个多小时才迁移完成一台)。因为笔者没在现场,就让用户分别登录每台ESXi主机ping网关看延时和丢包情况,经检查这五台主机中,只有一台延时在2~3ms,其他都在1ms以内,而延时在2~3ms的就是内存有故障的主机。

下午到现场之后检查发现,一些服务器的网卡被识别为10Mb、100Mb,如图3所示。当前一共5台ESXi主机,其中有4台主机的部分网卡识别有错误。如图2所示。

这种问题一般是线路或交换机配置问题导致。但这套系统已经使用几年,原来的网卡都能正确识别到千兆,不应该是交换机配置的问题。网线或网线接头问题居多,也可能是接触不好造成的。

因为现在业务系统还比较缓慢,现在也不是着急检查网络的时候,因此为了应急,在vSphere Client中选中ESXi主机,在“配置→硬件→网络”中修改虚拟交换机vSwitch及端口组、Management Network属性,在“常规→网卡绑定”选项中,可以将错误识别为10Mb或100Mb的端口移动到“待机适配器”中,如图3所示。

修改之后千兆网卡为活动适配器,识别为10Mb或100Mb的网卡为待机适配器。

在配置好每一台主机后,再次将内存有故障的主机置于维护模式,此时虚拟机迁移很快完成。此时单位访问业务系统的速度也恢复正常,如图4所示。

再去机房将识别为10Mb、100Mb 的网卡更换网线,网卡全部识别为1000Mb。

图4 迁移顺利

图5 设置端口速度

将主机置于维护模式后,将ESXi主机关闭电源,取下20插槽有故障的内存开机,正常启动后将主机退出维护模式,迁移到其他主机的虚拟机会慢慢迁移回这台主机,至此故障解决。

总结

在本项目中,每台服务器管理使用2个千兆端口、虚拟机使用另外2个千兆端口,本来无论是管理还是应用,网络都是有冗余的。但此次故障在于部分网卡被识别为10Mb或100Mb,用户在通过物理网络、物理交换机访问虚拟机时,有可能使用被识别为10Mb或100Mb的上行链路,这就造成了某些业务系统访问缓慢。

实际上这种故障出现的概率很低,在使用合格的网线时一般不会出现此类故障。那么怎么避免这个问题呢?

可以在虚拟交换机属性→网络适配器中,将上行链路的“自动协商”改为“1000Mb,全双工”,如图5所示。在设置为这种模式后,如果线路速度不能达到千兆,那么这个端口就被断开,这避免了线路降速运行。

但需要注意,如果两条都设置为1000Mb,当两条都不能识别为千兆时,网络中断,此时业务可能受到影响;如果设置其中一条为1000Mb,当两条都不能识别为千兆时,还会有一条降速运行,可以保证业务受影响但不中断。管理员可以根据实际情况,选择将其中一条或两条设置为1000Mb。

猜你喜欢
网线适配器网卡
联网全靠它 认识笔记本的无线网卡
Server 2016网卡组合模式
基于3D打印的轻型导弹适配器
潜空导弹垂直发射出筒适配器受载变形仿真研究
电源适配器怎么选
社会版(二)
美国麦格普公司新型M—LOK相机三脚架适配器
挑战Killer网卡Realtek网游专用Dragon网卡
调整网线 轻松解决彩印起杠
USB故障又一原因