由于空间不足导致升级vCenter Server失败案

  知识点

当前环境由4台ESXi主机组成vSphere与vSAN应用环境,vCenter Server与ESXi主机是6.7.0 U3的版本,并且已经升级到最新的补丁。准备将vSphere 6.7的环境升级到7.0 U1,在 升级vCenter Server的时候出现“执行升级过程时出现内部错误”(如图1所示),单击“关闭”之后显示错误停在第二阶段的25%(如图2所示)。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图1 错误

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图2 从源vCenter复制到目标vCenter期间出错

对于这个故障,经过检查发现是vCenter Server Appliance的archive空间不足导致,登录https://vcip:5480,在“监控→磁盘”中可以看到硬盘13的archive分区空间不足,如图3所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图3  archive空间不足

使用SSH登录到vCenter Server,执行df -h看到/storage/archive使用空间为100%,如图4所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图4 查看空间

对于vCenter Server Appliance虚拟机的第13个硬盘空间不足,可以修改虚拟机配置,为硬盘扩容。在本示例中,将vCenter Server Appliance虚拟机硬盘13容量从200G扩展到400GB,如图5所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图5 硬盘扩容

切换到SSH界面,执行vpxd_servicecfg storage lvm autogrow命令对vCenter Server Appliance的archive逻辑卷进行扩容,执行命令之后执行df -h查看archive逻辑卷容量扩展到39GB,使用空间减少到50%,如图6所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图6 执行逻辑卷扩容命令

在对vCenter Server Appliance的archive分区扩容之后,再次执行vCenter Server Appliance 7的升级程序,在“选择升级数据”时,如果提示默认分区剩余空间不够,在“导出目录”中使用/tmp,如图7所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图7 选择升级数据

升级程序从源vCenter Server复制导出数据到目标vCenter Server,启动新的vCenter Server,将复制的数据导入到新的vCenter Server,完成升级,如图8所示。

watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=

图8 升级完成