VCF_Upgrade_NSX - 停止 Point-NSX-T 升級在開始時失敗
摘要: 在從軟體定義資料中心 (SDDC) Manager 啟動 NSX-T 升級期間,該過程失敗。VCF Lifecycle Manager (LCM) 和 VxRail Manager 之間的 SSL 交握失敗,通常會導致此問題。這可能是由於 Java 信任存放區中存在不受信任或遺失憑證所導致。
症狀
錯誤:
」Retrieving update detail failed. VCF services are not available. Unable to retrieve aggregated upgrade details: Cannot read properties of undefined (reading 'nsxt-mgmt.local:vcenter.local:domain-c7')「
在 SDDC Manager UI 中,升級失敗,並顯示:
Upgrade element resourceType: NSX_T_PARALLEL_CLUSTER resourceId: nsxt-mgr.local:_ParallelClusterUpgradeElement status changed to COMPLETED_WITH_FAILURE
9/3/25, 2:38 PM Upgrade element resourceType: NSX_T_HOSTCLUSTER resourceId: nsxt-mgmt.local:vcenter-mgmt.local:domain-c9 status changed to SKIPPED
lcm-debug.log,則觀察到以下錯誤:
2025-09-03T11:38:43.532+0000 INFO [vcf_lcm,0000000000000000,0000,upgradeId=0d7315ba-b55a-44f5-97af-e830e5ee351c,resourceType=NSX_T_PARALLEL_CLUSTER,resourceId=nsxt-mgmt.local:_ParallelClusterUpgradeElement,bundleElementId=d047696f-0b52-4fa7-8897-5a085bfd4c2b] [o.a.h.c.h.i.c.HttpRequestRetryExec,Upgrade-1] Recoverable I/O exception (javax.net.ssl.SSLHandshakeException) caught when processing request to {s}->https://vxrail-mgr.local:443
2025-09-03T11:38:43.562+0000 ERROR [vcf_lcm,0000000000000000,0000,upgradeId=0d7315ba-b55a-44f5-97af-e830e5ee351c,resourceType=NSX_T_PARALLEL_CLUSTER,resourceId=nsxt-mgmt.local:_ParallelClusterUpgradeElement,bundleElementId=d047696f-0b52-4fa7-8897-5a085bfd4c2b] [c.v.e.s.l.p.impl.vxm.VxManagerClient,Upgrade-1] General exception in executeVxManagerHttpRequest PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target
2025-09-03T11:38:43.562+0000 ERROR [vcf_lcm,0000000000000000,0000,upgradeId=0d7315ba-b55a-44f5-97af-e830e5ee351c,resourceType=NSX_T_PARALLEL_CLUSTER,resourceId=nsxt-mgmt.local:_ParallelClusterUpgradeElement,bundleElementId=d047696f-0b52-4fa7-8897-5a085bfd4c2b] [c.v.e.s.l.p.i.nsxt.NsxtUpgradeUtil,Upgrade-1] Unhandled exception during NSX component upgrade:
javax.net.ssl.SSLHandshakeException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target.
金鑰錯誤:
javax.net.ssl.SSLHandshakeException: PKIX path building failed:
sun.security.provider.certpath.SunCertPathBuilderException:
unable to find valid certification path to requested target
- 這表示 VCF Lifecycle Manager (LCM) 正在嘗試在以下位置與 VxRail Manager 通訊:
https://vxrail-mgr.local:443,但由於 Java 信任庫中的證書不受信任或丟失,SSL 握手失敗。
原因
VCF Lifecycle Manager (LCM) 會嘗試在以下狀態與 VxRail Manager 通訊: https://vxrail-mgr.local:443
但是,SSL 交握會失敗,因為 VxRail Manager 提供的憑證為:
- 自我簽署
- VCF 使用的 Java 信任存放區遺失
因此,由於憑證鏈缺乏信任,升級程序無法繼續。
解析度
請遵循這些步驟來解決問題:
步驟 1:匯出 VxRail Manager 憑證。
從 SDDC 管理員中,執行下列命令:
echo | openssl s_client -connect vxrail-mgr.local:443 -showcerts
- 複製整個憑證鏈結 (介於 -----BEGIN CERTIFICATE----- 和 -----END CERTIFICATE----- 之間的所有內容)
- 例如,將其保存到檔中,
/tmp/vxrail.crt
步驟 2:將憑證匯入 VCF 信任存放區。
依照 Broadcom 知識文章中的指示操作:在更換 VxRail Manager 憑證後更新 SDDC Manager (外部連結)
- 您現在可執行以下作業來驗證憑證是否受信任:
openssl s_client -connect vxrail-mgr.local:443,並檢查證書鏈是否已驗證。
步驟 3:重新啟動 VCF 服務。
匯入憑證後,請重新啟動 VCF 服務以套用變更:
/opt/vmware/vcf/operationsmanager/scripts/cli/sddcmanagerrestartservices.sh
步驟 4:重試 NSX-T 升級。
返回 SDDC Manager UI,然後重試 NSX-T 平行叢集的升級。確認升級是否繼續進行到先前的失敗點之後。
步驟 5:
監控升級以確保其成功完成。其他資訊
- 此問題通常會在使用自我簽署憑證或憑證鏈未正確維護的環境中發生。
- 定期更新和驗證環境中的證書可以防止生命週期操作期間出現此類問題。