VxRail:重新启动后 vCenter 远程 https 连接超过允许的最大值
Summary: vCenter 远程 https 连接在重新启动后超过允许的最大值,并且由于 vCenter 终止 SSL 握手,VxRail Manager 无法连接到 vCenter。
Symptoms
在客户提供的 vCenter 环境(也称为外部 vCenter)中,vCenter 可以管理多个 VxRail 群集。
vCenter 重新启动后,您可能会看到一个错误,指出 VxRail Manager 无法连接到 vCenter。
检查 VxRail Manager 文件 /var/log/mystic/web.log。查找文本 Remote host terminated the handshake 因为这显示 VxRail Manager 无法连接到 vCenter。
2023-05-16 09:35:37.378+0000 ERROR [myScheduler-6] com.graphql_java_generator.client.QueryExecutorImpl QueryExecutorImpl.doJsonRequestExecution:148 - {"message":"Failed to connect to vCenter None"," locations":[{"line":1,"column":8,"sourceName":null}],"description":null,"validationErrorType":null,"queryPath":null,"errorType":null,"path":["cluster"],"extensions":null}
2023-05-16 09:35:37.378+0000 INFO [myScheduler-6] com.vce.commons.domainowner.cluster.VCRepository VCRepository.getDeploymentTypeAndHostSummary:135 - failed to get deployment type and host summary.com.graphql_java_generator.client.response.GraphQLExecutionException: 1 errors occured: {"message":"Failed to connect to vCenter None","locations":[{"line":1,"column":8,"sourceName":null}],"description":null,"validationErrorType":null,"queryPath":null,"errorType":null,"path":["cluster"],"extensions":null}
Caused by: javax.net.ssl.SSLHandshakeException: Remote host terminated the handshake
at sun.security.ssl.SSLSocketImpl.handleEOF(SSLSocketImpl.java:1696) ~[?:?]
at sun.security.ssl.SSLSocketImpl.decode(SSLSocketImpl.java:1514) ~[?:?]
at sun.security.ssl.SSLSocketImpl.readHandshakeRecord(SSLSocketImpl.java:1416) ~[?:?]
检查 vCenter 文件 /var/log/vmware/envoy/envoy.log。查找文本 remote https connections exceed max allowed: 2048。然后,您会看到以下消息,显示 vCenter 正在关闭来自 VxRail Manager IP 地址 x.x.x.x 的连接。
2023-05-16T08:55:26.142Z warning envoy[2436] [Originator@6876 sub=filter] [C28710] remote https connections exceed max allowed: 2048
2023-05-16T08:55:26.142Z warning envoy[2436] [Originator@6876 sub=filter] [C28710] closing connection TCP<x.x.x.x:52018, y.y.y.y:443>Cause
Resolution
VxRail 7.0.480 具有增强功能,可在 vCenter 重新启动期间减少与 vCenter 的 https 连接。
如果您仍然遇到此问题,请按照以下步骤作为解决方法。
如果 vCenter 托管的 VxRail 群集少于 25 个,请遵循 VMware 文章 344920 vCenter Server 的 envoy 日志中的 HTTPS 连接耗尽,以增加
maximum RemoteHttpsConnections 限制为 3072,然后重新启动 vCenter rhttpproxy service。
如果 vCenter 管理超过 25 个 VxRail 群集,请勿尝试增加 maximum RemoteHttpsConnections 限制为大于 3072 的数字。VMware 不建议这样做,并且可能会对 vCenter 性能产生负面影响。
请按照以下步骤解决此问题:
- 关闭所有 VxRail Manager,以允许 vCenter 释放 https 连接。
- 启动 10 个 VxRail Manager 并等待连接编号稳定。您可以在 vCenter 上运行以下命令来监视连接数。
netstat -tnep | grep envoy | grep "<VCSA IP address>:443"| wc -l
- 另外启动五个 VxRail Manager,并等待连接编号稳定。
- 重复步骤 3,直至启动所有 VxRail Manager。