VxRail: 再起動後、vCenterリモートHTTPS接続が最大許容値を超えています
Summary: 再起動後にvCenterリモートHTTPS接続が最大許容値を超え、SSLハンドシェイクがvCenterによって終了されるため、VxRail ManagerはvCenterへの接続に失敗します。
Symptoms
お客様が用意したvCenter環境(外部vCenterとも呼ばれる)では、vCenterで複数のVxRailクラスターを管理できます
vCenterの再起動後、VxRail ManagerがvCenterへの接続に失敗したことを示すエラーが表示される場合があります
VxRail Managerファイルを確認します /var/log/mystic/web.logとなります。テキストを探します Remote host terminated the handshake これは、VxRail ManagerがvCenterへの接続に失敗したことを示しています。
2023-05-16 09:35:37.378+0000 ERROR [myScheduler-6] com.graphql_java_generator.client.QueryExecutorImpl QueryExecutorImpl.doJsonRequestExecution:148 - {"message":"Failed to connect to vCenter None"," locations":[{"line":1,"column":8,"sourceName":null}],"description":null,"validationErrorType":null,"queryPath":null,"errorType":null,"path":["cluster"],"extensions":null}
2023-05-16 09:35:37.378+0000 INFO [myScheduler-6] com.vce.commons.domainowner.cluster.VCRepository VCRepository.getDeploymentTypeAndHostSummary:135 - failed to get deployment type and host summary.com.graphql_java_generator.client.response.GraphQLExecutionException: 1 errors occured: {"message":"Failed to connect to vCenter None","locations":[{"line":1,"column":8,"sourceName":null}],"description":null,"validationErrorType":null,"queryPath":null,"errorType":null,"path":["cluster"],"extensions":null}
Caused by: javax.net.ssl.SSLHandshakeException: Remote host terminated the handshake
at sun.security.ssl.SSLSocketImpl.handleEOF(SSLSocketImpl.java:1696) ~[?:?]
at sun.security.ssl.SSLSocketImpl.decode(SSLSocketImpl.java:1514) ~[?:?]
at sun.security.ssl.SSLSocketImpl.readHandshakeRecord(SSLSocketImpl.java:1416) ~[?:?]
vCenterファイルを確認します /var/log/vmware/envoy/envoy.logとなります。テキストを探します remote https connections exceed max allowed: 2048となります。vCenterがVxRail ManagerのIPアドレスx.x.x.xからの接続を閉じていることを示す次のメッセージが表示されます。
2023-05-16T08:55:26.142Z warning envoy[2436] [Originator@6876 sub=filter] [C28710] remote https connections exceed max allowed: 2048
2023-05-16T08:55:26.142Z warning envoy[2436] [Originator@6876 sub=filter] [C28710] closing connection TCP<x.x.x.x:52018, y.y.y.y:443>Cause
Resolution
VxRail 7.0.480では、vCenterの再起動中にvCenterへのhttps接続を削減する機能拡張が追加されています
それでもこの問題が発生する場合は、回避策として以下の手順に従ってください
vCenterで管理されるVxRailクラスターの数が25未満の場合は、VMware記事344920「vCenterサーバーのEnvoyログのHTTPS接続の枯渇」に従って
maximum RemoteHttpsConnections 3072に制限してから再起動します vCenter rhttpproxy service.
vCenterが25を超えるVxRailクラスターを管理している場合は、 maximum RemoteHttpsConnections 3072より大きい数に制限します。VMwareではこれを推奨しておらず、vCenterのパフォーマンスに悪影響を及ぼす可能性があります。
回避するには、次の手順に従います。
- すべてのVxRail Managerの電源をオフにして、vCenterがhttps接続を解放できるようにします。
- 10台のVxRail Managerを起動し、接続番号が安定するまで待ちます。vCenterで次のコマンドを実行して、接続番号を監視できます。
netstat -tnep | grep envoy | grep "<VCSA IP address>:443"| wc -l
- 別の5つのVxRail Managerを起動し、接続番号が安定するまで待ちます。
- すべてのVxRail Managerが起動するまで、手順3を繰り返します。