DPE vApp-sikkerhetskopier mislykkes med feilen "vmwappimage error <19591>" på grunn av problemer med belastningsfordeling
Summary: DPE vApp-sikkerhetskopier mislykkes med feilen "vmwappimage Error <19591>: httpPost: http_code: 500 sending til URL 'https://localhost:8080/vcp-ba-vappplugin-ws/vapp'" på grunn av belastningsfordelingsproblemer. Lastbalansere som CloudFlare Load Balancer er kjent for å forårsake HTTP 524 Origin Time-out-feil som forårsaker sikkerhetskopiering. ...
Symptoms
Sikkerhetskopiloggen kan vise følgende feilmelding:
2021-02-08 10:02:50 vmwappimage Info <19594>: httpPost: url https://localhost:8080/vcp-ba-vappplugin-ws/vapp 2021-02-08 10:03:22 vmwappimage Error <19591>: httpPost: http_code: 500 sending to url 'https://localhost:8080/vcp-ba-vappplugin-ws/vapp' 2021-02-08 10:03:22 vmwappimage Info <9772>: Starting graceful (staged) termination, Prep-for-backup message to ADS failed (wrap-up stage) 2021-02-08 10:03:22 vmwappimage Error <0000>: Prep-for-backup message to ADS failed 2021-02-08 10:03:22 vmwappimage Info <19594>: httpPost: url https://localhost:8080/vcp-ba-vappplugin-ws/vapp 2021-02-08 10:03:45 vmwappimage Error <19591>: httpPost: http_code: 500 sending to url 'https://localhost:8080/vcp-ba-vappplugin-ws/vapp' 2021-02-08 10:03:45 vmwappimage Error <17707>: Post backup-complete message to ADS failed. 2021-02-08 10:03:45 vmwappimage Info <16038>: Final summary, cancelled/aborted 0, snapview 0, exitcode 157: miscellaneous error
Den vcdsdk.log på VPA på "/var/log/vcp/srv/vcdsdk.log" viser følgende feil:
> 2021-02-12 11:58:37,368 [AMQP listener 9] INFO (RestUtil.java:329) - Response - <html> > <head><title>524 Origin Time-out</title></head> > <body bgcolor="white"> > <center><h1>524 Origin Time-out</h1></center> > <hr><center>cloudflare-nginx</center> > </body> > </html>
Trinn for å aktivere Cloud API-feilsøking:
- Logg på primærnoden for VCP
- Redigere filer
/etc/vcp/srv/vcpsrv-log4j2.xml - Opprinnelig innhold:
<Logger name="com.vmware" level="info" additivity="true" />
Endre denne linjen til å lese:
<Logger name="com.vmware" level="debug" additivity="true" /> - Start bg- og srv-tjenesten på nytt,
vcp-cli bg update -p <MASTER-PASSWORD> <BG-INSTANCE-NAME>
vcp-cli srv update -p <MASTER-PASSWORD> <SRV-CELL-INSTANCE-NAME>
Utføre en nslookup på en vCloud Director FQDN fra VPA viser flere IP-adresser.
Kunden bekrefter at de har konfigurert en lastbalanser.
Cause
Backup Gateways prøver å koble til vCloud Director treffer CloudFlare belastningsfordeling. API-forespørselen mislykkes på CloudFlare-belastningsfordelingen som forårsaker problemet.
Returkoden CloudFlare Load Balancer gir følgende:
2021-02-12 11:58:37,368 [AMQP listener 9] INFO (RestUtil.java:329) - Response - <html> > <head><title>524 Origin Time-out</title></head> > <body bgcolor="white"> > <center><h1>524 Origin Time-out</h1></center> > <hr><center>cloudflare-nginx</center> > </body> > </html>
Resolution
-
Bekreft med kunden om de har en lastbalanserer konfigurert mellom VPA-komponentene som Backup Gateways, og så videre, og vCloud Director.
-
Legg til lokale vertsfiloppføringer for alle virtuelle maskiner for docker-beholder for å tvinge DPE-komponenter manuelt til å koble til vCloud Director ved hjelp av privat IP-adresse som omgår belastningsfordeleren.
-
På DPE-versjoner under 19.4 kan vertsfiloppføringer opprettes på individuelle virtuelle DPE-maskiner, for eksempel SRV-Cell VM, Backup Gateway VM og så videre
-
På DPE-versjon 19.4 og nyere må det gjøres endringer i hver docker-beholder.
- Åpne SSH til VPA VM
- Kjør følgende kommando for å hente listen over docker-beholdere:
docker ps - Kjør følgende kommando for å åpne docker-beholderen:
docker exec -it <first 2 digits of containerid> /bin/bash - Kjør følgende kommando for å oppdatere de lokale vertsfilpostene:
echo "IP_ADDRESS FQDN SHORTNAME" >> /etc/hosts