Metro-knooppunt: Na de upgrade naar 8.0.x werkt de back-up van metadata niet meer
Summary: Dit artikel behandelt het probleem waarbij na de upgrade naar 8.0.x-code de back-up van metagegevens niet meer werkt. Dit artikel bevat de tijdelijke stappen om de back-upfunctionaliteit voor metadata te herstellen. ...
Symptoms
Hardware waarop Dell van toepassing is:
Metroknooppunt mn114
Metroknooppunt mn215
Metroknooppunt-lokaal/Metro
Getroffen software van Dell:
Metro node OS 8.0.0.0.0.267
Metro node OS 8.0.0.1.0.21
Metro node OS 8.0.1.0.0.220
Beïnvloede wijzigingsactiviteiten:
Na de upgrade naar metro node OS 8.0.x
Probleem:
-
De
ndu pre-checkDe opdracht rapporteert de onderstaande fout voor elk cluster in een metro-knooppuntconfiguratie:Voorbeeld voor cluster-1:
VPlexcli:/> ndu pre-check Warning: During the NDU process, multiple directors will be offline for a portion of the time. This is non-disruptive but is dependent on a host-based multipathing solution being installed, configured, and operating on all connected hosts. ================================================================================ Performing NDU pre-checks ================================================================================ Verify NDU is not in progress.. OK Verify that the directors have been running continuously for 15 days.. OK Verify director communication status.. OK . . . Verify meta-volume backup configuration.. ERROR . . . ================================================================================ Errors (x errors found) ================================================================================ cluster-1 Metadata backups are NOT created according to schedule Last backup: Mon Aug 19 00:00:00 UTC 20xx Current time: Fri Dec 13 03:41:33 UTC 20xx There has been no metadata backup for 116 day(s) Run 'metadatabackup local' on cluster-1
Voorbeeld voor cluster-2:
VPlexcli:/> ndu pre-check Warning: During the NDU process, multiple directors will be offline for a portion of the time. This is non-disruptive but is dependent on a host-based multipathing solution being installed, configured, and operating on all connected hosts. ================================================================================ Performing NDU pre-checks ================================================================================ Verify NDU is not in progress.. OK Verify that the directors have been running continuously for 15 days.. OK Verify director communication status.. OK . . . Verify meta-volume backup configuration.. ERROR . . . ================================================================================ Errors (x errors found) ================================================================================ cluster-2 Metadata backups are NOT created according to schedule Last backup: Sat Mar 16 01:30:00 UTC 20xx Current time: Fri Dec 13 03:41:33 UTC 20xx There has been no metadata backup for 272 day(s) Run 'metadatabackup local' on cluster-2
-
Wanneer u opdracht geeft tot de
ll ~system-volumesopdracht is uitgevoerd, weerspiegelt de datum van het back-upvolume voor metadata een eerdere datum.In het onderstaande voorbeeld werkt de back-up van metadata niet meer op beide clusters in een Metro-omgeving:
VPlexcli:/> ll ~system-volumes /clusters/cluster-1/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots --------------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- --------------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- meta_C1_xxxxxx meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000 meta_C1_xxxxxxx_backup_20xx-11-21_01-30 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 \------------/ date and time the last backup was run /clusters/cluster-2/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots --------------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- --------------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- meta_C2_xxxxxx meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000 meta_C2_xxxxxxx_backup_20xx-11-20_12-43 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 \------------/ date and time the last backup was run
Symptomen:
- De back-up van metadata werkt niet meer op beide clusters in een Metro-omgeving.
- De back-up van metadata werkt niet meer op een van de clusters in een Metro-omgeving
- De back-up van metadata werkt niet meer in een lokaal cluster
Cause
Tijdens de geplande dagelijkse back-up van metagegevens loopt de service "daily_metadata_backup.service" af en toe vast in de activeringsstatus op director-1-1-A, director-2-1-A of beide.
Resolution
Permanente oplossing:
Metro node Engineering onderzoekt dit probleem. Wanneer er een oplossing beschikbaar is, wordt dit artikel bijgewerkt.
Tijdelijke oplossing:
-
Als u de status van de service "daily_metadata_backup.service" wilt controleren bij de shell-prompt, voert u de volgende opdracht uit:
sudo systemctl status daily_metadata_backup.serviceop een A-knooppunt, bijvoorbeeld director-1-1-A of director-2-1-A. Controleer en bevestig dat het kenmerk "Actief: activeren (start)" aanwezig is en langer dan een minuut actief is. Zo ja, dan betekent dit dat deze service vastzit op dat specifieke A-knooppunt.In het onderstaande voorbeeld ziet u dat director-1-1-A en director-2-1-A beide het kenmerk "daily_metadata_backup.service" van de service Active: activating (start)" hebben en langer dan een minuut actief zijn geweest, wat betekent dat deze service is vastgelopen op deze knooppunten, zoals hieronder wordt weergegeven.
Cluster-1:
service@director-2-1-a:~> sudo systemctl status daily_metadata_backup.service ● daily_metadata_backup.service - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.service; static) Active: activating (start) since Sat 2024-10-xx 01:30:18 UTC; 1 month 3 days ago <--------------------------- TriggeredBy: ● daily_metadata_backup.timer Main PID: 22553 (daily_metadata_) Tasks: 1 CGroup: /system.slice/daily_metadata_backup.service └─22553 /usr/bin/python3 /opt/dell/vplex/sbin/daily_metadata_backup.py Oct xx 01:30:18 director-2-1-a systemd[1]: Starting metronode automated daily metadata backups... . . . <truncated>Cluster-2:
service@director-1-1-a:~> sudo systemctl status daily_metadata_backup.service ● daily_metadata_backup.service - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.service; static) Active: activating (start) since Sat 2024-10-xx 01:30:18 UTC; 1 month 2 days ago <--------------------------- TriggeredBy: ● daily_metadata_backup.timer Main PID: 22553 (daily_metadata_) Tasks: 1 CGroup: /system.slice/daily_metadata_backup.service └─22553 /usr/bin/python3 /opt/dell/vplex/sbin/daily_metadata_backup.py Oct xx 01:30:18 director-1-1-a systemd[1]: Starting metronode automated daily metadata backups... . . . <truncated> -
Als u de status van de service "daily_metadata_backup.timer" op een A-knooppunt wilt controleren, bijvoorbeeld director-1-1-A, director-2-1-A, voert u de volgende opdracht uit:
sudo systemctl status daily_metadata_backup.timeren bevestig dat het kenmerk 'Trigger:' wordt weergegeven als 'n.v.t.' Zo ja, dan betekent dit dat deze service vastzit op dat specifieke A-knooppunt.In het onderstaande voorbeeld ziet u dat director-1-1-A en director-2-1-A beide het kenmerk "Trigger:" van de service "daily_metadata_backup.timer" hebben dat wordt weergegeven als "n.v.t", wat betekent dat deze service is vastgelopen op deze knooppunten.
Cluster-1:
service@director-1-1-a:~> sudo systemctl status daily_metadata_backup.timer ● daily_metadata_backup.timer - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.timer; enabled; vendor preset: disabled) Drop-In: /etc/systemd/system/daily_metadata_backup.timer.d └─daily_backup.conf Active: active (running) since Wed 2024-11-20 12:46:10 UTC; 18h ago Trigger: n/a <<<<<<<<<<<< Triggers: ● daily_metadata_backup.service Nov 20 12:46:10 director-1-1-a systemd[1]: Started metronode automated daily metadata backups. service@director-1-1-a:~>
Cluster-2:
service@director-2-1-a:~> sudo systemctl status daily_metadata_backup.timer ● daily_metadata_backup.timer - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.timer; enabled; vendor preset: disabled) Drop-In: /etc/systemd/system/daily_metadata_backup.timer.d └─daily_backup.conf Active: active (running) since Wed 2024-11-xx 12:46:10 UTC; 18h ago Trigger: n/a >>>>>>>>>>>>>>>>>>>>>>> Triggers: ● daily_metadata_backup.service Nov xx 12:46:10 director-2-1-a systemd[1]: Started metronode automated daily metadata backups. service@director-2-1-a:~>
-
Zodra is bevestigd voor welk knooppunt, of mogelijk beide knooppunten, de twee genoemde services zijn vastgelopen, stopt u de services "daily_metadata_backup.service" en "daily_metadata_backup.timer" en start u vervolgens de service voor "daily_metadata_backup.timer" om deze situatie op te lossen en om de back-up van metadata te laten functioneren.
OPMERKING: Gebruik de opdrachtoptie "Restart" niet.In het onderstaande voorbeeld, omdat beide A-knooppunten worden beïnvloed, worden de services als volgt gestopt en gestart:
sudo systemctl stop daily_metadata_backup.service
sudo systemctl stop daily_metadata_backup.timer
sudo systemctl start daily_metadata_backup.timer
-
Voer de onderstaande opdracht uit om de status te controleren om te bevestigen dat deze niet meer vastzit als volgt:
De onderstaande voorbeelden tonen het uitvoeren van de statusopdracht voor "daily_metadata_backup.service" om te controleren of de regel "Active: inactive (dead)" die aangeeft dat de service inderdaad niet wordt uitgevoerd, die bij het wachten op de volgende back-upcyclus van de metadata "inactief (dead)" is:
service@director-2-1-a:~> sudo systemctl status daily_metadata_backup.service ● daily_metadata_backup.service - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.service; static) Active: inactive (dead) since Fri 2024-11-22 21:07:41 UTC; 1min 49s ago >>>>>>>>>>>> TriggeredBy: ● daily_metadata_backup.timer Process: 9183 ExecStart=/opt/dell/vplex/sbin/daily_metadata_backup.py (code=exited, status=0/SUCCESS) Main PID: 9183 (code=exited, status=0/SUCCESS) Nov 22 21:07:36 director-2-1-a systemd[1]: Starting metronode automated daily metadata backups... Nov 22 21:07:41 director-2-1-a systemd[1]: daily_metadata_backup.service: Succeeded. Nov 22 21:07:41 director-2-1-a systemd[1]: Finished metronode automated daily metadata backups. service@director-2-1-a:~>service@director-1-1-a:~> sudo systemctl status daily_metadata_backup.service ● daily_metadata_backup.service - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.service; static) Active: inactive (dead) since Fri 2024-11-22 21:07:41 UTC; 1min 49s ago >>>>>>>>>>>> TriggeredBy: ● daily_metadata_backup.timer Process: 9183 ExecStart=/opt/dell/vplex/sbin/daily_metadata_backup.py (code=exited, status=0/SUCCESS) Main PID: 9183 (code=exited, status=0/SUCCESS) Nov 22 21:07:36 director-1-1-a systemd[1]: Starting metronode automated daily metadata backups... Nov 22 21:07:41 director-1-1-a systemd[1]: daily_metadata_backup.service: Succeeded. Nov 22 21:07:41 director-1-1-a systemd[1]: Finished metronode automated daily metadata backups. service@director-2-1-a:~>In onderstaand voorbeeld ziet u dat de service "daily_metadata_backup.timer" moet worden ingesteld op "active(waiting)" en dat "Trigger" moet zijn ingesteld op current of present day, wat aangeeft dat de service nu werkt zoals verwacht:
service@director-2-1-a:~> sudo systemctl status daily_metadata_backup.timer ● daily_metadata_backup.timer - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.timer; enabled; vendor preset: disabled) Drop-In: /etc/systemd/system/daily_metadata_backup.timer.d └─daily_backup.conf Active: active (waiting) since Fri 2024-11-22 21:09:24 UTC; 14s ago >>>>>>>>>>> Trigger: Sat 2024-11-23 01:30:00 UTC; 4h 20min left >>>>>>>>>>> Triggers: ● daily_metadata_backup.service Nov 22 21:09:24 director-2-1-a systemd[1]: Started metronode automated daily metadata backups. service@director-2-1-a:~>service@director-1-1-a:~> sudo systemctl status daily_metadata_backup.timer ● daily_metadata_backup.timer - metronode automated daily metadata backups Loaded: loaded (/etc/systemd/system/daily_metadata_backup.timer; enabled; vendor preset: disabled) Drop-In: /etc/systemd/system/daily_metadata_backup.timer.d └─daily_backup.conf Active: active (waiting) since Fri 2024-11-22 21:09:24 UTC; 14s ago >>>>>>>>>>> Trigger: Sat 2024-11-23 01:30:00 UTC; 4h 20min left >>>>>>>>>>> Triggers: ● daily_metadata_backup.service Nov 22 21:09:24 director-1-1-a systemd[1]: Started metronode automated daily metadata backups. service@director-2-1-a:~> -
Wacht en controleer tot de volgende back-up van metagegevens is voltooid door het uitvoeren van
ll ~system-volumesom te bevestigen dat het probleem is opgelost en de back-up van metadata als volgt plaatsvindt.Voorbeeld:
VPlexcli:/> ll ~system-volumes /clusters/cluster-1/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots --------------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- --------------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- meta_C1_xxxxxx meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000 meta_C1_xxxxxxx_backup_2024-11-23_01-30 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 meta_C1_4UQT429_backup_2024-11-24_01-30 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 /clusters/cluster-2/system-volumes: Name Volume Type Operational Health Active Ready Geometry Component Block Block Capacity Slots --------------------------------------- -------------- Status State ------ ----- -------- Count Count Size -------- ----- --------------------------------------- -------------- ----------- ------ ------ ----- -------- --------- -------- ----- -------- ----- meta_C2_xxxxxx meta-volume ok ok true true raid-1 2 20971264 4K 80G 64000 meta_C2_xxxxxxx_backup_2024-11-23_12-43 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000 meta_C2_xxxxxxx_backup_2024-11-24_12-43 meta-volume ok ok false true raid-1 1 20971264 4K 80G 64000