XtremIO: DPG ma jednocześnie dwie awarie dysku SSD powodujące wpływ na wydajność
Summary: Ten artykuł zawiera informacje o tym, jak XtremIO zarządza awariami dwóch jednoczesnych dysków półprzewodnikowych (SSD) w grupie ochrony danych (DPG) i wyjaśnia, w jaki sposób może to wpłynąć na wydajność. Zawiera również kilka zaleceń dotyczących zmniejszenia wpływu na wydajność podczas odbudowy DPG. ...
Symptoms
Wpływ na wydajność występuje, gdy drugi dysk SSD ulegnie awarii, zanim DPG zakończy odbudowę po poprzedniej awarii dysku SSD.
Cause
W XtremIO, jeśli jeden dysk SSD ulegnie awarii, DPG odbudowuje się na pozostałych sprawnych dyskach SSD w celu utrzymania ochrony danych. Proces odbudowy DPG przebiega inaczej w przypadku awarii pojedynczego dysku SSD niż w przypadku dwóch jednoczesnych uszkodzeń dysku SSD.
Gdy awarii ulegnie tylko jeden dysk SSD:
- System przechodzi w pojedynczy stan obniżonej sprawności i ma tylko jeden blok parzystości umożliwiający odzyskanie danych.
- Odbudowa DPG rozpoczyna odbudowę danych z uszkodzonego dysku SSD na pozostałych sprawnych dyskach SSD w celu przywrócenia stanu bloku podwójnej parzystości na potrzeby ochrony danych.
- Gdy DPG odbudowuje system po awarii pojedynczego dysku SSD, proces odbudowy odbywa się w tle, a przychodzące operacje we/wy są nadal traktowane priorytetowo.
W przypadku dwóch jednoczesnych awarii dysku SSD w tym samym DPG:
- System przechodzi w stan podwójnej degradacji, co oznacza, że nie pozostaje ochrona parzystości.
- Ryzyko utraty danych drastycznie wzrasta, więc system priorytetowo traktuje odzyskiwanie. Zużywa to więcej procesorów w celu szybszej odbudowy DPG.
- XtremIO nadaje priorytet operacjom odbudowy nad operacjami we/wy użytkownika, zużywając zasoby procesora i pamięci w celu uniknięcia utraty danych.
- Ten typ przebudowy wymaga ogromnych aktualizacji metadanych. Musi on obliczyć parzystość dla każdego paska, którego dotyczy problem, i przeprowadzić kontrole integralności danych, aby upewnić się, że nie ma uszkodzeń.
Alerty, które mogą pojawić się podczas odbudowy DPG:
| Nazwa alertu | Kod symptomu | Opis |
|---|---|---|
rebuild_0_to_20_done |
XTR0800211 |
Rozpoczęto odbudowę DPG. |
rebuild_20_to_40_done |
XTR0800221 |
Trwa odbudowa DPG. Zakończono już ponad 20 procent przebudowy. |
rebuild_40_to_60_done |
XTR0800231 |
Trwa odbudowa DPG. Ukończono ponad 40 procent przebudowy. |
rebuild_60_to_80_done |
XTR0800241 |
Trwa odbudowa DPG. Ukończono ponad 60 procent przebudowy. |
rebuild_99_done |
XTR0800251 |
Trwa odbudowa DPG. Ukończono ponad 80 procent przebudowy. |
rg_state_integrate |
XTR0800904 |
DPG przeprowadza integrację dysku SSD. |
ssd_assigning_to_rg |
XTR0900106 |
Dysk SSD jest przypisywany do DPG. |
Polecenie interfejsu wiersza poleceń show-data-protection-groups Można go również uruchomić, aby sprawdzić postęp przebudowy DPG:
xmcli (tech)> show-data-protection-groups Name Index Cluster-Name Index State Num-Of-SSDs Useful-SSD-Space User-Space User-Space-In-Use Rebuild-Progress Preparation-Progress Proactive-Metadata-Loading Rebuild-Prevention Brick-Name Index X1-DPG-1 1 LAB-XIO001 1 normal 28 97.809T 85.690T 65.344T 0 0 False none X1 1 X2-DPG-1 3 LAB-XIO001 1 double_degraded 26 97.809T 83.690T 65.359T 0 54 False assigning_disk X2 2
Resolution
Gdy dwa dyski SSD w ramach tego samego DPG ulegną awarii jednocześnie, może to mieć wpływ na wydajność ze względu na zasoby zużyte do odtworzenia parzystości. Nie ma sposobu, aby zatrzymać odbudowę DPG, ani nie ma polecenia do jej przyspieszenia. Jeśli jednak u klienta występuje znaczny spadek wydajności z powodu trybu ochrony o podwójnej obniżonej sprawności (rg_double_degrade), w miarę możliwości następujące działania mogą pomóc w ograniczeniu tego wpływu:
- Wstrzymaj wszelkie kopie zapasowe, replikację lub intensywne zadania we/wy do czasu zakończenia odbudowy DPG.
- Jeśli to możliwe, przełącz awaryjnie większość aktywnych hostów na inny magazyn do czasu zakończenia odbudowy DPG.
- W przypadku korzystania z maszyn wirtualnych wyłącz lub zmigruj maszyny wirtualne lub przełącz hosty w tryb konserwacji.
- Jeśli to możliwe, użyj funkcji QoS lub ograniczania przepustowości po stronie hosta, aby zmniejszyć obciążenie macierzy podczas odbudowy.
Po zakończeniu odbudowy DPG wszelkie powiązane problemy z wydajnością powinny ustąpić.
Additional Information
Powiązane artykuły:
(Do wyświetlenia tych artykułów może być wymagane zalogowanie się jako zarejestrowany użytkownik pomocy technicznej firmy Dell).