PowerScale: Brug af AutoBalanceLin til hurtigt at flytte data væk fra en fuld nodepulje
Summary: I denne artikel beskrives, hvordan du bruger jobbet AutoBalanceLin til hurtigt at frigøre plads, hvis en enkelt nodepulje er fuld eller næsten ved 100 % kapacitet. Denne fremgangsmåde bør kun anvendes, hvis alle andre metoder til at frigøre diskplads på en nodepulje er opbrugt. ...
Instructions
Bemærk: Følgende procedure kræver fjernelse af eksisterende filpuljepolitikker og spredning af data på tværs af alle noder, uanset hvilken arbejdsproces dataene tilhører.
Uden filpuljepolitikkerne sker der ingen administration af data mellem puljerne eller niveauerne.
Sørg for, at virkningen af denne procedure forstås fuldt ud, da den kan medføre forringelse af ydeevnen.
Udfør kun dette som en sidste indsats, efter at alle andre muligheder for at løse kapacitetsproblemer er blevet forsøgt.
Det er en udbredt opfattelse, at AutoBalance og AutoBalanceLin kun balancerer data inden for nodepuljer og ikke på tværs af nodepuljer. Det menes også, at kun smartpools/smartpoolstree kan flytte data mellem to nodepuljer.
Test på OneFS 8.0 og nyere viser, at dette ikke er helt sandt. Hvis klyngen kun har standardpolitikken for filpulje "hvor som helst:hvor som helst", flytter AutoBalanceLin og Autobalance data på tværs af flere nodepuljer.
Dette bør kun bruges som en nødløsning for klynger, der har én fuld nodepulje. Denne proces flytter hurtigt data væk fra den fulde nodepulje.
Spørgsmål: Hvornår vil man bruge følgende procedure?
Svare: Denne procedure vil blive anvendt, når følgende betingelser er opfyldt:
a. Klyngen indeholder flere nodepuljer, og en eller flere af nodepuljerne er 100 % fulde.
b. Der er et øjeblikkeligt krav om at frigøre diskplads på en fuld nodepulje.
c. Den nøjagtige organisering af dataene er ikke en umiddelbar bekymring.
Trin:
1) Vær opmærksom på, og slet derefter alle eksisterende filpuljepolitikker undtagen 'standard' 'enhver: enhver' filpuljepolitik, der leveres med klynge.
Før du fortsætter med dette trin:
a) Registrer den aktuelle konfiguration af filpuljepolitikken, før politikkerne fjernes. Hvis tiden tillader det, anbefales en fuld logindsamling.
b) Som standard er Isilon-klynger konfigureret med standardfilpuljepolitikken indstillet til at skrive data til "hvor som helst:hvor som helst". Kontroller, at standardfilpuljepolitikken er gendannet til disse standardindstillinger, før du fortsætter.
Example: Default File Pool Policy. Observe that the Storage Targets are set to 'anywhere'.
# isi filepool default-policy view
Set Requested Protection: default
Data Access Pattern: concurrency
Enable Coalescer: Yes
Enable Packing: No
Data Storage Target: anywhere
Data SSD Strategy: metadata
Snapshot Storage Target: anywhere
Snapshot SSD Strategy: metadata
Cloud Pool: -
Cloud Compression Enabled: -
Cloud Encryption Enabled: -
Cloud Data Retention: -
Cloud Incremental Backup Retention: -
Cloud Full Backup Retention: -
Cloud Accessibility: -
Cloud Read Ahead: -
Cloud Cache Expiration: -
Cloud Writeback Frequency: -
Cloud Archive Snapshot Files: -
ID: -
2) Kør et SmartPools-job for at anvende nye mappemarkeringer:
# isi job start smartpools -p 1 --policy medium
Bemærk: Forvent, at Smartpools-jobbet fuldføres hurtigere end normalt med kun standardpolitikken for filpulje overalt:hvor som helst på plads.
3) Kør et AutoBalanceLin-job i et par timer, og hold øje med plads. (Bemærk: I modsætning til AutoBalance, som udfører en hel trævandring, før du flytter data, omfordeler AutoBalanceLin data med det samme)
# isi job start autobalancelin -p 1 --policy medium
Næsten øjeblikkeligt skal du observere, at dataene skifter rundt mellem nodepuljerne, og den fulde nodepulje skal frigøre diskplads.
Bemærk: I dette trin behøver AutoBalanceLin ikke at blive fuldført. Overvåg AutoBalanceLin-jobbet, indtil målet om at rydde op i hele nodepuljen er nået, og annuller derefter jobbet. Du kan f.eks. annullere jobbet, når den fulde nodepulje er nede på 85 % af kapaciteten.
Seddel: Overvåg klyngeudnyttelsen, og bekræft, at andre job annulleres, eller sæt på pause, hvis pladsen påvirkes negativt.
Fortsæt med at overvåge plads hver time eller deromkring, indtil pladsen er på et tilstrækkeligt niveau ved hjælp af følgende kommando:
# isi stat -p -v
Bemærk: Igen, Det er ikke tilrådeligt at lade AutoBalanceLin køre til færdiggørelse. På et bestemt tidspunkt kan jobbet skifte data i en ny retning, og det kan begynde at producere uønskede resultater. For eksempel vender det dataflytningen, hvilket muligvis fører til, at den anden nodepulje nærmer sig fuld kapacitet, når den forrige pulje tømmes. Kør kun AutobalanceLIN i et par timer, eller indtil pladsen er ryddet ud, og annuller derefter, når målet er nået.
Når klyngen har opnået aflastning i pladsen på den fulde nodepulje, skal du annullere AutoBalanceLin-jobbet:
# isi job cancel autobalancelin
Bemærk: For at opnå optimale resultater skal beskyttelsesniveauerne mellem nodepuljerne være af samme værdi.
Additional Information
Laboratorietestresultater
To nodepuljer, samme beskyttelsesniveauer
Dette er før:
Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 29.9T (35%) 35.2G (2%) Avail: 55.3T (65%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6| 0|881.6|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) 7|10.5.80.192 | OK | 0| 0| 0|10.0T/31.5T( 32%)|11.7G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |110.2| 0|110.2|29.9T/85.2T( 35%)|35.2G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 5.6T (5%) 7.9G (< 1%) Avail: 107.2T (95%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK | 2.9M|82.8M|85.6M| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 104k|38.8k| 143k| 1.4T/30.6T( 5%)| 1.9G/ 738G(< 1%) 3|10.5.80.188 | OK |881.6| 0|881.6| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) 4|10.5.80.189 | OK | 0|25.8k|25.8k| 1.4T/31.5T( 4%)| 2.0G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 371k|10.4M|10.7M| 5.6T/112.8T( 5%)| 7.9G/ 2.9T(< 1%) _64gb | | | | | | X410-2# date Thu Jun 14 16:53:29 CDT 2018 one filepool policy set to default any:any X410-2# isi job start autobalancelin -p 1 --policy medium Started job [7159] in as little as 30 minutes you will see data shift between the two pools, i.e. our first node pool, below, dropped from 32% full to 29% X410-2# date Thu Jun 14 17:24:20 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 27.7T (33%) 34.3G (2%) Avail: 57.5T (67%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK | 1.1k|25.8k|26.9k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 6|10.5.80.191 |-A-- | 1.1k| 1.2M| 1.2M| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) 7|10.5.80.192 | OK |28.6k| 5.2k|33.7k| 9.2T/31.5T( 29%)|11.4G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.8k| 152k| 156k|27.7T/85.2T( 33%)|34.3G/ 2.2T( 2%) Node Pool Name: x410_35tb_800gb-ssd_64gbProtection: +2d:1n Pool Storage: HDD SSD Storage Size: 112.8T (125.3T Raw) 2.9T (2.9T Raw) VHS Size: 12.5T Used: 7.6T (7%) 8.8G (< 1%) Avail: 105.2T (93%) 2.9T (> 99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.5.80.186 | OK |37.9k| 279k| 316k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 2|10.5.80.187 |-A-- | 1.4M|34.8M|36.2M| 1.9T/30.6T( 6%)| 2.2G/ 738G(< 1%) 3|10.5.80.188 | OK | 130k|30.9k| 161k| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) 4|10.5.80.189 | OK | 0| 0| 0| 1.9T/31.5T( 6%)| 2.2G/ 738G(< 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_35tb_800gb-ssd|-M---| 198k| 4.4M| 4.6M| 7.6T/112.8T( 7%)| 8.8G/ 2.9T(< 1%) _64gb | | | | | |
Fortsæt med at overvåge hver time eller deromkring, indtil diskpladsen er på et tilstrækkeligt niveau.
Bemærk: Lad ikke AutoBalanceLin køre til ende. Jobbet skifter data i den modsatte retning, hvilket kan begynde at producere uønskede resultater. Den forbrugte diskplads kan vende, hvilket muligvis fører til en næsten fuld nodepulje igen. Kør kun jobbet i et par timer.
En times point:
X410-2# date Thu Jun 14 17:54:30 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 25.2T (30%) 33.9G (2%) Avail: 60.0T (70%) 2.1T (98%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |881.6|20.6k|21.5k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 6|10.5.80.191 |-A-- | 0| 0| 0| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) 7|10.5.80.192 | OK | 2.2k| 216k| 218k| 8.4T/31.5T( 27%)|11.3G/ 738G( 2%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK |385.7|29.5k|29.9k|25.2T/85.2T( 30%)|33.9G/ 2.2T( 2%) X410-2# date Thu Jun 14 18:54:43 CDT 2018 Node Pool Name: x410_archive Protection: +2d:1n Pool Storage: HDD SSD Storage Size: 85.2T (94.6T Raw) 2.2T (2.2T Raw) VHS Size: 9.4T Used: 21.6T (25%) 26.8G (1%) Avail: 63.6T (75%) 2.1T (99%) Throughput (bps) HDD Storage SSD Storage Name Health| In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 5|10.5.80.190 | OK |22.9k| 1.4M| 1.5M| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 6|10.5.80.191 |-A-- |881.6| 231k| 232k| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) 7|10.5.80.192 | OK | 0| 0| 0| 7.2T/31.5T( 23%)| 8.9G/ 738G( 1%) -------------------+-----+-----+-----+-----+-----------------+----------------- x410_archive | OK | 3.0k| 210k| 213k|21.6T/85.2T( 25%)|26.8G/ 2.2T( 1%)
Rummet er tilstrækkeligt ryddet op. AutoBalanceLIn-jobbet kan annulleres, da de ønskede resultater er opnået.