PowerScale: Problemi di espansione della partizione Var
Summary: L'espansione della partizione /var può causare messaggi di avvertenza nello strumento Isilon On-Cluster Analysis (IOCA). I problemi sono correlati a un errore irreversibile del nodo che può verificarsi durante la rimozione di uno sled di unità per scopi di manutenzione. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Lo script Isilon On-Cluster Analysis tool (IOCA) corrente genera i seguenti avvisi correlati a
Quando si attiva il nodo, rivedere la proprietà
/var Partizioni:
System Partition Free Space FAIL CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please reference KB 000213248 (https://www.dell.com/support/kbdoc/000213248) for further information. INFO: For more information refer to KB article 000041465 found at https://www.dell.com/support/kbdoc/000041465.Oppure:
Mirror Status FAIL CRITICAL: The mirror pair for var1 appear to be in the same fault domain on nodes: 1-10. CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please open a Technical Support Service Request and reference this failure within the description. INFO: Please refer to KB 000213248 (https://www.dell.com/support/kbdoc/en-us/000213248) for further information.Se ignorato, è possibile che si verifichi un errore irreversibile su un nodo MLK Gen6 o Gen6 durante una procedura di sostituzione dell'unità o dello sled.
Quando si attiva il nodo, rivedere la proprietà
/var/log/messages Il file per il nodo mostra errori e messaggi di errore irreversibile simili ai seguenti:
(da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543174480, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 5 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 5 (da21:pmspcbsd0:0:22:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): CAM status: CCB request aborted by the host (da22:pmspcbsd0:0:23:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): Retrying command, 3 more tries remain (da22:pmspcbsd0:0:23:0): CAM status: CCB request aborted by the host (da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543151fe0, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 2 (da22:pmspcbsd0:0:23:0): Retrying command, 3 more tries remain (da21:pmspcbsd0:0:22:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff80e31347000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 2 (da21:pmspcbsd0:0:22:0): Invalidating pack (da22:pmspcbsd0:0:23:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff807c4753000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): Invalidating pack (da21:pmspcbsd0:0:22:0): removing device entry (da21:pmspcbsd0:0:22:0): Periph destroyed panic @ time 1681142660.493, thread 0xfffffe874ee12000: mirror/var1: all devices failed (read, offset 1304707072, length 0) time = 1681142660 cpuid = 3, TSC = 0x5e76342b8e8e59 Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:g_mirror_worker+0x251f kernel:fork_exit+0x82 -------------------------------------------------- Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Nelle versioni 9.2.1.16 e successive, 9.4.0.6 e versioni successive e 9.5.0.0 e versioni successive, OneFS espande la dimensione della partizione /var a 2 GB durante un aggiornamento. Il processo di espansione può causare l'attivazione di questi messaggi o eventi.
Il messaggio correlato alla coppia di mirror nello stesso dominio di errore è specifico per i nodi MLK Gen6 e Gen6 (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 e F810). L'espansione potrebbe non convalidare correttamente i domini di errore delle partizioni, inserendo entrambe le partizioni per uno dei due
O
Truncated
Le diverse dimensioni delle partizioni var possono influire su qualsiasi tipo di nodo Isilon o PowerScale che esegue OneFS 9.x. L'espansione per
Per determinare se questo problema interessa una partizione LKG nel cluster, utilizzare il seguente comando:
Nell'esempio precedente, lab-2
Il messaggio correlato alla coppia di mirror nello stesso dominio di errore è specifico per i nodi MLK Gen6 e Gen6 (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 e F810). L'espansione potrebbe non convalidare correttamente i domini di errore delle partizioni, inserendo entrambe le partizioni per uno dei due
/var Eseguire il mirroring sulle unità all'interno dello stesso sled di unità. Ciò causa un errore irreversibile del nodo quando lo sled viene rimosso se entrambi i mirror per il montato /var La partizione si trova nello sled.
O
mirror/var0 oppure mirror/var1 funge da attivo /var mirroring della partizione in qualsiasi momento. Il messaggio di errore irreversibile nell'esempio mostra che /mirror/var1 era lo specchio attivo. Guardando al gmirror status e isi devices drive list output del comando per node:
Truncated
status Output del comando:
gmirror status mirror/var1 COMPLETE da14p3 (ACTIVE) <<<< da13p3 (ACTIVE) <<<<Il comando
drive list Output del comando:
isi devices drive list Lnn Location Device Lnum State Serial Sled --------------------------------------------------------- 21 Bay 1 /dev/da1 15 L3 xxxxxxxxxxxx N/A 21 Bay 2 /dev/da2 16 L3 xxxxxxxxxxxx N/A 21 Bay A0 /dev/da5 12 HEALTHY xxxxxxxx A 21 Bay A1 /dev/da4 13 HEALTHY xxxxxxxx A 21 Bay A2 /dev/da3 14 HEALTHY xxxxxxxx A 21 Bay B0 /dev/da8 9 HEALTHY xxxxxxxx B 21 Bay B1 /dev/da7 10 HEALTHY xxxxxxxx B 21 Bay B2 /dev/da6 11 HEALTHY xxxxxxxx B 21 Bay C0 /dev/da11 6 HEALTHY xxxxxxxx C 21 Bay C1 /dev/da10 7 HEALTHY xxxxxxxx C 21 Bay C2 /dev/da9 8 HEALTHY xxxxxxxx C 21 Bay D0 /dev/da14 3 HEALTHY xxxxxxxx D <<<< 21 Bay D1 /dev/da13 4 HEALTHY xxxxxxxx D <<<< 21 Bay D2 /dev/da12 5 HEALTHY xxxxxxxx D 21 Bay E0 /dev/da17 0 HEALTHY xxxxxxxx E 21 Bay E1 /dev/da16 1 HEALTHY xxxxxxxx E 21 Bay E2 /dev/da15 2 HEALTHY xxxxxxxx E ---------------------------------------------------------In questo esempio,
/mirror/var1 si basa sulle unità D0 e D1. Quando lo sled D viene rimosso dal cluster, il nodo riscontra un errore irreversibile a causa dell'impossibilità di accedere a /var file system.
Le diverse dimensioni delle partizioni var possono influire su qualsiasi tipo di nodo Isilon o PowerScale che esegue OneFS 9.x. L'espansione per
/var espande solo il file attivo /var partizione sul sistema. La partizione Last Known Good (LKG) rimane nella dimensione originale. Se l'icona attiva /var La partizione viene espansa e riempita oltre il 50%, ciò potrebbe causare problemi se la partizione deve essere ruotata per manutenzione.
Per determinare se questo problema interessa una partizione LKG nel cluster, utilizzare il seguente comando:
# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media"Esempio:
lab-1# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media" lab-1: 1. Name: mirror/var0 lab-1: Mediasize: 2147479552 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-2: 1. Name: mirror/var0 lab-2: Mediasize: 2147479552 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-3: 1. Name: mirror/var0 lab-3: Mediasize: 2147479552 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-4: 1. Name: mirror/var0 lab-4: Mediasize: 2147479552 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) ....Se uno qualsiasi dei dispositivi viene restituito con una dimensione di (1,0 G), è interessato.
Nell'esempio precedente, lab-2
var0 Le partizioni sono interessate e devono essere corrette. Eseguire nuovamente il comando per var1 in tutto il cluster per determinare se è interessato.Resolution
La correzione permanente di FAULT DOMAIN ISSUE ONLY è disponibile nelle seguenti versioni del codice:
Per utilizzare lo script:
- OneFS 9.5.0.6
- 9.4.0.16
- 9.2.1.25
Nota: Questo problema non può essere risolto manualmente o utilizzando lo script riportato di seguito sui cluster in esecuzione in modalità conformità. Se il cluster è in modalità SmartLock Compliance, questo problema può essere risolto eseguendo l'aggiornamento alle versioni di OneFS elencate in precedenza. Se non è possibile eseguire l'aggiornamento per risolvere il problema, contattare il supporto Dell e richiedere una patch DA. È disponibile uno script per risolvere questo problema. Contattare il supporto Dell per ricevere i file, quindi seguire le istruzioni riportate di seguito.
Per utilizzare lo script:
- Scaricare lo script e il file md5 nel cluster. Copiare i file in /ifs/data/Isilon_Support sul cluster e verificare che l'hash md5 corrisponda all'hash nel file md5:
Lab-1# mv var_mirror_repair.sh /ifs/data/Isilon_Support/ Lab-1# mv var_mirror_repair.md5 /ifs/data/Isilon_Support/ Lab-1# md5 /ifs/data/Isilon_Support/var_mirror_repair.sh MD5 (/ifs/data/Isilon_Support/var_mirror_repair.sh) = 0881afeeb39fdaf02e2a90d784e4ed21 Lab-1# # cat /ifs/data/Isilon_Support/var_mirror_repair.md5 0881afeeb39fdaf02e2a90d784e4ed21
- Se l'hash non corrisponde, scaricare lo script dal sito FTP e copiarlo nuovamente nel cluster. Se l'hash corrisponde, eseguire il seguente comando come root:
lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh
- L'esecuzione dello script richiede in genere 5-10 minuti. Può richiedere più tempo su cluster di grandi dimensioni (30+ nodi) o occupati. Al termine, lo script segnala se l'operazione è stata eseguita correttamente o se si sono verificati problemi.
Quando si avvia lo script, viene visualizzato il seguente output:
Lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh Full output can be found at: /ifs/data/Isilon_Support/var_mirror_repair.FULL_CLUSTER.2023-10-19T092522.csv Status: 0/4 Nodes checked, 0/4 var0 partitions, 0/4 var1 partitions
Man mano che lo script procede, la riga Status viene aggiornata:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions
Quando lo script viene completato correttamente, viene visualizzato quanto segue:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions No issues were identified. Moving files to: var_mirror_repair.2023-10-19T092522.d Bundle Location: var_mirror_repair.2023-10-19T092522.tgz
Ciò indica che tutti i nodi interessati sono stati riparati e che lo script non ha avuto problemi. Se l'output ricevuto è diverso da questo esempio, contattare il Supporto Dell e fornire l'output e i file di log dal percorso del pacchetto.
Affected Products
Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, PowerScale Archive A300, PowerScale Archive A3000, PowerScale Hybrid H700, PowerScale Hybrid H7000Products
PowerScale F200, PowerScale F600, PowerScale F900Article Properties
Article Number: 000213248
Article Type: Solution
Last Modified: 06 Jan 2026
Version: 21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.