PowerScale: Var-osion laajennusongelmat
Summary: /var-osion laajennus saattaa aiheuttaa varoitusviestejä IOCA:ssa (Isilon On-Cluster Analysis Tool). Ongelmat liittyvät solmun paniikkiin, joka saattaa ilmetä, kun asemakelkkaa irrotetaan huoltosyistä. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Nykyinen IOCA (Isilon On-Cluster Analysis Tool) -komentosarja luo seuraavat varoitukset, jotka liittyvät
Kun solmu avautuu, tarkista
/var Osioita:
System Partition Free Space FAIL CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please reference KB 000213248 (https://www.dell.com/support/kbdoc/000213248) for further information. INFO: For more information refer to KB article 000041465 found at https://www.dell.com/support/kbdoc/000041465.tai
Mirror Status FAIL CRITICAL: The mirror pair for var1 appear to be in the same fault domain on nodes: 1-10. CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please open a Technical Support Service Request and reference this failure within the description. INFO: Please refer to KB 000213248 (https://www.dell.com/support/kbdoc/en-us/000213248) for further information.Jos tämä ohitetaan, Gen6- tai Gen6 MLK -solmussa voi ilmetä Panic-virhe aseman tai kelkan vaihdon aikana.
Kun solmu avautuu, tarkista
/var/log/messages Solmun tiedostossa näkyy seuraavanlaisia virheitä ja paniikkiviestejä:
(da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543174480, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 5 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 5 (da21:pmspcbsd0:0:22:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): CAM status: CCB request aborted by the host (da22:pmspcbsd0:0:23:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): Retrying command, 3 more tries remain (da22:pmspcbsd0:0:23:0): CAM status: CCB request aborted by the host (da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543151fe0, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 2 (da22:pmspcbsd0:0:23:0): Retrying command, 3 more tries remain (da21:pmspcbsd0:0:22:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff80e31347000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 2 (da21:pmspcbsd0:0:22:0): Invalidating pack (da22:pmspcbsd0:0:23:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff807c4753000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): Invalidating pack (da21:pmspcbsd0:0:22:0): removing device entry (da21:pmspcbsd0:0:22:0): Periph destroyed panic @ time 1681142660.493, thread 0xfffffe874ee12000: mirror/var1: all devices failed (read, offset 1304707072, length 0) time = 1681142660 cpuid = 3, TSC = 0x5e76342b8e8e59 Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:g_mirror_worker+0x251f kernel:fork_exit+0x82 -------------------------------------------------- Disabling swatchdog Dumping stacks (40960 bytes)
Cause
Versioissa 9.2.1.16 ja uudemmissa, 9.4.0.6:ssa ja uudemmissa versioissa sekä 9.5.0.0:ssa ja uudemmissa OneFS laajentaa /var-osion koon 2 gigatavuun päivityksen yhteydessä. Laajennusprosessi saattaa käynnistää nämä viestit tai tapahtumat.
Ilmoitus, joka liittyy siihen, että peilipari on samalla vikatoimialueella, koskee Gen6- ja Gen6 MLK -solmuja (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 ja F810). Laajennus ei välttämättä vahvista osion vikatoimialueita oikein, jolloin molemmat osiot sijoitetaan jompaankumpaan
Myöskään
Katkaistu
Var-osioiden eri koot voivat vaikuttaa mihin tahansa Isilon- tai PowerScale-solmutyyppiin, jossa on OneFS 9.x. Laajennus
Voit selvittää, vaikuttaako tämä ongelma klusterin LKG-osioon, seuraavalla komennolla:
Yllä olevassa esimerkissä laboratorio-2:t
Ilmoitus, joka liittyy siihen, että peilipari on samalla vikatoimialueella, koskee Gen6- ja Gen6 MLK -solmuja (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 ja F810). Laajennus ei välttämättä vahvista osion vikatoimialueita oikein, jolloin molemmat osiot sijoitetaan jompaankumpaan
/var Saman aseman kelkan asemien peilaus. Tämä aiheuttaa solmun paniikin, kun kelkka irrotetaan, jos molemmat asennetun peilit /var Osiot ovat kelkassa.
Myöskään
mirror/var0 tai mirror/var1 toimii aktiivisena /var Osion peilaus milloin tahansa. Esimerkin paniikkiviestistä nähdään, että /mirror/var1 oli aktiivinen peili. Tarkasteltaessa gmirror status ja isi devices drive list solmun komentojen tulokset:
Katkaistu
status Komennon tulos:
gmirror status mirror/var1 COMPLETE da14p3 (ACTIVE) <<<< da13p3 (ACTIVE) <<<<pikanäppäimellä
drive list Komennon tulos:
isi devices drive list Lnn Location Device Lnum State Serial Sled --------------------------------------------------------- 21 Bay 1 /dev/da1 15 L3 xxxxxxxxxxxx N/A 21 Bay 2 /dev/da2 16 L3 xxxxxxxxxxxx N/A 21 Bay A0 /dev/da5 12 HEALTHY xxxxxxxx A 21 Bay A1 /dev/da4 13 HEALTHY xxxxxxxx A 21 Bay A2 /dev/da3 14 HEALTHY xxxxxxxx A 21 Bay B0 /dev/da8 9 HEALTHY xxxxxxxx B 21 Bay B1 /dev/da7 10 HEALTHY xxxxxxxx B 21 Bay B2 /dev/da6 11 HEALTHY xxxxxxxx B 21 Bay C0 /dev/da11 6 HEALTHY xxxxxxxx C 21 Bay C1 /dev/da10 7 HEALTHY xxxxxxxx C 21 Bay C2 /dev/da9 8 HEALTHY xxxxxxxx C 21 Bay D0 /dev/da14 3 HEALTHY xxxxxxxx D <<<< 21 Bay D1 /dev/da13 4 HEALTHY xxxxxxxx D <<<< 21 Bay D2 /dev/da12 5 HEALTHY xxxxxxxx D 21 Bay E0 /dev/da17 0 HEALTHY xxxxxxxx E 21 Bay E1 /dev/da16 1 HEALTHY xxxxxxxx E 21 Bay E2 /dev/da15 2 HEALTHY xxxxxxxx E ---------------------------------------------------------Tässä esimerkissä
/mirror/var1 perustuu asemiin D0 ja D1. Kun D-kelkka irrotetaan klusterista, solmu joutui paniikkiin, koska se ei voinut käyttää /var tiedostojärjestelmä.
Var-osioiden eri koot voivat vaikuttaa mihin tahansa Isilon- tai PowerScale-solmutyyppiin, jossa on OneFS 9.x. Laajennus
/var Laajentaa vain aktiivisen /var osio järjestelmässä. LKG (Last Known Good) -osio on edelleen alkuperäisen kokoinen. Jos aktiivinen /var Osiota laajennetaan ja se täytetään yli 50 prosenttiin, mikä voi aiheuttaa ongelmia, jos osiota on kierrettävä huoltoa varten.
Voit selvittää, vaikuttaako tämä ongelma klusterin LKG-osioon, seuraavalla komennolla:
# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media"Esimerkki:
lab-1# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media" lab-1: 1. Name: mirror/var0 lab-1: Mediasize: 2147479552 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-2: 1. Name: mirror/var0 lab-2: Mediasize: 2147479552 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-3: 1. Name: mirror/var0 lab-3: Mediasize: 2147479552 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-4: 1. Name: mirror/var0 lab-4: Mediasize: 2147479552 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) ....Jos jonkin laitteen koko on (1,0 G), ongelma koskee sitä.
Yllä olevassa esimerkissä laboratorio-2:t
var0 Tämä vaikuttaa osioihin ja ne on korjattava. Suorita uudelleen komento var1 koko klusterissa sen määrittämiseksi, koskeeko ongelma myös sitä.Resolution
FAULT DOMAIN ISSUE ONLY -ongelman pysyvä korjaus on seuraavissa koodiversioissa:
Komentosarjan käyttäminen:
- OneFS 9.5.0.6
- 9.4.0.16
- 9.2.1.25
Huomautus: Ongelmaa ei voi ratkaista manuaalisesti tai alla olevan komentosarjan avulla klustereissa, jotka toimivat yhteensopivuustilassa. Jos klusteri on SmartLock-yhteensopivuustilassa, ongelma voidaan korjata päivittämällä yllä lueteltuun OneFS-versioon. Jos päivitys ei onnistu ongelman korjaamiseksi, ota yhteyttä Dellin tukeen ja pyydä DA-korjausta. Ongelman korjaava komentosarja on saatavilla. Ota yhteys Dell-tukeen saadaksesi tiedostot ja noudata alla olevia ohjeita.
Komentosarjan käyttäminen:
- Lataa komentosarja ja md5-tiedosto klusteriin. Kopioi tiedostot klusterin kansioon /ifs/data/Isilon_Support ja varmista, että md5-hajautusarvo vastaa md5-tiedoston hajautusarvoa:
Lab-1# mv var_mirror_repair.sh /ifs/data/Isilon_Support/ Lab-1# mv var_mirror_repair.md5 /ifs/data/Isilon_Support/ Lab-1# md5 /ifs/data/Isilon_Support/var_mirror_repair.sh MD5 (/ifs/data/Isilon_Support/var_mirror_repair.sh) = 0881afeeb39fdaf02e2a90d784e4ed21 Lab-1# # cat /ifs/data/Isilon_Support/var_mirror_repair.md5 0881afeeb39fdaf02e2a90d784e4ed21
- Jos hajautusarvo ei täsmää, lataa komentosarja FTP-sivustosta ja kopioi se klusteriin uudelleen. Jos hajautusarvo täsmää, suorita seuraava komento pääkäyttäjänä:
lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh
- Komentosarjan suorittaminen kestää yleensä 5–10 minuuttia. Se voi kestää kauemmin suurissa (30+ solmua) tai kiireisissä klustereissa. Kun komentosarja on valmis, se ilmoittaa, onnistuiko se vai oliko siinä ongelmia.
Kun käynnistät komentosarjan, näet seuraavan tuloksen:
Lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh Full output can be found at: /ifs/data/Isilon_Support/var_mirror_repair.FULL_CLUSTER.2023-10-19T092522.csv Status: 0/4 Nodes checked, 0/4 var0 partitions, 0/4 var1 partitions
Komentosarjan edetessä tilarivi päivittyy:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions
Kun komentosarja on valmis, näet seuraavat:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions No issues were identified. Moving files to: var_mirror_repair.2023-10-19T092522.d Bundle Location: var_mirror_repair.2023-10-19T092522.tgz
Tämä tarkoittaa, että kaikki solmut, joihin ongelma vaikutti, korjattiin eikä komentosarjassa ollut ongelmia. Jos saatu tulos poikkeaa esimerkistä, ota yhteys Dellin tukeen ja toimita tulos ja lokitiedostot paketin sijainnista.
Affected Products
Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, PowerScale Archive A300, PowerScale Archive A3000, PowerScale Hybrid H700, PowerScale Hybrid H7000Products
PowerScale F200, PowerScale F600, PowerScale F900Article Properties
Article Number: 000213248
Article Type: Solution
Last Modified: 06 Jan 2026
Version: 21
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.