PowerFlex-tiedostojärjestelmää ei tunnisteta uudelleenkäynnistyksen jälkeen
Summary: Tiedostojärjestelmä on vioittunut tai sitä ei ole uudelleenkäynnistyksen jälkeen.
Symptoms
Tilanne
- Luo tiedostojärjestelmä ScaleIO-laitteeseen (scinia, sinib,...)
- Liitä tiedostojärjestelmä hakemistoon /dev/scinia
- Käynnistä palvelin uudelleen
Oireet
Uudelleenkäynnistyksen jälkeen käyttäjä ei pysty ottamaan tiedostojärjestelmää käyttöön.
Kun palvelin oli suorittanut uudelleenkäynnistyksen, en voinut ottaa tiedostojärjestelmää käyttöön enkä korjata sitä fsck:llä.
# mount /dev/scinia /mnt
mount: you must specify the filesystem type
# mount -t ext4 /dev/scinia /mnt
mount: wrong fs type, bad option, bad superblock on /dev/scinia,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
# fsck /dev/scinia
fsck from util-linux-ng 2.17.2
e2fsck 1.41.12 (17-May-2010)
fsck.ext4: Superblock invalid, trying backup blocks...
fsck.ext4: Bad magic number in super-block while trying to open /dev/scinia
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock: e2fsck -b 8193
# e2fsck -b 8193 /dev/scinia
e2fsck 1.41.12 (17-May-2010)
e2fsck: Bad magic number in super-block while trying to open /dev/scinia
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock:
e2fsck -b 8193 <device>not
Kohteesta /var/log/messages:
[Reboot occurred here] Dec 18 13:15:48 e8c4-dl360g7-01 kernel: ECS R1_20:Created device scinia (16,0). Capacity 33554432 LB Dec 18 13:15:48 e8c4-dl360g7-01 kernel: scinia: unknown partition table Dec 18 13:25:21 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:26:58 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:27:11 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:28:30 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:33:26 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:34:07 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 16:11:00 e8c4-dl360g7-01 kernel: ECS R1_20:Created device scinia (16,0). Capacity 33554432 LB Dec 18 16:11:00 e8c4-dl360g7-01 kernel: scinia: unknown partition table Dec 18 16:11:00 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem
Vaikutus
Tiedostojärjestelmä näyttää käyttökelvottomalta ja vioittuneelta.
Cause
Kun Linux tulee esiin uudelleenkäynnistyksen jälkeen, se alkaa skannata laitteita ja määrittää automaattisesti kirjaimet laitteelle tilauksesta (ensin hän löytää - saat ensimmäisen kirjaimen). Yleensä, kun käyttäjä ei muuta mitään, uudelleenkäynnistyksen jälkeen laitteet keksivät saman laitteen nimen, mutta joskus laitteen nimi voi muuttua ja määrittää toiselle laitteelle.
Jos käyttäjä on asentanut tiedostojärjestelmänsä tiedostojärjestelmään /dev/sciniX eikä laitteen UUID:hen, hän voi ajatella, että tiedostojärjestelmä on vioittunut, mutta se on määritetty eri laitenimelle. Tämä on Linux-ongelma eikä liity vain ScaleIO: hon.
Esimerkki: Käyttäjällä oli 10 laitetta, sitten hän pienensi sen 5: een ja käynnisti uudelleen vasta päivää myöhemmin. Voit nähdä, että sciniaan määritetty laite määritetään myöhemmin toiseen laitteeseen.
17. (10 laitteesta 5 laitteeseen vähentämisen jälkeen)
Palvelimella-01
# ls -l /dev/disk/by-id/scaleio* lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7a0000000c -> ../../scinij lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7b0000000d -> ../../scinib lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7c0000000e -> ../../scinii lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7d0000000f -> ../../scinia lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7e00000010 -> ../../scinih
Nyt: eli uudelleenkäynnistyksen jälkeen 18. päivänä, kun tiedostojärjestelmä (FS) "katosi"
ls -l /dev/disk/by-id/scaleio* lrwxrwxrwx 1 root root 12 Dec 19 10:51 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7a0000000c -> ../../scinia lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7b0000000d -> ../../scinid lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7c0000000e -> ../../scinic lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7d0000000f -> ../../scinie lrwxrwxrwx 1 root root 12 Dec 19 10:33 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7e00000010 -> ../../scinib
Resolution
Kiertotapa
Pyydä käyttäjää käyttämään kiinnitykseen UUID-tunnusta.
Esimerkki: Niiden tulisi yhdistää taltio käyttämällä laitteen uuid-tunnusta eikä laitteen nimeä:
ls /dev/disk/by-uuid/ to find out the UUID
Esimerkki fstab-merkinnästä:
UUID=<UUID> <mount point> ext4 defaults,errors=remount-ro 0 1