PowerFlex-bestandssysteem wordt niet herkend na opnieuw opstarten
Summary: Beschadiging van het bestandssysteem of niet aanwezig na opnieuw opstarten.
Symptoms
Scenario
- Een bestandssysteem maken op een ScaleIO-apparaat (scinia, sinib,...)
- Koppel het bestandssysteem op /dev/scinia
- Start de server opnieuw op
Symptomen
Na het opnieuw opstarten kan de gebruiker het bestandssysteem niet koppelen.
Toen de server klaar was met de herstart, was ik niet in staat om het bestandssysteem te mounten, noch te repareren met fsck.
# mount /dev/scinia /mnt
mount: you must specify the filesystem type
# mount -t ext4 /dev/scinia /mnt
mount: wrong fs type, bad option, bad superblock on /dev/scinia,
missing codepage or helper program, or other error
In some cases useful info is found in syslog - try
dmesg | tail or so
# fsck /dev/scinia
fsck from util-linux-ng 2.17.2
e2fsck 1.41.12 (17-May-2010)
fsck.ext4: Superblock invalid, trying backup blocks...
fsck.ext4: Bad magic number in super-block while trying to open /dev/scinia
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock: e2fsck -b 8193
# e2fsck -b 8193 /dev/scinia
e2fsck 1.41.12 (17-May-2010)
e2fsck: Bad magic number in super-block while trying to open /dev/scinia
The superblock could not be read or does not describe a correct ext2
filesystem. If the device is valid and it really contains an ext2
filesystem (and not swap or ufs or something else), then the superblock
is corrupt, and you might try running e2fsck with an alternate superblock:
e2fsck -b 8193 <device>not
From /var/log/messages:
[Reboot occurred here] Dec 18 13:15:48 e8c4-dl360g7-01 kernel: ECS R1_20:Created device scinia (16,0). Capacity 33554432 LB Dec 18 13:15:48 e8c4-dl360g7-01 kernel: scinia: unknown partition table Dec 18 13:25:21 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:26:58 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:27:11 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:28:30 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:33:26 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 13:34:07 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem Dec 18 16:11:00 e8c4-dl360g7-01 kernel: ECS R1_20:Created device scinia (16,0). Capacity 33554432 LB Dec 18 16:11:00 e8c4-dl360g7-01 kernel: scinia: unknown partition table Dec 18 16:11:00 e8c4-dl360g7-01 kernel: EXT4-fs (scinia): VFS: Can't find ext4 filesystem
Impact
Het bestandssysteem ziet er onbruikbaar en beschadigd uit.
Cause
Wanneer Linux na het opnieuw opstarten verschijnt, begint het de apparaten te scannen en wijst het automatisch letters toe aan het apparaat op volgorde (eerst vindt hij - krijg de eerste letter). Wanneer de gebruiker niets wijzigt, krijgen de apparaten na het opnieuw opstarten meestal dezelfde apparaatnaam, maar soms kan de apparaatnaam worden gewijzigd en aan een ander apparaat worden toegewezen.
Als de gebruiker zijn bestandssysteem heeft gekoppeld aan /dev/sciniX en niet aan de UUID van het apparaat, kan hij denken dat het bestandssysteem beschadigd is, maar het is toegewezen aan een andere apparaatnaam. Dit is een Linux-probleem en niet alleen ScaleIO-gerelateerd.
Voorbeeld: De gebruiker had 10 apparaten, daarna bracht hij het terug tot 5 en startte hij pas een dag later opnieuw op. U kunt zien dat het apparaat dat aan scinia is toegewezen, later aan een ander apparaat is toegewezen.
17e(na reductie van 10 naar 5 apparaten)
Op server-01
# ls -l /dev/disk/by-id/scaleio* lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7a0000000c -> ../../scinij lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7b0000000d -> ../../scinib lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7c0000000e -> ../../scinii lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7d0000000f -> ../../scinia lrwxrwxrwx 1 root root 12 Dec 17 12:00 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7e00000010 -> ../../scinih
Nu: d.w.z. na opnieuw opstarten op de 18e toen bestandssysteem (FS) "verdween"
ls -l /dev/disk/by-id/scaleio* lrwxrwxrwx 1 root root 12 Dec 19 10:51 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7a0000000c -> ../../scinia lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7b0000000d -> ../../scinid lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7c0000000e -> ../../scinic lrwxrwxrwx 1 root root 12 Dec 19 10:24 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7d0000000f -> ../../scinie lrwxrwxrwx 1 root root 12 Dec 19 10:33 /dev/disk/by-id/scaleio-vol-376584c0169c4216-49ff9f7e00000010 -> ../../scinib
Resolution
Tijdelijke oplossing
Vraag de gebruiker om UUID te gebruiken voor de koppeling.
Voorbeeld: Ze moeten het volume toewijzen met behulp van apparaat-uuid en niet met de apparaatnaam:
ls /dev/disk/by-uuid/ to find out the UUID
Voorbeeld voor fstab-invoer:
UUID=<UUID> <mount point> ext4 defaults,errors=remount-ro 0 1