PowerFlex: Selhal disk s nesprávným ID zařízení.
Summary: Systémový disk ScaleIO se zobrazuje jako neúspěšný, pokud byl použit na jiném uzlu SDS.
Symptoms
Scénář
Když zákazník používá stejnou diskovou skříň pro dva nebo více uzlů SDS, musí nakonfigurovat režim offline/online pro každý disk a uzel, ke kterému náleží.
Někdy se zákazník může splést a online stejný disk na obou uzlech SDS a pak se jeden disk zobrazí jako vadný.
Možné chyby:
- Zákazník online najde stejný disk na obou uzlech SDS a pak vidíme jeden disk jako neúspěšný.
- Zákazník vymění disky, což znamená, že každý disk je online na nesprávném uzlu. V takovém případě vidíme jeden vadný disk na každém uzlu SDS.
Příznaky
Uzel SDS nalezl nesprávné ID diskového zařízení a proces SDS nastavil disk do stavu FAIL.
Při spuštění procesu SDS po mosConf části se proces SDS přesune na detekci fyzických zařízení, když disk není určen pro použití v měřítku (jako disk s OS systému nebo volný disk), zobrazí se chyba "Invalid device header signature" (první řádek ve výstupu). Když je disk používán ScaleIO, je nalezeno zařízení a vedle něj je zobrazeno ID zařízení.
Na prvním výstupu níže (trc soubor ze serveru 1) vidíme, že bylo nalezeno 12 zařízení, ale při bližším pohledu vidíme, že dvě zařízení jsou odlišná (L,M) - 12. znak v ID zařízení je 3 a ne 0 jako ID všech ostatních zařízení.
Na druhém výstupu níže (trc soubor ze serveru 2) bylo nalezeno 12 disků a opět dva disky jsou odlišné (K,L) - 12. znak v ID zařízení je 0 a ne 3 jako všechna ostatní ID zařízení.
Poté, co proces zjišťování SDS přesune na přidávání zařízení zpět do SDS, když SDS nenajde disk rc výsledek bude NOT_FOUND (trc file ze serveru 1), jak vidíme v příkladech níže, na každém SDS máme disky s ID zařízení, které nepatří do jeho SDS, SDS zobrazí tyto disky jako FAILED, protože jsou NOT_FOUND (trc file ze serveru 1).
Soubor TRC ze Serveru 1
30/04 09:48:16.328000 000000A170629EA0:phyDev_ReadDevId:02679: Invalid device header signature : path=C, devVersion=2807280628052804, sigStart=2803280228012800, sigEnd=283b283a28392838
30/04 09:48:16.328000 000000A170629EA0:phyDevMap_ReloadSpecific:00128: Failed to read DeviceId of C. rc=351
30/04 09:48:16.329000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dcd00000000
30/04 09:48:16.330000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dce00000001
30/04 09:48:16.331000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dcf00000002
30/04 09:48:16.332000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dd000000003
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dd100000004
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044bf00000005
30/04 09:48:16.337000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c400030006
30/04 09:48:16.342000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c000030005
30/04 09:48:16.343000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cb00000008
30/04 09:48:16.344000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bcf00000009
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd30000000a
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbd792df0000000b
...
30/04 09:48:16.345000 000000A1730BCEA0:contCmd_AddDev:01204: DevId a2901dce00000001 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173086EA0:contCmd_AddDev:01204: DevId a29044c700000007 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173098EA0:contCmd_AddDev:01204: DevId a2906bd30000000a - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01204: DevId fbd792e50000000c - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730B3EA0:contCmd_AddDev:01204: DevId a2901dcf00000002 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A17310DEA0:contCmd_AddDev:01204: DevId a2901dcd00000000 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173062EA0:contCmd_AddDev:01204: DevId a29044cb00000008 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730C5EA0:contCmd_AddDev:01204: DevId a2901dd100000004 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01391: DevId fbd792e50000000c - Done rc = NOT_FOUND
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01204: DevId fbd792ee0000000e - Start rc = SUCCESS
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01391: DevId fbd792ee0000000e - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01204: DevId fbd792e90000000d - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17306BEA0:contCmd_AddDev:01204: DevId a2901dd000000003 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17307DEA0:contCmd_AddDev:01204: DevId a2906bcf00000009 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173074EA0:contCmd_AddDev:01204: DevId a29044bf00000005 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173086EA0:contCmd_AddDev:01391: DevId a29044c700000007 - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01391: DevId fbd792e90000000d - Done rc = NOT_FOUND
30/04 09:48:16.351000 000000A1730FBEA0:contCmd_AddDev:01204: DevId fbd792ef0000000f - Start rc = SUCCESS
30/04 09:48:16.352000 000000A1730FBEA0:contCmd_AddDev:01391: DevId fbd792ef0000000f - Done rc = NOT_FOUND
30/04 09:48:16.352000 000000A173104EA0:contCmd_AddDev:01391: DevId a29044c300000006 - Done rc = NOT_FOUND
Soubor TRC ze Serveru 2
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dc800030000
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dc900030001
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dca00030002
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dcb00030003
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dcc00030004
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044c300000006
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c700000007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c800030007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cc00030008
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bd000030009
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd40003000a
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbda92e00003000b
Vysvětlení ID zařízení SDS
Každé zařízení SDS má hlavičku uloženou na 64. LB.
Hlavička má následující strukturu:
64bitový podpis
64bitová verze zařízení
64bitové ID SDS
64bitový SDS Device ID ß to, co hledáte.
ID zařízení SDS, označované také jako TgtDevId, se skládá z následujících částí:
Jedinečné ID 32 bitů
Index TGT 16 bitů
Index zařízení 16 bitů
Například: Disk SDS s ID 2df4737600000002 bude mít dvě zařízení s ID: 7fff29ea00020000, 7fff29eb00020001
Každopádně, pokud bylo zařízení patřící do SDS x vyměněno za SDS y, pak po opětovném připojení zařízení do SDS y zjistí, že patří do jiného SDS, a to kontrolou ID SDS uloženého v hlavičce.
V protokolech SDS ji možná uvidíte, když vyhledáte "Wrong device"
Důsledky
Opětovné sestavení a vyvážení systému, když je disk ve stavu SELHÁNÍ.
Cause
ID diskového zařízení patří jinému uzlu SDS, proto je ScaleIO nikdy nepoužije.
Resolution
Přidání disku do správného uzlu SDS.
Dotčené verze
Všechny verze PowerFlex
Opraveno ve verzi
Pracujte jako design.