PowerFlex: Mislykket disk med forkert enheds-id

Summary: ScaleIO-systemdisk vises som mislykket, når den blev brugt på en anden SDS-node.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Scenarie

Når en kunde bruger det samme diskkabinet til to SDS-noder eller flere, skal de konfigurere offline/online for hver disk og den node, den tilhører.

Nogle gange kan kunden tage fejl og online den samme disk på begge SDS-noder, og så ser vi en disk som mislykket.

Mulige fejl:

  • Kunden online den samme disk på begge SDS-noder, og så ser vi en disk som mislykket.
  • Kunden bytter diske, hvilket betyder, at hver disk er online på den forkerte node, i så fald ser vi to defekte drev, et på hver SDS-node.

 

Symptomer

Det forkerte diskenheds-id blev fundet af SDS-noden, og SDS-processen indstillede disken til mislykket tilstand.

På SDS-processen startes efter mosConf-delen SDS-processen flyttes til registrering af fysiske enheder, når disken ikke er til scaleio-brug (f.eks. system-, OS-disk eller ledig disk), vises fejlen "Ugyldig enhedsheadersignatur" (første linje i outputtet). Når disken bruges af ScaleIO, findes der en enhed, og enheds-id'et vises ved siden af den.

På det første output nedenfor (trc-fil fra server 1) kan vi se, at der blev fundet 12 enheder, men når vi ser nøje, kan vi se, at to enheder er forskellige (L, M) - den 12. char i enheds-id er 3 og ikke 0 som alle de andre enheds-id'er.

På den anden udgang nedenfor (trc-fil fra server 2) blev der fundet 12 diske, og igen er to diske forskellige (K, L) - den 12. char i enheds-id er 0 og ikke 3 som alle de andre enheds-id'er.

Efter opdagelsesprocessen flytter SDS-processen til at tilføje enheder tilbage til SDS, når SDS ikke finder disken rc-resultatet bliver NOT_FOUND (trc-fil fra server 1), som vi kan se i eksemplerne nedenfor, på hvert SDS har vi diske med enheds-id, der ikke tilhører dets SDS, SDS viser disse diske som MISLYKKET, fordi de er NOT_FOUND (trc-fil fra server 1).

 

TRC-fil fra server 1

30/04 09:48:16.328000 000000A170629EA0:phyDev_ReadDevId:02679: Invalid device header signature : path=C, devVersion=2807280628052804, sigStart=2803280228012800, sigEnd=283b283a28392838
30/04 09:48:16.328000 000000A170629EA0:phyDevMap_ReloadSpecific:00128: Failed to read DeviceId of C. rc=351
30/04 09:48:16.329000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dcd00000000
30/04 09:48:16.330000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dce00000001
30/04 09:48:16.331000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dcf00000002
30/04 09:48:16.332000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dd000000003
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dd100000004
30/04 09:48:16.333000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044bf00000005
30/04 09:48:16.337000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c400030006
30/04 09:48:16.342000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c000030005
30/04 09:48:16.343000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cb00000008
30/04 09:48:16.344000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bcf00000009
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd30000000a
30/04 09:48:16.345000 000000A170629EA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbd792df0000000b
...
30/04 09:48:16.345000 000000A1730BCEA0:contCmd_AddDev:01204: DevId a2901dce00000001 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173086EA0:contCmd_AddDev:01204: DevId a29044c700000007 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173098EA0:contCmd_AddDev:01204: DevId a2906bd30000000a - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01204: DevId fbd792e50000000c - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730B3EA0:contCmd_AddDev:01204: DevId a2901dcf00000002 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A17310DEA0:contCmd_AddDev:01204: DevId a2901dcd00000000 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A173062EA0:contCmd_AddDev:01204: DevId a29044cb00000008 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730C5EA0:contCmd_AddDev:01204: DevId a2901dd100000004 - Start rc = SUCCESS
30/04 09:48:16.346000 000000A1730E0EA0:contCmd_AddDev:01391: DevId fbd792e50000000c - Done rc = NOT_FOUND
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01204: DevId fbd792ee0000000e - Start rc = SUCCESS
30/04 09:48:16.348000 000000A1730A1EA0:contCmd_AddDev:01391: DevId fbd792ee0000000e - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01204: DevId fbd792e90000000d - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17306BEA0:contCmd_AddDev:01204: DevId a2901dd000000003 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A17307DEA0:contCmd_AddDev:01204: DevId a2906bcf00000009 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173074EA0:contCmd_AddDev:01204: DevId a29044bf00000005 - Start rc = SUCCESS
30/04 09:48:16.349000 000000A173086EA0:contCmd_AddDev:01391: DevId a29044c700000007 - Done rc = NOT_FOUND
30/04 09:48:16.349000 000000A1730F2EA0:contCmd_AddDev:01391: DevId fbd792e90000000d - Done rc = NOT_FOUND
30/04 09:48:16.351000 000000A1730FBEA0:contCmd_AddDev:01204: DevId fbd792ef0000000f - Start rc = SUCCESS
30/04 09:48:16.352000 000000A1730FBEA0:contCmd_AddDev:01391: DevId fbd792ef0000000f - Done rc = NOT_FOUND
30/04 09:48:16.352000 000000A173104EA0:contCmd_AddDev:01391: DevId a29044c300000006 - Done rc = NOT_FOUND

TRC-fil fra server 2

30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device F ,a2901dc800030000
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device G ,a2901dc900030001
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device H ,a2901dca00030002
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device I ,a2901dcb00030003
30/04 11:37:57.065000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device J ,a2901dcc00030004
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device K ,a29044c300000006
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device L ,a29044c700000007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device M ,a29044c800030007
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device N ,a29044cc00030008
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device O ,a2906bd000030009
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device P ,a2906bd40003000a
30/04 11:37:57.081000 000000EE1DC2AEA0:phyDevMap_ReloadSpecific:00136: Found device Q ,fbda92e00003000b

 

SDS-enheds-id forklaret

Hver SDS-enhed har en header gemt på sin 64. LB.

Overskriften har følgende struktur:

                64-bit signatur

                64-bit enhedsversion

                64-bit SDS-id

                64-bit SDS-enheds-id ß det, du leder efter.

SDS-enheds-id'et, også kendt som TgtDevId, består af følgende:

Unikt id 32 bit

TGT-indeks 16 bit

Enhedsindeks 16 bit

 

For eksempel: Et SDS med id'et 2df4737600000002 ville have to enheder med id'erne: 7FFF29EA00020000, 7FFF29EB00020001

Under alle omstændigheder, hvis en enhed, der tilhører SDS x, blev byttet til SDS y, finder den ud af, at den tilhører et andet SDS, når den tilslutter enheden til SDS y igen, ved at kontrollere SDS-id'et, der er gemt i overskriften.

Du kan måske se det i SDS-logfilerne, hvis du søger efter "Forkert enhed"

 

Påvirkning

Systemet genopbygges og balanceres, da disken er i FAILED tilstand.

Cause

Diskenheds-id tilhører en anden SDS-node, og derfor vil ScaleIO aldrig bruge det.

 

Resolution

Tilføjelse af disken til den korrekte SDS-node.

Påvirkede versioner

Alle PowerFlex-versioner

Løst i version

Arbejd som design.

Affected Products

VxFlex Product Family

Products

VxFlex Product Family
Article Properties
Article Number: 000048300
Article Type: Solution
Last Modified: 07 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.