Data Domain: Disken kan ikke svigte | EVT-OPBEVARING 00026

Oversigt: Når RAID ikke kan svigte en disk som anmodet af Storage Subsystem Monitor (SSM), genererer Data Domain-systemet en EVT-STORAGE-00026-advarsel. Denne advarsel indeholder FailureReason-kode og BlockingReason-koder, der angiver, hvorfor anmodningen om diskfejl ikke lykkedes. Normalt er tilstanden forbigående – systemet prøver automatisk igen og svigter disken efter ca. 24 timer. I denne artikel beskrives symptomerne, den grundlæggende årsag forklares, og alle tilknyttede årsagskoder angives. ...

Denne artikel gælder for Denne artikel gælder ikke for Denne artikel er ikke knyttet til et bestemt produkt. Det er ikke alle produktversioner, der er identificeret i denne artikel.

Symptomer

  • Systemet genererer en EVT-STORAGE-00026-advarsel med en FailureReason-kode og en BlockingReason-kode i feltet med yderligere oplysninger.
  • Advarslen vises som en KRITISK – HardwareFailure-hændelse , der refererer til et bestemt kabinet- og diskslot. F.eks.:
    • Event Id:        EVT-STORAGE-00026
      Event Message:   Unable to fail the disk.
      Object:          Enclosure=6:Disk=2
      Additional Information:
      EnclosureSerialNumber=<encl.serialnumber>:DiskSerialNumber=<DiskSN>:FailureReason=<ZZZ>:BlockingReason=<XXX>
    Bemærk: <ZZZ> og <XXX> ovenfor er pladsholdervariabler for de faktiske FailureReason- og BlockingReason-koder. 
  • Advarslen opstår typisk kort efter en systemgenstart, når SSM identificerer en disk, der overskrider fejltærsklerne, og forsøger at svigte den, før RAID har samlet diskgrupperne helt.

Årsag

Under en systemgenstart scanner SSM alle diske og identificerer diske, der skal udskiftes (f.eks. diske, der har overskredet tærsklen for middelantal fejl). SSM udsteder derefter en IOCTL-anmodning til DD_RAID om at udføre en kopirekonstruktion og mislykkes på den berørte disk. Men DD_RAID er muligvis ikke færdig med at samle diskgrupperne på det tidspunkt. Da destinationsdiskgruppen endnu ikke er tilgængelig, kan DD_RAID ikke finde enheden og returnerer en fejl. Dette udløser advarslen EVT-STORAGE-00026.

 

Følgende sekvens fra systemlogfiler illustrerer tidsproblemet:

  1. SSM identificerer den defekte disk og anmoder om rekonstruktion af kopier:

    • Jul 19 09:09:04 localhost ssm: INFO: FM: Failing disk 7.38
      Jul 19 09:09:04 localhost ssm: INFO: FM: SAS BMS exceeded threshold. Trying to run copy reconstruction on 7.38 dm-25
      Jul 19 09:09:04 localhost ssm: INFO: FM: mark pending failed dm-25
      Jul 19 09:09:04 localhost ssm: INFO: FM: request RAID to do copy reconstruction dm-25
      Jul 19 09:09:04 localhost ssm: INFO: FM: RAID cannot do copy reconstruction for dm-25
  2. DD_RAID afviser IOCTL-anmodninger (copy-rebuild cmd 0x50 og disk-fail cmd 0x81), fordi diskgruppen ikke er samlet:
    • Jul 19 09:09:04 localhost kernel: (E5)[1064.801341] DD_RAID: Error ioctl detected: cmd = 0x50, error = -19
      Jul 19 09:09:04 localhost kernel: (E5)[1064.802181] DD_RAID: User requested disk failure [254:400]
      Jul 19 09:09:04 localhost kernel: (E5)[1064.802228] DD_RAID: Error ioctl detected: cmd = 0x81, error = -19
  3. Diskens enhedsmapperpost (dm-25) oprettes, men diskgruppen samles flere minutter senere:
    • Jul 19 09:06:05 localhost kernel: (E4)[884.874774] device-mapper: md @ ffff885fe9850800 dm-25 -> sdfv[131:16], sdab[65:176]
      • ....
    • Jul 19 09:12:12 localhost kernel: (E5)[1251.762266] DD_RAID: raid_level=6, level_options=3, config_disks=14, working_disks=14
      Jul 19 09:12:12 localhost kernel: (E5)[1252.037931] DD_RAID: DiskGroup [dg4][0x4458c2a8b505dd64]: Reassembled
      • Da SSM udstedte fejlanmodningen kl. 09:09:04, og diskgruppen ikke afsluttede gensamlingen før kl. 09:12:12, kunne RAID ikke behandle anmodningen.
        Systemet er designet til at udføre handlingen igen 24 timer senere og lykkes typisk.
    Bemærk: Alle logposter, der henvises til ovenfor, vises i kern.info log, som er inkluderet i en supportpakke.

Løsning

  1. Identificer årsagskoderne. Gennemse advarselsteksten EVT-STORAGE-00026, og noter værdierne FailureReason og BlockingReason . Brug tabellerne nedenfor til at fortolke hver kode.

  2. Gennemse FailureReason-koderne:

    UKENDT FEJL   000
    RAID-SKRIVEFEJL   001
    FEJLFEJL VED RAID-FORBINDELSE   002
    MELLEM FEJL  003
    YDEEVNE FEJL   004
    Ophør af SSD (EOL) 005
  3. Gennemse BlockingReason-koderne:

    Der er ikke nok reservedele tilbage på hovedenheden. Tilføj ekstra disk til hovedenheden.  001
    Der er ikke nok reservedele tilbage på den eksterne hylde. Tilføj ekstra disk til det eksterne kabinet.      002
    En genopbygning er i gang. Disken svigter, når genopbygningen er fuldført.  003
    DD_RAID er en nedbrudt tilstand. Bring DD_RAID til en normal tilstand.   004
    Ukendt årsag. Forbered udskiftning af denne disk. 005
  4. Tillad automatisk forsøg igen. Hvis advarslen opstod efter en genstart, skal du vente 24 timer. Systemet forsøger automatisk at udføre diskfejlhandlingen igen, når RAID-diskgrupperne er fuldt samlet.

  5. Udskift den defekte disk. Når systemet har svigtet disken, skal du udskifte den berørte disk i henhold til standardprocedurerne for udskiftning af Data Domain-disken.

  6. Kontakt Dell Support , hvis advarslen fortsætter efter 24 timer, eller hvis årsagskoderne angiver en tilstand, som systemet ikke kan løse automatisk.

Berørte produkter

Data Domain, DD OS 6.0

Produkter

Data Domain, DD OS 6.0
Artikelegenskaber
Artikelnummer: 000017675
Artikeltype: Solution
Senest ændret: 26 jun. 2026
Version:  5
Find svar på dine spørgsmål fra andre Dell-brugere
Supportservices
Kontrollér, om din enhed er dækket af supportservices.