Datadomene: Uventet DDFS-omstart (Data Domain File System) med varselet EVT-FILESYS-00008/FILESYS-00008, EVT-FILESYS-00010/FILESYS-00010 eller EVT-FILESYS-00011/FILESYS-00011

Summary: Denne kunnskapsartikkelen forklarer hva som skjer når et filsystem uventet starter på nytt, potensielle varsler som gis, og hvilken informasjon du må hente for sorteringsformål.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



DDFS-prosessen er prosessen med hovedansvar for driften av DDOS-filsystemet (Data Domain Operating System) for deduplisering.

Hvis det oppstår et problem under denne prosessen, blir et av følgende varsler opprettet:
  • EVT-FILESYS-00008/FILESYS-00008
  • EVT-FILESYS-00010/FILESYS-00010
  • EVT-FILESYS-00011/FILESYS-00011
Varslene ovenfor indikerer at problemet var uventet, og at det kreves mer informasjon for å fastslå årsaken.

Varselet blir sendt via den konfigurerte varslingsmekanismen på Data Domain-systemet, for eksempel via e-post/snmp. Varselet vil også vises i "alerts show history"-utdataene.

Cause

Denne prosessen kan starte på nytt på flere måter, for eksempel slik:
  • "Direct panic", f.eks. en eksplisitt kodefeil.
  • Det har oppstått et internt tidsavbrudd. DDFS har en intern overvåkingstråd for hjerteslag (kalt hmon) som overvåker tilstanden til de forskjellige delsystemene i DDFS-prosessen. Hvis hmon fastslår at delsystemet har hengt eller ventet for lenge, avslutter den DDFS-prosessen.
  • Det har oppstått et eksternt tidsavbrudd. En prosess kalt ddr_stated er ansvarlig for å overvåke DDFS-prosessen eksternt ved hjelp av en hjerteslagmekanisme. Hvis DDFS ikke sender et hjerteslag til ddr_stated innen en viss periode, vil ddr_stated anta at DDFS henger og avslutte DDFS-prosessen.
  • Prosessen ber om mer minne enn det som er tillatt.
  • En intern tilstandskontroll (sanity check) mislyktes.
Når et av disse forholdene oppstår, prøver filsystemet å starte på nytt automatisk for å gjenoppta normal drift. 

Under DDFS-omstart avbrytes alle pågående operasjoner, f.eks. gjenopprettinger/sikkerhetskopieringer, dvs. lesinger/skrivinger, og må startes på nytt. De fleste sikkerhetskopieringsapplikasjoner kan registrere at lesinger/skrivinger blir avbrutt, og starte dem på nytt automatisk.

Når det forekommer en uventet DDFS-omstart, skjer følgende:
  • Prosessen stopper opp.
  • Minnebruken til prosessen blir skrevet til en "kjernefil" som blir skrevet til en kjernedumpenhet, et spesielt område på en av diskene i hovedenheten. En kjernefil inneholder nødvendig informasjon for å feilsøke årsaken til den uventede omstarten.
  • Når trinnet ovenfor er fullført, kan DDFS-prosessen starte på nytt.
  • Samtidig, dvs. når DDFS starter på nytt, må kjernefilen pakkes ut fra kjernedumpenheten til et DDOS-filsystem, slik at det er mulig å få tilgang til den. Prosessen som utfører denne oppgaven, kalles "savecore".
  • Savecore oppretter en midlertidig katalog i /ddvar/core. Katalogen vil få navnet "app-<dato og klokkeslett da kjernefilen oppsto>".
  • DDFS bruker mesteparten av systemminnet, så minnebruken til DDFS kan være stor. For å minimere mengden data som skrives til kjernefilen, leser savecore fra kjernedumpenheten, overfører denne informasjonen via gzip for å sikre at kjernefilen er så liten som mulig, og begynner å skrive til en fil som heter "core-incomplete.gz".
  • Når denne prosessen er fullført, blir den midlertidige mappen fjernet, og kjernefilen blir plassert i /ddvar/core og får et nytt navn. Navnekonvensjonen for en kjernefil er som følger:
    • Prosessnavnet.
    • Prosess-ID-en.
    • Strengen "core".
    • Dato/klokkeslett da kjernen ble generert i et UNIX-epokeformat.
    • En kjernefil for DDFS vil for eksempel få navnet "ddfs.core.14226.1469256407.gz".
Siden minnebruken er stor, kan det ta flere minutter å opprette en kjernefil.

Resolution

Som nevnt ovenfor blir ikke kjernefiler opprettet umiddelbart. /ddvar/core-katalogen kan kontrolleres regelmessig via en delt NFS- eller CIFS-ressurs for å fastslå når kjernefilen er opprettet. 

Når kjernefilen er opprettet, trenger du to typer informasjon for å finne ut hva som var årsaken til den uventede omstarten. Modulene er:
  1. En ny støttebunt. Les følgende artikkel om hvordan du henter og laster opp en støttebunt: https://support.emc.com/kb/323283
  2. Kjernefilen som ble generert da problemet oppsto. Se følgende kunnskapsartikkel om de ulike metodene som kan brukes for å laste opp og få tilgang til en kjernefil: https://support.emc.com/kb/457974
Last opp elementene ovenfor til støttesaken.

Affected Products

Data Domain

Products

Data Domain, DD OS, Data Domain Virtual Edition
Article Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.