Data Domain: Der opstod en uventet DDFS-genstart (Data Domain File System) med enten advarsel EVT-FILESYS-00008 / FILESYS-00008 eller EVT-FILESYS-00010 / FILESYS-00010 eller EVT-FILESYS-00011 / FILESYS-00011

Summary: Denne Knowledge Base-artikel forklarer, hvad der sker, når der opstår en uventet genstart af filsystemet, hvilke potentielle advarsler der er registreret, og hvilke oplysninger der skal registreres til diagnosticeringsformål. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms



DDFS-processen er den primære proces, der er ansvarlig for driften af DDOS (Data Domain Operating System) dubletfilsystem.

Hvis denne proces støder på et problem, oprettes der en advarsel, som vil være en af følgende:
  • EVT-FILESYS-00008 / FILESYS-00008
  • EVT-FILESYS-00010 / FILESYS-00010
  • EVT-FILESYS-00011 / FILESYS-00011
Ovenstående advarsler indikerer, at problemet opstod uventet, og der kræves yderligere oplysninger for at finde årsagen.

Beskeden vil blive sendt via den konfigurerede advarselsmekanisme i Data Domain-systemet, dvs. via e-mail/snmp. Beskeden vil også blive vist i outputtet "alerts show history".

Cause

Denne proces kan genstartes på flere måder, f.eks.:
  • Direkte panik, dvs. en eksplicit kodefejl.
  • Der er registreret en intern timeout. DDFS har en intern impulsmonitor-tråd (kaldet hmon), der overvåger tilstanden for de forskellige undersystemer i DDFS-processen. Hvis hmon konstaterer, at enten et undersystem har hængt eller har ventet for længe, afsluttes DDFS-processen.
  • Der er registreret en ekstern timeout. En proces kaldet ddr_stated er ansvarlig for ekstern overvågning af DDFS-processen med en impuls-mekanisme. Hvis DDFS ikke sender en impuls (heartbeat) til ddr_stated inden for en bestemt varighed, antager ddr_stated, at DDFS har hængt og afslutter DDFS-processen.
  • Processen anmoder om mere hukommelse, end det er tilladt.
  • Et internt sanity check mislykkedes.
Hvis nogen af disse betingelser registreres, forsøger filsystemet automatisk at genstarte for at genoptage normal drift. 

Under DDFS-genstarten vil eventuelle handlinger, som blev udført, f.eks. gendannelser/sikkerhedskopieringer, dvs. læsninger/skrivninger blive afbrudt og skal genstartes. De fleste sikkerhedskopieringsprogrammer kan genkende, at læsninger/skrivningerne blev afbrudt, og genstarte disse handlinger automatisk.

Når der opstår en uventet DDFS-genstart, sker følgende:
  • Processen er stoppet.
  • Det hukommelsesformat, som processen brugte, skrives til en "kernefil", der kan skrives til en kernedump-enhed, som er et specialområde på en af hoveddiskene. En kernefil indeholder de oplysninger, der er nødvendige for at fejlfinde årsagen til, at den uventede genstart fandt sted.
  • Når ovenstående trin er afsluttet, kan DDFS-processen genstarte.
  • Parallelt, dvs. når DDFS er genstartet, skal din kernefil udtrækkes fra kernedump-enheden til et DDOS-filsystem, så der kan opnås adgang til den. Den proces, der udfører denne opgave, hedder "savecore".
  • Savecore opretter en midlertidig mappe i /ddvar/core. Mappenavnet vil hedde "app-<dato og klokkeslæt, hvor din core file opstod>".
  • Da DDFS bruger størstedelen af hukommelsen på systemet, kan dit hukommelsespladsbehov for DDFS være stort. For at minimere mængden af data, der skrives til kernefilen, læser savecore fra kernedump-enheden, overfører disse oplysninger via gzip for at sikre, at kernefilen er så lille som muligt og begynder at skrive til en fil med navnet "core-incomplete.gz".
  • Når denne proces er færdig, vil den midlertidige mappe blive fjernet og kernefilen være placeret i /ddvar/core og omdøbt. Navngivningsreglen for en kernefil er følgende:
    • Procesnavnet.
    • Proces-id'et.
    • Strengen "kerne".
    • Den dato/klokkeslæt, hvor din kerne blev genereret i UNIX epoch-format.
    • Så eksempelvis kan en kernefil til DDFS hedde "ddfs.core.14226.1469256407.gz".
På grund af det store pladsbehov for hukommelse kan det at oprette en kernefil tage en del minutter at gennemføre.

Resolution

Som nævnt ovenfor sker oprettelsen af kernefilen ikke øjeblikkeligt, og /ddvar/core-mappen kan kontrolleres jævnligt via en NFS- eller CIFS-share for at konstatere, hvornår oprettelsen af kernefilen er gennemført. 

Når oprettelsen af kernefilen er gennemført, er der behov for to dataelementer til at diagnosticere, hvad der forårsagede den uventede genstart. De er:
  1. En ny supportpakke. Se følgende artikel om, hvordan du kan hente og uploade en supportpakke: https://support.emc.com/kb/323283
  2. Den kernefil, der blev genereret, da problemet opstod. Se følgende Knowledge Base-artikel om de forskellige måder, du kan bruge til at overføre og få adgang til en kernefil: https://support.emc.com/kb/457974
Overfør ovenstående elementer til supportsagen.

Affected Products

Data Domain

Products

Data Domain, DD OS, Data Domain Virtual Edition
Article Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.