Data Domain : Een onverwacht opnieuw opstarten van DDFS (Data Domain File System) is opgetreden met waarschuwing EVT-FILESYS-00008 / FILESYS-00008 of EVT-FILESYS-00010 / FILESYS-00010 of EVT-FILESYS-00011 / FILESYS-00011
Summary: In dit Knowledge Base-artikel wordt uitgelegd wat er gebeurt wanneer een bestandssysteem onverwacht opnieuw wordt opgestart, de potentiële waarschuwingen die worden aangetroffen en welke informatie moet worden vastgelegd voor onderzoek. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Het DDFS-proces is het hoofdproces dat verantwoordelijk is voor de werking van het DDOS (Data Domain Operating System) de-duplicatie bestandssysteem.
Als dit proces een probleem ondervindt, wordt een van de volgende waarschuwingen gegenereerd:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
De waarschuwing wordt verzonden via het mechanisme voor waarschuwingsmeldingen op het Data Domain systeem, d.w.z. via e-mail/SNMP. De waarschuwing wordt ook weergegeven in de uitvoer van 'alerts show history’.
Cause
Dit proces kan op verschillende manieren opnieuw worden geactiveerd, bijvoorbeeld:
Tijdens het opnieuw opstarten van DDFS worden alle bewerkingen die actief waren, zoals terugzetten/back-ups, d.w.z. lees- en schrijfacties, onderbroken en moeten opnieuw worden gestart. De meeste back-upapplicaties kunnen herkennen dat de lees- en schrijfbewerkingen zijn onderbroken en starten ze automatisch opnieuw op.
Wanneer een onverwachte herstart van DDFS plaatsvindt, gebeurt het volgende:
- Een directe panic, d.w.z. een expliciete codefout.
- Een interne time-out is opgetreden. DDFS heeft een interne heartbeat-monitor-thread (genaamd hmon) die de status controleert van de verschillende subsystemen binnen het DDFS-proces. Als hmon vaststelt dat een subsysteem is vastgelopen of te lang heeft gewacht, beëindigt deze het DDFS-proces.
- Een externe time-out is opgetreden. Een proces genaamd ddr_stated is verantwoordelijk voor extern toezicht op het DDFS-proces door een heartbeat-mechanisme. Als DDFS niet binnen een bepaalde duur een heartbeat naar ddr_stated stuurt, gaat ddr_stated ervan uit dat DDFS is vastgelopen en beëindigt het DDFS-proces.
- Het proces vraagt om meer geheugen dan is toegestaan.
- Een interne statuscontrole is mislukt.
Tijdens het opnieuw opstarten van DDFS worden alle bewerkingen die actief waren, zoals terugzetten/back-ups, d.w.z. lees- en schrijfacties, onderbroken en moeten opnieuw worden gestart. De meeste back-upapplicaties kunnen herkennen dat de lees- en schrijfbewerkingen zijn onderbroken en starten ze automatisch opnieuw op.
Wanneer een onverwachte herstart van DDFS plaatsvindt, gebeurt het volgende:
- Het proces wordt gestopt.
- Het geheugen dat door het proces werd gebruikt, wordt weggeschreven naar een 'core-bestand' dat naar een coredump-apparaat zal worden geschreven. Dit is een speciaal gedeelte op een van de schijven van de hoofdeenheid. Een corebestand bevat de informatie die nodig is om fouten op te lossen waarom de onverwachte herstart is opgetreden.
- Zodra de bovenstaande stap is voltooid, kan het DDFS-proces opnieuw worden gestart.
- Parallel, d.w.z. wanneer DDFS opnieuw wordt opgestart, moet het corebestand worden uitgepakt van het coredump-apparaat naar een DDOS-bestandssysteem, zodat het kan worden geopend. Het proces dat deze taak uitvoert, wordt 'savecore' genoemd.
- Savecore maakt een initiële tijdelijke map in /ddvar/core. De mapnaam wordt 'app-<date and time the core file occurred>’ genoemd.
- Aangezien DDFS het meeste geheugen op het systeem gebruikt, kan het geheugen van DDFS groot worden. Om de hoeveelheid data die naar het corebestand wordt geschreven te minimaliseren, leest savecore het coredump-apparaat, geeft deze informatie door aan gzip, om ervoor te zorgen dat het corebestand zo klein mogelijk is en begint het te schrijven naar een bestand met de naam 'core-incomplete.gz'.
- Zodra dit proces is voltooid, wordt de tijdelijke map verwijderd, wordt het corebestand in /ddvar/core opgeslagen en hernoemd. De naamgevingsconventie voor een corebestand is als volgt:
- De procesnaam.
- De proces-ID.
- De tekenreeks "core".
- De datum/tijd waarop de core is gegenereerd in een UNIX Epoch-indeling.
- Een corebestand voor DDFS zou bijvoorbeeld 'ddfs.core.14226.1469256407.gz'. kunnen worden genoemd.
Resolution
Zoals hierboven vermeld, is het maken van het corebestand niet onmiddellijk mogelijk, kan de map /ddvar/core periodiek worden gecontroleerd via een NFS- of CIFS-share om vast te stellen wanneer het corebestand is gemaakt.
Nadat het maken van het corebestand is voltooid, zijn twee data-items vereist om te bepalen wat de onverwachte herstart veroorzaakte. Dit zijn:
Nadat het maken van het corebestand is voltooid, zijn twee data-items vereist om te bepalen wat de onverwachte herstart veroorzaakte. Dit zijn:
- Een nieuwe supportbundel. Raadpleeg het volgende artikel over hoe u een supportbundel kunt vastleggen en uploaden: https://support.emc.com/kb/323283
- Het corebestand dat is gegenereerd toen het probleem optrad. Raadpleeg het volgende Knowledge Base-artikel voor de diverse methoden die kunnen worden gebruikt voor het uploaden en openen van een corebestand: https://support.emc.com/kb/457974
Affected Products
Data DomainProducts
Data Domain, DD OS, Data Domain Virtual EditionArticle Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.