Data Domain: Wystąpiło nieoczekiwane ponowne uruchomienie DDFS (Data Domain File System) z alertem EVT-FILESYS-00008 / FILESYS-00008, EVT-FILESYS-00010 / FILESYS-00010 lub EVT-FILESYS-00011 / FILESYS-00011
Summary: W tym artykule bazy wiedzy wyjaśniono, co się dzieje w przypadku wystąpienia nieoczekiwanego ponownego uruchomienia systemu plików, potencjalnych alertów oraz jakie informacje należy przechwycić w celu weryfikacji. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Proces DDFS jest głównym procesem odpowiedzialnym za działanie systemu plików deduplikacji DDOS (Data Domain Operating System).
Jeśli proces napotka problem, zostanie utworzony alert z jedną z następujących przyczyn:
- EVT-FILESYS-00008 / FILESYS-00008
- EVT-FILESYS-00010 / FILESYS-00010
- EVT-FILESYS-00011 / FILESYS-00011
Alert zostanie wysłany z wykorzystaniem skonfigurowanego mechanizmu alertów w systemie Data Domain, tzn. za pośrednictwem poczty e-mail/SNMP. Alert pojawi się także w wynikach „alert show history”.
Cause
Ten proces może uruchomić się ponownie z kilku powodów, na przykład:
W trakcie ponownego uruchamiania DDFS wszelkie operacje, które były wykonywane, takie jak przywracanie/kopie zapasowe, tzn. operacje odczytu/zapisu, zostaną przerwane i będzie konieczne ich ponowne uruchomienie. Większość aplikacji do tworzenia kopii zapasowych może uznać, że operacje odczytu/zapisu zostały przerwane i automatycznie uruchomić te operacje ponownie.
Wystąpienie nieoczekiwanego ponownego uruchomienia DDFS może skutkować następującymi zdarzeniami:
- Błąd bezpośredni, tzn. jawny błąd kodu.
- Przekroczono wewnętrzny limit czasu. DDFS ma wewnętrzny wątek monitorowania pulsu (zwany hmon), monitorujący stan różnych podsystemów w procesie DDFS. Jeśli hmon stwierdzi, że podsystem zawiesił się lub czeka zbyt długo, proces DDFS zostanie zakończony.
- Przekroczono zewnętrzny limit czasu. Proces o nazwie ddr_stated jest odpowiedzialny za zewnętrzną kontrolę procesu DDFS za pomocą mechanizmu pulsu. Jeśli DDFS nie wyśle sygnału pulsu do ddr_stated w określonym czasie, ddr_stated zakłada, że DDFS się zawiesił i zakończy proces DDFS.
- Proces przetwarzania wymaga większej ilości pamięci niż dozwolona.
- Wewnętrzna kontrola poprawności nie powiodła się.
W trakcie ponownego uruchamiania DDFS wszelkie operacje, które były wykonywane, takie jak przywracanie/kopie zapasowe, tzn. operacje odczytu/zapisu, zostaną przerwane i będzie konieczne ich ponowne uruchomienie. Większość aplikacji do tworzenia kopii zapasowych może uznać, że operacje odczytu/zapisu zostały przerwane i automatycznie uruchomić te operacje ponownie.
Wystąpienie nieoczekiwanego ponownego uruchomienia DDFS może skutkować następującymi zdarzeniami:
- Proces zostanie zatrzymany.
- Obszar pamięci, z którego proces korzystał, zostaje zapisany w „pliku podstawowym” na podstawowym urządzeniu do zrzutów, które jest specjalnym obszarem na jednym z dysków jednostki głównej. Plik podstawowy zawiera informacje niezbędne do debugowania, dlaczego wystąpiło nieoczekiwane ponowne uruchomienie systemu.
- Po zakończeniu powyższego kroku proces DDFS może się uruchomić ponownie.
- Równolegle, tzn. po ponownym uruchomieniu DDFS, należy wyodrębnić podstawowy plik z podstawowego urządzenia do zrzutów do systemu plików DDOS, aby można było uzyskać do niego dostęp. Proces, który wykonuje to zadanie, nazywa się „savecore”.
- Savecore tworzy początkowy tymczasowy katalog w /ddvar/core. Katalog będzie miał nazwę „app-<data i godzina wystąpienia pliku podstawowego>”.
- Ponieważ DDFS wykorzystuje większość pamięci w systemie, rozmiar pamięci dla DDFS może być duży. Aby zminimalizować ilość danych zapisanych w pliku podstawowym, savecore odczytuje dane z podstawowego urządzenia do zrzutów, przekazuje je za pomocą gzip, aby zapewnić, że plik podstawowy jest możliwie jak najmniejszy, i rozpoczyna zapisywanie do pliku o nazwie „core-incomplete.gz”.
- Po zakończeniu tego procesu tymczasowy katalog zostanie usunięty, a podstawowy plik zostanie umieszczony w /ddvar/core i zostanie zmieniona jego nazwa. Konwencja nazewnictwa dla pliku podstawowego jest następująca:
- Nazwa procesu.
- Identyfikator procesu.
- Ciąg „core”.
- Data/godzina wygenerowania „core” w formacie epoki UNIX.
- Przykładowo, plik podstawowy DDFS może otrzymać nazwę „ddfs.core.14226.1469256407.gz”.
Resolution
Jak wspomniano powyżej, utworzenie podstawowego pliku nie jest natychmiastowe, katalog /ddvar/core może być sprawdzany okresowo za pośrednictwem udziału NFS lub CIFS, aby upewnić się, kiedy proces tworzenia plików podstawowych zostanie ukończony.
Po zakończeniu tworzenia pliku podstawowego wymagane są dwie informacje, aby sprawdzić, co spowodowało nieoczekiwane ponowne uruchomienie systemu. Są to:
Po zakończeniu tworzenia pliku podstawowego wymagane są dwie informacje, aby sprawdzić, co spowodowało nieoczekiwane ponowne uruchomienie systemu. Są to:
- Nowy pakiet pomocy technicznej. Należy zapoznać się z poniższym artykułem dotyczącym sposobu przechwytywania i przesyłania pakietu pomocy technicznej: https://support.emc.com/kb/323283
- Plik podstawowy wygenerowany po wystąpieniu problemu. Aby poznać różne metody przesyłania i uzyskiwania dostępu do pliku podstawowego, należy zapoznać się z poniższym artykułem bazy wiedzy: https://support.emc.com/kb/457974
Affected Products
Data DomainProducts
Data Domain, DD OS, Data Domain Virtual EditionArticle Properties
Article Number: 000064290
Article Type: Solution
Last Modified: 19 Sept 2022
Version: 4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.