NetWorker: Konserwacja bazy danych nośników i rozwiązywanie problemów

Summary: W tym artykule opisano metody identyfikacji i rozwiązywania problemów związanych z bazą danych nośników, a także najlepsze praktyki w zakresie konserwacji i ochrony.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

  • Nie można uruchomić usług.
  • Błąd codziennego przepływu pracy tworzenia kopii zapasowej serwera ochrony >serwera.
  • Niekompletne lub wprowadzające w błąd informacje dotyczące zestawów zapisu lub klientów zwracanych przez polecenie mminfo lub podczas wysyłania zapytań bądź przeglądania zestawów zapisów w administracji konsoli NetWorker Management Console (NMC) lub interfejsu użytkownika NetWorker Web User Interface (NWUI).
  • Problemy z tworzeniem kopii zapasowych, odzyskiwaniem lub klonowaniem związane z niemożnością zlokalizowania zestawów zapisu, klientów lub woluminów.
  • Błędy w dzienniku demona serwera lub konsolach związane z bazą danych nośnika:
nsrmmdbd WiSS code assertion error (st_nextrec: rec loop detected)
nsrmmdbd error, ss_clone_ensure_clone_eligibility: assertion, invalid parameters or code segment
nsrmmdbd XCHK ssid:saveset_short_ssid host:saveset_hostname name:saveset_name has a fragment with an invalid volid:saveset_volid
nsrmmdbd NSR warning WiSS code assertion error (ST_readvdir: directory read failed)
nsrmmdbd NSR critical Unexpected error reading long record directory: an invalid slot number
nsrmmdbd NSR warning partial record error, ssid: saveset_short_ssid saveset_long_ssid flags:0x00010101 size:0 files:0 tm:datetime cloneid
nsrmmdbd NSR notice media db must be scavenged
nsrmmdbd NSR critical media db scavenge failed
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (Permission denied) - recover from backup media
nsrmmdbd NSR warning Cannot scavenge path_to_mmvolume6 (unknown error code) - recover from backup media
nsrmmdbd MDB warning can't fetch save set <saveset ID>
nsrmmdbd MDB warning Unable to fetch child save set <saveset ID> for cover set <saveset ID>
  • Nagła utrata wielu zestawów zapisu z bazy danych nośnika lub nagły skok ilości wolnego miejsca w pamięci dyskowej.
  • Oprogramowanie nie wygasa lub nie usuwa zestawów zapisu, co prowadzi do szybkiego zużycia pamięci masowej.

Cause

Jak każda baza danych, baza danych multimediów może zostać uszkodzona w różnym stopniu, jeśli istnieje jakiekolwiek wnioskowanie z jej normalnych operacji, takich jak. 
  • Nieoczekiwane zamknięcie procesu nsrmmdbd (zrzut rdzenia, awaria systemu, ponowne uruchomienie lub utrata zasilania).
  • Przerwana transakcja (ingerencja zewnętrznego oprogramowania zabezpieczającego lub wyczerpanie miejsca na dysku).
  • Wewnętrzny problem logiczny (błąd kodu lub nieobsługiwane warunki).
  • Bezpośrednia ingerencja w pliki multimedialnej bazy danych lub pliki zestawu zapisu w pamięci masowej zarządzanej przez NetWorker.
Baza danych multimediów jest najlepiej chroniona przed uszkodzeniem za pomocą następujących ogólnych praktyk:
  • Jeśli to możliwe, użyj oddzielnej partycji dysku lokalnego dla folderu nsr/mm, co pomaga chronić przed warunkami, takimi jak wyczerpanie miejsca na dysku przez inne procesy. Partycja ta powinna być co najmniej 3 razy większa od wielkości bazy danych multimediów; duża baza danych multimediów miałaby obecnie 10 GB; dlatego 100 GB powinno wystarczyć do każdej instalacji. 
  • Codziennie wykonywany jest przepływ pracy tworzenia kopii zapasowej serwera, tak aby kopie zapasowe bazy danych nośników i krytycznych zasobów odzyskiwania po awarii ( Bootstrap) były dostępne w przypadku awarii.
  • Lokalizację Bootstrapów należy okresowo sprawdzać za pomocą polecenia mminfo -B .
  • Nigdy nie zezwalaj na jednoczesny dostęp do woluminów pamięci masowej serwera NetWorker przez inny serwer NetWorker, ponieważ może to prowadzić do utraty danych.
  • Jeśli na serwerze NetWorker jest zainstalowane oprogramowanie antywirusowe, utwórz wykluczenia dla katalogu /nsr, aby zapobiec skanowaniu, modyfikowaniu lub usuwaniu plików NetWorker przez oprogramowanie antywirusowe. 
  • Nie usuwaj ręcznie plików z pamięci masowej NetWorker w celu zwolnienia miejsca. NetWorker ma procedury odzyskiwania miejsca, które działają codziennie. W razie niepowodzenia należy skontaktować się z pomocą techniczną.
  • Ogólnie rzecz biorąc, w przypadku planowania stref danych należy przechowywać dane tego samego typu w tych samych pulach, aby w razie potrzeby ułatwić konserwację, takie jak zestawy zapisu vProxy, zestawy zapisu systemu plików i zestawy zapisu bazy danych Oracle w oddzielnych pulach.
  • Nie ignoruj komunikatów związanych z błędami baz danych multimediów — w razie wątpliwości skontaktuj się z pomocą techniczną.
Należy pamiętać o relacji między bazą danych mediów a pamięcią masową NetWorker i chronić woluminy za pomocą flagi Wymagane skanowanie
  • NetWorker codziennie uruchamia proces wygaśnięcia w ramach przepływu pracy tworzenia kopii zapasowej serwera. To zadanie oblicza retencje i zależności oraz wygasa zestawy zapisu, które są po ich przechowywaniu i nie mają niewygasłych elementów zależnych. Po zakończeniu tej czynności NetWorker próbuje usunąć wszystkie wygasłe zestawy zapisu woluminu dysku. Następnie operacja odzyskiwania miejsca zostanie uruchomiona dla każdego woluminu, usuwając pliki zestawu zapisu z nośników, które nie mają odpowiednich wpisów w bazie danych nośników. Oznacza to, że jeśli baza danych multimediów zostanie uszkodzona lub zostanie przywrócona do wcześniejszego punktu w czasie, prawidłowe dane mogą zostać usunięte.
  • Jeśli uważasz, że wystąpił problem z jakimikolwiek woluminami dysków, upewnij się, że wolumin jest odmontowany i oznaczony jako Potrzebne skanowanie, aby upewnić się, że prawidłowe dane nie zostały usunięte. Dotyczy to również woluminów po odzyskaniu do poprzedniego punktu w czasie (gdzie prawidłowe zestawy zapisu mogą znajdować się na dysku utworzonym po punkcie odzyskiwania i dlatego nie mają wpisów w odzyskanej bazie danych). 
  • Opcja Wymagane skanowanie umożliwia normalne tworzenie kopii zapasowych, odzyskiwanie i/lub klonowanie, ale zapobiega normalnemu wygaśnięciu lub usunięciu, dlatego upewnij się, że jest używana tylko do ochrony woluminów postrzeganych jako zagrożone i usuwana po powrocie do normalnego działania. Aby ustawić lub usunąć tę flagę, należy odmontować woluminy. Często zdarza się, że woluminy są oznaczone jako "wymagane skanowanie" po zakończeniu odzyskiwania po awarii serwera NetWorker (nsrdr), aby zapobiec niepożądanej utracie danych w scenariuszu odzyskiwania po awarii.

Resolution

Istnieje kilka sposobów weryfikacji i rozwiązywania problemów z bazą danych multimediów. Przed przystąpieniem do któregokolwiek z tych działań, aby ocenić wpływ, utwórz raporty przed i po, aby sprawdzić, czy zestawy zapisów, woluminy, klienty lub inne elementy zostały usunięte.
W wierszu polecenia, w katalogu do danych wyjściowych hosta, uruchom następujące polecenia, aby porównać właściwości bazy danych multimediów przed i po procedurze:
  • mminfo -C mminfo-C_pre.mmi
  • mminfo -X mminfo-X_pre.mmi
  • mminfo -ar "volid,typ,lokalizacja,pula,wolumin,stan,volflags,zapisany,zestawy zapisów" -q family=dysk -xc, > mminfo-vol_pre.mmi
Po zakończeniu konserwacji uruchom każdy z nich ponownie w osobnym pliku (na przykład *_post.mmi) i porównaj wartości.

nsrim - Codzienna ochrona serwera

Każdego dnia uruchamiany jest przepływ pracy Kopia zapasowa serwera ochrony > serwera, a wraz z nim akcja Wygaśnięcie. Akcja Wygaśnięcie uruchamia nsrim, który jest natywnym narzędziem konserwacyjnym NetWorker. Można to również uruchomić bezpośrednio, ale może to potrwać od kilku minut do kilku godzin, w zależności od obciążenia serwera i rozmiaru bazy danych multimediów:
nsrim -X > nsrim.out 2>&1

O ile ten proces nie działa codziennie, nie jest mało prawdopodobne, aby cokolwiek to zmieniło. Sprawdź dziennik demona pod kątem codziennego uzupełniania nsrim .

Ponowne uruchomienie usługi

Ponowne uruchomienie usług NetWorker wymusza różne kontrole uruchamiania, które mogą ujawnić problemy w komunikatach o błędach dziennika demona i potencjalnie naprawić wszelkie z nich. Jeśli przed zatrzymaniem usług problemy z bazą danych wydają się być poważne, upewnij się, że dostępna jest wystarczająca ilość wolnego miejsca i że znane są lokalizacje inicjowania (dane wyjściowe mminfo -B). Najlepiej jest najpierw uruchomić nsrmmdbasm -s nsr/mm/mmvolrel_path > mm.xdr, aby spróbować wyodrębnić bieżącą kopię bazy danych multimediów. Przed ponownym uruchomieniem usług utwórz kopię folderu mmvolrel, ponieważ może ona być później potrzebna do celów kryminalistycznych lub odzyskiwania.

Eksport i ponowny import bazy danych multimediów

Ten proces pozwala uniknąć pełnego odtwarzania po awarii, wyodrębniając tylko realne rekordy bazy danych multimediów i importując je ponownie na serwer bez zatrzymywania usług. Jednak — należy to robić tylko wtedy, gdy serwer jest bezczynny i nigdy nie należy podejmować prób z uruchomionymi zadaniami. Użyj pełnej ścieżki zamiast mmvolrel (która może się różnić w zależności od instalacji lub systemu operacyjnego)
  1. Przed rozpoczęciem oznacz wszystkie woluminy dyskowe jako Potrzebne skanowanie po odmontowaniu. Jeśli dla urządzeń hostujących woluminy dysków ustawiono automatyczne zarządzanie multimediami , należy to wyłączyć w pierwszej kolejności. Woluminy taśm nie wymagają tego kroku. 
  2. Uruchom polecenia mminfo opisane w preambule, aby przygotować wstępne raporty.
  3. Sprawdź rozmiar folderu i rekordu bazy danych multimediów mmvolrel
  4. Upewnij się, że żaden z procesów nsrck, nsrim, nsrmmdbasmnie jest uruchomiony; Jeśli w folderze nadrzędnym MM, takim jak mm[alfanumeryczne], znajdują się duże, stare lub nie ostatnio modyfikowane pliki, przenieś je lub usuń, jeśli nie są zablokowane przez żaden proces.
  5. Uruchom polecenie, aby wyodrębnić bazę danych nośnika: nsrmmdbasm -s mmvolrel > mm.xdr
  6. Porównaj rozmiar nowego pliku z rozmiarem folderu mmvolrel - jeśli powinien mieć podobny rozmiar. Jeśli jest mały (4 B lub garść KB), polecenie nie powiodło się. Jeśli jest znacznie mniejszy — w ramach procesu mogły zostać usunięte uszkodzone rekordy.
  7. Przygotuj serwer do odzyskania bazy danych nośników, ustawiając w polu Stan serwera wartość odtwarzania po awarii w NMC/NWUI lub za pomocą polecenia nwadmin.
  8. Odzyskaj dane bezpośrednio z pliku wyodrębnienia bazy danych multimediów za pomocą polecenia nsrmmdbasm : nsrmmdbasm -r -2 < mm.xdr
  9. Po zakończeniu uruchom to samo mminfo, jak opisano w preambule i porównaj zapisane wartości zestawu i zapisane dla każdego woluminu, upewniając się, że wszystkie woluminy są obecne; podobnie wartości mminfo -C powinny być identyczne.
  10. W przypadku jakichkolwiek rozbieżności należy wziąć pod uwagę i dokładnie rozważyć sposób postępowania, a jeśli nie masz pewności co do wyników, skontaktuj się z pomocą techniczną:
    • W przypadku woluminów, które wydają się być sprawne, można usunąć flagę Wymagane skanowanie i zamontować woluminy, ponieważ nie powinno być niebezpieczeństwa usunięcia zestawu zapisu, jeśli wydaje się, że żadne zestawy zapisu nie zostały usunięte z woluminu, jeśli zestawy zapisu i zapisane wartości są spójne. 
    • Woluminy, które pokazują mniej zestawów zapisu lub niższą zapisaną sumę, powinny pozostawić flagę Wymagane skanowanie i uruchomić scanner: scanner -i nazwaurządzenia w celu ponownego wprowadzenia plików znalezionych na woluminie, które nie mają już rekordów. Po zakończeniu skanowania dla każdego woluminu ponownie sprawdź liczbę zapisanych zbiorów i usuń znacznik Wymagane skanowanie. Ponownie zamontuj wolumin, gdy będziesz mieć pewność, że skaner zastąpił zestawy zapisu, których prawdopodobnie brakuje.

Nsrdr

Pełne odzyskiwanie po awarii wykonywane przez nsrdr odzyskuje nie tylko bazę danych nośników, ale także inne elementy serwera, takie jak baza zasobów i baza zadań. Przed podjęciem dalszych działań zapoznaj się z przewodnikiem po najlepszych praktykach dotyczących odtwarzania po awarii i dostępności serwerów dla swojej wersji.
To polecenie oczekuje, że węzły pamięci masowej będą w trybie online i będzie można się z nimi skontaktować w celu ukończenia działania.
 
UWAGA: W razie jakichkolwiek pytań lub wątpliwości należy zawsze kontaktować się z działem pomocy technicznej, ponieważ odzyskanie bazy danych nośników może doprowadzić do utraty danych dla woluminów dysków, jeśli flaga Wymagane skanowanie nie zostanie użyta do ochrony systemów plików z realnymi zestawami zapisu, które mogą nie zawierać rekordów baz danych multimediów z powodu uszkodzenia lub przywrócenia poprzedniego punktu w czasie.

Affected Products

NetWorker

Products

Data Backup & Protection Software, NetWorker Family
Article Properties
Article Number: 000223518
Article Type: Solution
Last Modified: 08 Apr 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.