Data Domain: PANIKA procesu FS v mezipaměti inode při využití paměti ve fondu prvků mezipaměti

Resumen: V některých nedávných verzích systému DDOS (potvrzeno v verzích 7.7.4, 7.9.0.10 a 7.10.0 byla zjištěna také závada, pokud se týká systému DDOS 7.7.3), při kterém může v kódu mezipaměti inode dojít k panice procesu FS, když v závislosti na zatížení dojde ve fondu prvků cache k další alokaci. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

Pro tento problém neexistuje žádné upozornění na snížení kvality ani předběžné varování, které se projeví ve formě selhání procesu FS (PANIC), a poté se proces automaticky restartuje a znovu se zobrazí v pořádku.
Kvůli využití cesty kódu může proces FS dojít k panice několika různými způsoby, včetně následujících:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE))
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error
PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
V souborech protokolu procesu FS (ddfs.info) budou před každým selháním procesu nalezeny následující zprávy:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True
01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001

Zprávy oznamující, že interní proces byl plný z 99 %, poté nebyl schopen přidělit žádné další prvky, což vedlo k selhání procesu. 

POZNÁMKA: Tento problém se týká pouze následujících verzí:
  • DDOS 7.7.3.x: Zcela nepotvrzeno
  • DDOS 7.7.4.x
  • DDOS 7.9.0.10
  • DDOS 7.10.0.x

Causa

Pro všechny operace souborů, jako je čtení/zápis, je struktura inode alokována z fondu prvků dd_cache.
Pokud je tato mezipaměť plná a přijde nový požadavek, je z této mezipaměti odebrán prvek a je splněn nový požadavek.
Toto vyloučení je založeno na zásadě času (prvek je vyřazen, pokud k němu nebyl během posledních "x" sekund přistupován).
V případě, že se tato mezipaměť příliš zahřeje (přístup ke všem prvkům proběhl během posledních "x" sekund) a nelze vysunul žádné prvky ani po několika opakováních, fm_iget se vrátí DD_ERR_NOMEM.
Někteří volající tohoto fondu prvku nebudou moci chybu řádně zpracovat, a tak způsobí, že proces FS z paniky a jádra výpisu by mělo fungovat jako "fm_iget". Proto existuje několik různých podpisů paniky odpovídající základní závadě kódu.

Resolución

Základní problém s kódem, který vede k těmto pádům procesu FS, je vyřešen pomocí systému DDOS-168410 v následujících verzích (a všech novějších ve stejných větvích kódu):
  • DDOS 7.7.5.1
  • DDOS 7.10.1.0
  • DDOS 7.11.0
Zákazníci, kterých se tento problém týká, kteří nemohou okamžitě upgradovat na žádnou z výše uvedených verzí, mohou zkusit náhradní řešení, pro které musí kontaktovat podporu společnosti Dell.
Pokud používáte verzi s problémem (uvedenou výše), ale nedošlo k neočekávanému selhání procesu FS, který ještě neodpovídá příznakům v tomto článku znalostí, doporučujeme toto zástupné řešení neprovážit a namísto toho provést upgrade na jakoukoli z výše uvedených opravených verzí (nebo jejich nástupce), abyste mohli využít nejnovější aktualizace a opravy kódu.

Productos afectados

Data Domain
Propiedades del artículo
Número del artículo: 000207919
Tipo de artículo: Solution
Última modificación: 21 dic 2023
Versión:  17
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.