Data Domain: FS-prosess panic i inode-hurtigbufferen når den går tom for minne i bufferelementutvalget
摘要: Det har blitt funnet en feil i noen nyere DDOS-versjoner (bekreftet i 7.7.4, 7.9.0.10 og 7.10.0, med mindre DDOS 7.7.3 påvirker DDOS 7.3), der en FS-prosess panic kan forekomme i inode-hurtigbufferkoden når, avhengig av workloaden, går et bufferelementutvalg ut av minnet for ytterligere tildelinger. ...
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Det er ingen forringelse eller forhåndsadvarsel for dette problemet, noe som vil vise seg i form av en FS-prosessfeil (PANIC), hvoretter prosessen vil starte på nytt og komme opp igjen automatisk.
På grunn av kodebanen som utføres, kan FS-prosessen få panikk på flere forskjellige måter, inkludert følgende:
På grunn av kodebanen som utføres, kan FS-prosessen få panikk på flere forskjellige måter, inkludert følgende:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
Loggfiler (ddfs) i FS-prosessen.info) følgende meldinger vil bli funnet før hver prosess krasjer:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Meldinger som indikerer at hele den interne prosessen var 99 % full, kunne ikke tildele flere elementer, noe som førte til at krasjen ble behandlet.
MERK: Dette problemet er kjent for å bare påvirke følgende versjoner:
- DDOS 7.7.3.x: Ikke fullstendig bekreftet
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
原因
For alle filoperasjoner, for eksempel lesing/skriving, tilordnes en inodestruktur fra dd_cache elementutvalget.
Hvis denne hurtigbufferen er full og en ny forespørsel kommer inn, blir et element fjernet fra denne hurtigbufferen, og den nye forespørselen er fullført.
Denne utsendingen er basert på en tidspolicy (et element blir fjernet hvis det ikke har blitt åpnet i løpet av de siste x-sekundene).
Hvis denne hurtigbufferen blir for varm (alle elementer har blitt åpnet i løpet av de siste x-sekundene), og ingen elementer kan bli fjernet selv etter flere forsøk, og deretter fm_iget returnerer DD_ERR_NOMEM.
Noen innringere av denne tildelingen av dette elementutvalget kan ikke håndtere feilen på en enkel måte, og dette fører derfor til at FS-prosessen går i KRISE, og dumpkjernen skal fungere «fm_iget» returnerer eventuelle feil. Derfor finnes det noen forskjellige PANIC-signaturer som korresponderer med den underliggende kodefeilen.
Hvis denne hurtigbufferen er full og en ny forespørsel kommer inn, blir et element fjernet fra denne hurtigbufferen, og den nye forespørselen er fullført.
Denne utsendingen er basert på en tidspolicy (et element blir fjernet hvis det ikke har blitt åpnet i løpet av de siste x-sekundene).
Hvis denne hurtigbufferen blir for varm (alle elementer har blitt åpnet i løpet av de siste x-sekundene), og ingen elementer kan bli fjernet selv etter flere forsøk, og deretter fm_iget returnerer DD_ERR_NOMEM.
Noen innringere av denne tildelingen av dette elementutvalget kan ikke håndtere feilen på en enkel måte, og dette fører derfor til at FS-prosessen går i KRISE, og dumpkjernen skal fungere «fm_iget» returnerer eventuelle feil. Derfor finnes det noen forskjellige PANIC-signaturer som korresponderer med den underliggende kodefeilen.
解决方案
Det grunnleggende kodeproblemet som resulterer i disse FS-prosesskrasjene, løses ved hjelp av DDOS-168410 i følgende versjoner (og alle nyere i de samme kodegrenene):
Hvis du kjører en versjon med problemet (de som står oppført ovenfor), men du ikke har opplevd at en uventet FS-prosess krasjer, men som samsvarer med symptomene i denne kb-en, er det vår anbefaling å ikke proaktivt bruke løsningen, og i stedet oppgradere til noen av de faste utgivelsene ovenfor (eller noen av deres etterfølgere) for å benytte de nyeste oppdateringene og kodeløsningene.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Hvis du kjører en versjon med problemet (de som står oppført ovenfor), men du ikke har opplevd at en uventet FS-prosess krasjer, men som samsvarer med symptomene i denne kb-en, er det vår anbefaling å ikke proaktivt bruke løsningen, og i stedet oppgradere til noen av de faste utgivelsene ovenfor (eller noen av deres etterfølgere) for å benytte de nyeste oppdateringene og kodeløsningene.
受影响的产品
Data Domain文章属性
文章编号: 000207919
文章类型: Solution
上次修改时间: 21 12月 2023
版本: 17
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。