Data Domain: FS-processen kraschar i inod-cacheminnet när det börjar ta slut på minne i cacheelementpoolen
摘要: Ett fel har upptäckts i vissa senare DDOS-versioner (bekräftades även i 7.7.4, 7.9.0.10 och 7.10.0, om det även påverkar DDOS 7.7.3) och då kan en FS-processkrasch uppstå i inodens cachekod när, beroende på arbetsbelastningen, en cacheelementpool får slut på minne för ytterligare allokeringar. ...
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
Det finns ingen försämring eller avancerad varning för det här problemet, som kommer att visa sig i form av ett FS-processfel (PANIC), varefter processen startas om och visas igen utan problem automatiskt.
På grund av att kodsökvägen aktiveras kan FS-processen KRASCHA på flera olika sätt, inklusive följande:
På grund av att kodsökvägen aktiveras kan FS-processen KRASCHA på flera olika sätt, inklusive följande:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
I FS-processloggfilerna (ddfs.info) följande meddelanden visas före varje processkrasch:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Meddelanden som indikerar att den interna processen var full till 99 % full och sedan inte kunde allokera några ytterligare element, vilket ledde till processkrasch.
Obs! Det här problemet kan endast påverka följande versioner:
- DDOS 7.7.3.x: Inte fullständigt bekräftat
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
原因
För alla filåtgärder, som läs-/skrivåtgärder, allokeras en inodstruktur från dd_cache elementpoolen.
Om cacheminnet är fullt och en ny begäran kommer in tas ett element bort från cacheminnet och den nya förfrågan slutförs.
Den här avhysningen baseras på en tidspolicy (ett element tas bort om det inte har använts under de senaste "x" sekunderna).
Om cacheminnet blir för varmt (alla element har använts inom de senaste x sekunderna) och inga element kan tas bort ens efter flera försök kan fm_iget returnera DD_ERR_NOMEM.
Vissa av de som ringer det här elementet poolallokering kan inte hantera felet på ett smidigt sätt och därför leder FS-processen till PANIC och dumpkärnfunktionen "fm_iget" returnerar eventuella fel. Det är därför det finns några olika PANIC-signaturer som motsvarar det underliggande kodfelet.
Om cacheminnet är fullt och en ny begäran kommer in tas ett element bort från cacheminnet och den nya förfrågan slutförs.
Den här avhysningen baseras på en tidspolicy (ett element tas bort om det inte har använts under de senaste "x" sekunderna).
Om cacheminnet blir för varmt (alla element har använts inom de senaste x sekunderna) och inga element kan tas bort ens efter flera försök kan fm_iget returnera DD_ERR_NOMEM.
Vissa av de som ringer det här elementet poolallokering kan inte hantera felet på ett smidigt sätt och därför leder FS-processen till PANIC och dumpkärnfunktionen "fm_iget" returnerar eventuella fel. Det är därför det finns några olika PANIC-signaturer som motsvarar det underliggande kodfelet.
解决方案
Det grundläggande kodproblemet som leder till att dessa FS-processkrascher åtgärdas med DDOS-168410 i följande versioner (och alla senare i samma kodgrenar):
Om du kör en version med problemet (de som anges ovan) men du inte har drabbats av en oväntad FS-processkrasch men ändå matchar symptomen i denna KB, rekommenderar vi att du inte proaktivt tillämpar lösningen. Uppgradera istället till någon av de korrigerade versionerna ovan (eller någon av deras efterföljare) för att utnyttja de senaste uppdateringarna och kodkorrigeringarna.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Om du kör en version med problemet (de som anges ovan) men du inte har drabbats av en oväntad FS-processkrasch men ändå matchar symptomen i denna KB, rekommenderar vi att du inte proaktivt tillämpar lösningen. Uppgradera istället till någon av de korrigerade versionerna ovan (eller någon av deras efterföljare) för att utnyttja de senaste uppdateringarna och kodkorrigeringarna.
受影响的产品
Data Domain文章属性
文章编号: 000207919
文章类型: Solution
上次修改时间: 21 12月 2023
版本: 17
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。