Data Domain: Proceso de FS PANIC en la caché de inodo cuando se queda sin memoria en el pool de elementos de caché
摘要: Se ha encontrado un defecto en algunas versiones recientes de DDOS (confirmadas en 7.7.4, 7.9.0.10 y 7.10.0, lo cual es falso si también afecta a DDOS 7.7.3) mediante el cual se puede producir un estado PANIC de proceso de FS en el código de caché de inodo cuando, según la carga de trabajo, un pool de elementos de caché se queda sin memoria para asignaciones adicionales. ...
本文适用于
本文不适用于
本文并非针对某种特定的产品。
本文并非包含所有产品版本。
症状
No hay ninguna degradación o advertencia avanzada para este problema, que se manifestará en forma de falla del proceso de FS (PANIC), después de lo cual, el proceso se reiniciará y volverá a aparecer automáticamente.
Debido a la ruta de código que se está realizando, el proceso de FS puede entrar en estado de ALARMA de varias maneras diferentes, incluidas las siguientes:
Debido a la ruta de código que se está realizando, el proceso de FS puede entrar en estado de ALARMA de varias maneras diferentes, incluidas las siguientes:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
En los archivos de registro del proceso de FS (ddfs.info) se encontrarán los siguientes mensajes antes de cada bloqueo del proceso:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Los mensajes que indican que el proceso interno se completó en un 99 % y, a continuación, no se pudieron asignar más elementos, lo que produjo un bloqueo del proceso.
NOTA: Se sabe que este problema solo afecta a las siguientes versiones:
- DDOS 7.7.3.x: No completamente confirmado
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
原因
Para cualquier operación de archivo, como lectura/escritura, se asigna una estructura de inodo desde el pool de elementos dd_cache.
Si esta caché está llena y entra una nueva solicitud, se expulsa un elemento de esta caché y se completa la nueva solicitud.
Esta expulsión se basa en una política de tiempo (se expulsa un elemento si no se ha accedido en los últimos "x" segundos).
En caso de que esta caché se caliente demasiado (se ha accedido a todos los elementos en los últimos "x" segundos) y no se puede expulsar ningún elemento incluso después de varios reintentos, fm_iget devuelve DD_ERR_NOMEM.
Algunos llamadores de esta asignación de pool de elementos no podrán manejar el error correctamente y, por lo tanto, el proceso de FS entre en ESTADO DE ALARMA y el núcleo de volcado deben funcionar "fm_iget" arroja cualquier error. Es por eso que hay algunas firmas PANIC diferentes correspondientes al defecto de código subyacente.
Si esta caché está llena y entra una nueva solicitud, se expulsa un elemento de esta caché y se completa la nueva solicitud.
Esta expulsión se basa en una política de tiempo (se expulsa un elemento si no se ha accedido en los últimos "x" segundos).
En caso de que esta caché se caliente demasiado (se ha accedido a todos los elementos en los últimos "x" segundos) y no se puede expulsar ningún elemento incluso después de varios reintentos, fm_iget devuelve DD_ERR_NOMEM.
Algunos llamadores de esta asignación de pool de elementos no podrán manejar el error correctamente y, por lo tanto, el proceso de FS entre en ESTADO DE ALARMA y el núcleo de volcado deben funcionar "fm_iget" arroja cualquier error. Es por eso que hay algunas firmas PANIC diferentes correspondientes al defecto de código subyacente.
解决方案
El problema de código fundamental que da como resultado estos bloqueos del proceso de FS se corrige mediante DDOS-168410 en las siguientes versiones (y todas las posteriores en las mismas ramas de código):
Si ejecuta una versión con el problema (las mencionadas anteriormente), pero no experimentó un bloqueo inesperado del proceso de FS, pero aún coincide con los síntomas de este artículo de la base de conocimientos, recomendamos no aplicar proactivamente la solución alternativa y, en su lugar, actualizar a cualquiera de las versiones corregidas anteriores (o a cualquiera de sus sucesores) para aprovechar las últimas actualizaciones y correcciones de código.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Si ejecuta una versión con el problema (las mencionadas anteriormente), pero no experimentó un bloqueo inesperado del proceso de FS, pero aún coincide con los síntomas de este artículo de la base de conocimientos, recomendamos no aplicar proactivamente la solución alternativa y, en su lugar, actualizar a cualquiera de las versiones corregidas anteriores (o a cualquiera de sus sucesores) para aprovechar las últimas actualizaciones y correcciones de código.
受影响的产品
Data Domain文章属性
文章编号: 000207919
文章类型: Solution
上次修改时间: 21 12月 2023
版本: 17
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。