Data Domain: Proceso de FS PANIC en la caché de inodo cuando se queda sin memoria en el pool de elementos de caché
Resumen: Se ha encontrado un defecto en algunas versiones recientes de DDOS (confirmadas en 7.7.4, 7.9.0.10 y 7.10.0, lo cual es falso si también afecta a DDOS 7.7.3) mediante el cual se puede producir un estado PANIC de proceso de FS en el código de caché de inodo cuando, según la carga de trabajo, un pool de elementos de caché se queda sin memoria para asignaciones adicionales. ...
Este artículo se aplica a
Este artículo no se aplica a
Este artículo no está vinculado a ningún producto específico.
No se identifican todas las versiones del producto en este artículo.
Síntomas
No hay ninguna degradación o advertencia avanzada para este problema, que se manifestará en forma de falla del proceso de FS (PANIC), después de lo cual, el proceso se reiniciará y volverá a aparecer automáticamente.
Debido a la ruta de código que se está realizando, el proceso de FS puede entrar en estado de ALARMA de varias maneras diferentes, incluidas las siguientes:
Debido a la ruta de código que se está realizando, el proceso de FS puede entrar en estado de ALARMA de varias maneras diferentes, incluidas las siguientes:
PANIC: ddr/sm/ddfs/ddfs_mtree.c: ddfs_mtree_list: 829: !((dd_errno(e) == ENOENT) || (dd_errno(e) == DD_ERR_FM_EATTRNOENT) || (dd_errno(e) == DD_ERR_STALE)) PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4872: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_snap_attr: 4446: Fatal Error PANIC: ddr/fv/file_verify.c: file_verify_update_marker_attrs: 4860: Fatal Error
En los archivos de registro del proceso de FS (ddfs.info) se encontrarán los siguientes mensajes antes de cada bloqueo del proceso:
01/17 20:21:59.292947 [7fbbf4f98f50] dd_cache_elem_reclaim: Evict count=256, Visited count=257, Skipped elem count=0, Skipped bucket count=0, Time threshold=1539816333626910. (99% full) Complete=True 01/17 20:22:04.662303 [7fbb031ad4f0] ERROR: FM fm_iget:355 - fm_iget failed to allocate elem in dd_cache 5001
Los mensajes que indican que el proceso interno se completó en un 99 % y, a continuación, no se pudieron asignar más elementos, lo que produjo un bloqueo del proceso.
NOTA: Se sabe que este problema solo afecta a las siguientes versiones:
- DDOS 7.7.3.x: No completamente confirmado
- DDOS 7.7.4.x
- DDOS 7.9.0.10
- DDOS 7.10.0.x
Causa
Para cualquier operación de archivo, como lectura/escritura, se asigna una estructura de inodo desde el pool de elementos dd_cache.
Si esta caché está llena y entra una nueva solicitud, se expulsa un elemento de esta caché y se completa la nueva solicitud.
Esta expulsión se basa en una política de tiempo (se expulsa un elemento si no se ha accedido en los últimos "x" segundos).
En caso de que esta caché se caliente demasiado (se ha accedido a todos los elementos en los últimos "x" segundos) y no se puede expulsar ningún elemento incluso después de varios reintentos, fm_iget devuelve DD_ERR_NOMEM.
Algunos llamadores de esta asignación de pool de elementos no podrán manejar el error correctamente y, por lo tanto, el proceso de FS entre en ESTADO DE ALARMA y el núcleo de volcado deben funcionar "fm_iget" arroja cualquier error. Es por eso que hay algunas firmas PANIC diferentes correspondientes al defecto de código subyacente.
Si esta caché está llena y entra una nueva solicitud, se expulsa un elemento de esta caché y se completa la nueva solicitud.
Esta expulsión se basa en una política de tiempo (se expulsa un elemento si no se ha accedido en los últimos "x" segundos).
En caso de que esta caché se caliente demasiado (se ha accedido a todos los elementos en los últimos "x" segundos) y no se puede expulsar ningún elemento incluso después de varios reintentos, fm_iget devuelve DD_ERR_NOMEM.
Algunos llamadores de esta asignación de pool de elementos no podrán manejar el error correctamente y, por lo tanto, el proceso de FS entre en ESTADO DE ALARMA y el núcleo de volcado deben funcionar "fm_iget" arroja cualquier error. Es por eso que hay algunas firmas PANIC diferentes correspondientes al defecto de código subyacente.
Resolución
El problema de código fundamental que da como resultado estos bloqueos del proceso de FS se corrige mediante DDOS-168410 en las siguientes versiones (y todas las posteriores en las mismas ramas de código):
Si ejecuta una versión con el problema (las mencionadas anteriormente), pero no experimentó un bloqueo inesperado del proceso de FS, pero aún coincide con los síntomas de este artículo de la base de conocimientos, recomendamos no aplicar proactivamente la solución alternativa y, en su lugar, actualizar a cualquiera de las versiones corregidas anteriores (o a cualquiera de sus sucesores) para aprovechar las últimas actualizaciones y correcciones de código.
- DDOS 7.7.5.1
- DDOS 7.10.1.0
- DDOS 7.11.0
Si ejecuta una versión con el problema (las mencionadas anteriormente), pero no experimentó un bloqueo inesperado del proceso de FS, pero aún coincide con los síntomas de este artículo de la base de conocimientos, recomendamos no aplicar proactivamente la solución alternativa y, en su lugar, actualizar a cualquiera de las versiones corregidas anteriores (o a cualquiera de sus sucesores) para aprovechar las últimas actualizaciones y correcciones de código.
Productos afectados
Data DomainPropiedades del artículo
Número del artículo: 000207919
Tipo de artículo: Solution
Última modificación: 21 dic 2023
Versión: 17
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.