{ISILON} OneFS: Rendimiento lento intermitente de la enumeración de recursos compartidos o la autenticación de SMB; isi_cbind_d retrasos de DNS

Summary: Retraso intermitente o falta de respuesta (tiempo de espera agotado) Enumeración de recursos compartidos o autenticación de SMB

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Los usuarios pueden experimentar latencia intermitente o tiempos de espera agotados cuando intentan acceder a recursos compartidos almacenados en un clúster Isilon; El acceso se restaura sin intervención en cuestión de segundos o minutos.

La autenticación o la enumeración de recursos compartidos pueden tardar varios de 5 segundos (p. ej., 25 segundos, por ejemplo) en completarse, pero en intervalos periódicos (~15 minutos por nodo exactamente). Es posible que un nodo experimente el problema, mientras que otros no. Además, cuando se utiliza la operación por turnos de SmartConnect, el problema puede parecer más frecuente, ya que cada nodo experimenta este problema de manera independiente entre sí.

NOTA: En este artículo de la base de conocimientos, se aborda una posible causa de la lentitud de la autenticación de SMB y la enumeración de recursos compartidos; Pueden existir otras causas. La recomendación para la resolución aquí es un medio para descartar una causa

probableEs posible que aparezca lo siguiente en los registros de isi_cbind_d alrededor del momento en que se produjeron los problemas:
isi_cbind_d[76119]: [0x800703400]Enlace: CBIND_send_query(1161) Advertencia: Stallset dns no tiene puestos disponibles

Esto se puede encontrar mediante la ejecución de lo siguiente:
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

De manera predeterminada, cada 15 minutos venceremos nuestra conexión AD LDAP DC proactivamente. El vencimiento de la conexión DC ocurre en el momento en que se utiliza la conexión (es decir, durante la autenticación), lo que iniciará el proceso de:
  1. Bloquee la exclusión mutua de la conexión AD DC (esto bloquea todas las solicitudes hasta que se seleccione un nuevo DC)
  2. Caducar la conexión existente
  3. Enumere una lista de DC a los que conectarse (registro SRV de DNS; _ldap._tcp.dc._msdcs.domain.com)
  4. Resuelva los nombres DNS a la dirección IP de la lista de controladores de dominio (búsquedas de DNS de registro A)
  5. Enviar ping de CLDAP a todos los DC; Esperar a los que responden más rápido (dejar de enviar/recibir después de 10 ms desde la primera respuesta)
  6. Seleccione de forma inteligente entre los DC que respondieron (de forma semialeatoria mediante estadísticas históricas de DC)
Es durante la fase de búsqueda de registros DNS A (4, arriba) donde se pueden introducir retrasos. De manera predeterminada, en un clúster de Isilon que ejecuta OneFS 8.x, la caché de DNS de groupnet está habilitada (isi_cbind_d). Cuando isi_cbind_d (demonio de caché de DNS) no puede atender las búsquedas de DNS (no responde a la solicitud ni se comunica con una DC externa), la resolución de DNS del kernel realizará una conmutación por error al siguiente servidor DNS disponible a través de /etc/resolv.conf (o más específicamente, los servidores DNS configurados para la groupnet en cuestión), lo que incurre en un tiempo de espera/retraso de 5 segundos para cada consulta de registro A.

El retraso total atribuido a las búsquedas de DNS es igual a 5 veces el número de registros A que necesitamos resolver. Si el conteo de registros supera los 12 registros, esto activará un tiempo de espera agotado/restablecimiento de 60 segundos desde el cliente, los cuales se verán errores en el cliente relacionados con la incapacidad de acceder al clúster o al recurso compartido.

NOTA: El culpable más común de esta situación se atribuye a isi_cbind_d búsquedas de DNS, pero también puede ser el resultado de otros factores

Resolution

Suponiendo lo siguiente:
  1. El problema se corrige automáticamente sin intervención de los administradores
  2. Los retrasos alcanzan incrementos de tiempo de 5 segundos
  3. La frecuencia por nodo es de ~15 minutos
La ruta más rápida hacia la resolución y la validación es deshabilitar el almacenamiento en caché de DNS para la groupnet en uso:
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

Como alternativa (si prefiere mantener la caché de DNS habilitada), una mitigación sería reiniciar el servicio de almacenamiento en caché de DNS en todos los nodos:
# isi_for_array 'killall -9 isi_cbind_d'

Y verifique que se haya reiniciado en todos los nodos (según el registro de fecha y hora en que se inició el proceso):
# isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
NOTA: Es posible que esto deba repetirse si el problema vuelve a ocurrir en el futuro, momento en el cual se requerirá intervención manual para reiniciar proactivamente o recurrir a la deshabilitación de la caché hasta que se pueda administrar una actualización (detalles a continuación)

Si lo anterior no resuelve el problema, es posible que haya otros factores en juego que requieran la asistencia del soporte de Dell EMC Isilon.

Las versiones 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1.1 de OneFS contienen la corrección (ID 205142) para isi_cbind_d que es una causa probable para las fallas de DNS descritas en esta base de conocimientos y, una vez que esté disponible, Isilon recomienda actualizar a esa versión, momento en el cual se puede volver a habilitar la caché de DNS.

Si el problema persiste después de actualizar a las versiones mencionadas anteriormente, o si el almacenamiento en caché de DNS está configurado en falso en las groupnet, es posible que se necesiten detalles adicionales y recopilación de datos para determinar la causa exacta.

Si tiene alguna pregunta sobre este problema y las rutas relacionadas para la resolución, o si se requiere ayuda, comuníquese con el soporte de Isilon.

Additional Information

Artículo de la base de conocimientos relacionado: 502259 (las latencias también se pueden ver como resultado de una falla en la búsqueda de un GC; que también puede ser susceptible al problema de isi_cbind_d descrito en este artículo de la base de conocimientos)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.