{ISILON} OneFS : Lenteur intermittente des performances d’authentification SMB ou d’énumération de partage ; isi_cbind_d retards DNS

Summary: Authentification SMB intermittente, retardée ou non réactive (délai d’expiration) et/ou énumération de partage

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Les utilisateurs peuvent rencontrer une latence intermittente ou des délais d’expiration lorsqu’ils tentent d’accéder aux partages stockés sur un cluster Isilon. L’accès est rétabli sans intervention en quelques secondes/minutes.

L’authentification et/ou l’énumération de partage peuvent prendre des multiples de 5 secondes (par exemple, 25 secondes, par exemple), mais à intervalles réguliers (~15 minutes par nœud précisément). Un nœud peut rencontrer le problème, d’autres non. En outre, lors de l’utilisation de la fonction de permutation circulaire SmartConnect, le problème peut apparaître plus fréquent, car chaque nœud rencontre ce problème indépendamment l’un de l’autre.

NOTE: Cet article de la base de connaissances couvre une cause possible de lenteur de l’authentification SMB et de l’énumération de partage ; D’autres causes peuvent exister. En l’espèce, la recommandation de résolution est un moyen d’écarter une cause

probableLes éléments suivants peuvent apparaître dans les journaux isi_cbind_d au moment des problèmes :
isi_cbind_d[76119] : [0x800703400]bind : CBIND_send_query(1161) Warning : Stallset dns n’a pas de stalles disponibles

Vous pouvez le trouver en exécutant la commande suivante :
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

Par défaut, toutes les 15 minutes, nous faisons expirer notre connexion AD LDAP DC de manière proactive. L’expiration de la connexion CC se produit au moment de l’utilisation de la connexion (c’est-à-dire lors de l’authentification), ce qui lancera le processus de :
  1. Verrouillez le Mutex de connexion AD DC (cela bloque toutes les demandes jusqu’à ce qu’un nouveau DC soit sélectionné)
  2. Expiration de la connexion existante
  3. Énumérer une liste de contrôleurs de domaine auxquels se connecter (enregistrement SRV DNS ; _ldap._tcp.dc._msdcs.domain.com)
  4. Résoudre les noms DNS en adresse IP à partir de la liste des contrôleurs de domaine (recherche DNS d’enregistrement A)
  5. Envoyer un ping CLDAP à tous les contrôleurs de domaine ; Attendre les réponses les plus rapides (arrêter l’envoi/la réception 10 ms à partir de la première réponse)
  6. Sélectionnez intelligemment parmi les DC qui répondent (de manière semi-aléatoire à l’aide des statistiques historiques des contrôleurs de domaine)
C’est au cours de la phase de recherche d’enregistrement DNS A (4 ci-dessus) que des retards peuvent être introduits. Par défaut, sur un cluster Isilon exécutant OneFS 8.x, le cache DNS du réseau de groupe est activé (isi_cbind_d). Lorsque isi_cbind_d (le démon du cache DNS) n’est pas en mesure de traiter les recherches DNS (à la fois ne répond pas à la demande et ne parvient pas à contacter un contrôleur de domaine externe), le résolveur DNS du noyau bascule vers le prochain serveur DNS disponible via /etc/resolv.conf (ou plus précisément, les serveurs DNS configurés pour le réseau de groupe en question), ce qui entraîne un délai d’expiration/délai de 5 secondes pour chaque requête d’enregistrement A.

Le délai total attribué aux recherches DNS est égal à 5 fois le nombre d’enregistrements A que nous devons résoudre. Si le nombre d’enregistrements dépasse 12 enregistrements, cela déclenche un délai d’expiration/réinitialisation de 60 secondes de la part du client, ce qui déclenche des erreurs sur le client liées à l’incapacité à atteindre le cluster/partage.

NOTE: Le coupable le plus courant dans cette situation est attribué à isi_cbind_d recherches DNS, mais peut également être le résultat d’autres facteurs

Resolution

En supposant les conditions suivantes :
  1. Le problème se résout de lui-même, sans intervention de la part des administrateurs
  2. Les retards atteignent des incréments de 5 secondes
  3. La fréquence par nœud est de ~15 minutes
Le chemin le plus rapide vers la résolution et la validation consiste à désactiver la mise en cache DNS pour le réseau de groupe en cours d’utilisation :
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

Alternativement (si vous préférez garder le cache DNS activé), une atténuation consiste à redémarrer le service de mise en cache DNS sur tous les nœuds :
# isi_for_array 'killall -9 isi_cbind_d'

Et vérifiez qu’il a été redémarré sur tous les nœuds (en fonction de l’horodatage lors du démarrage du processus) :
# isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
Remarque : Cela devra peut-être être répété si le problème se reproduit à l’avenir, auquel cas une intervention manuelle sera nécessaire pour redémarrer de manière proactive ou recourir à la désactivation du cache jusqu’à ce qu’une mise à niveau puisse être administrée (détails ci-dessous)

Si les opérations ci-dessus ne résolvent pas votre problème, d’autres facteurs peuvent entrer en jeu et nécessiter l’assistance du support Dell EMC Isilon.

Les versions OneFS 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1 contiennent le correctif (ID 205142) pour isi_cbind_d qui est une cause probable des défaillances DNS décrites dans cet article de la base de connaissances et, une fois disponible, Isilon recommande d’effectuer une mise à niveau vers cette version, auquel cas le cache DNS peut être réactivé.

Si le problème persiste après la mise à niveau vers les versions mentionnées ci-dessus, ou si la mise en cache DNS est définie sur false sur le(s) réseau(x) de groupe, des informations supplémentaires et une collecte de données peuvent être nécessaires pour déterminer la cause exacte.

Si vous avez des questions concernant ce problème et les procédures de résolution associées, ou si une assistance est nécessaire, contactez le support Isilon.

Additional Information

Article connexe de la base de connaissances : 502259 (des latences peuvent également être observées en raison de l’échec de la recherche d’un GC ; qui peut également être sensible au problème de isi_cbind_d décrit dans cet article de la base de connaissances)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.