{ISILON} OneFS: Zeitweilig langsame SMB-Authentifizierungs- oder Share-Enumerationsleistung; isi_cbind_d DNS-Verzögerungen

Summary: SMB-Authentifizierung und/oder Share-Aufzählung zeitweilig verzögert oder nicht reagierend (Timeout)

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Beim Versuch, auf in einem Isilon-Cluster gespeicherte Freigaben zuzugreifen, können zeitweilige Latenzzeiten oder Timeouts auftreten. Der Zugriff wird ohne Eingriff innerhalb von Sekunden/Minuten wiederhergestellt.

Die Authentifizierung und/oder Share-Enumeration kann mehrere von 5 Sekunden dauern (z. B. 25 Sekunden), aber in regelmäßigen Intervallen (~15 Minuten genau pro Node). Bei einem Node kann das Problem auftreten, bei anderen nicht. Außerdem kann das Problem bei Verwendung des SmartConnect-Rundlaufverfahrens häufiger auftreten, da jedes Node dieses Problem unabhängig voneinander hat.

ANMERKUNG: Dieser Wissensdatenbank-Artikel behandelt eine mögliche Ursache für langsame SMB-Authentifizierung und Share-Enumeration. Es können auch andere Ursachen vorliegen. Die Auflösungsempfehlung ist hier ein Mittel, um eine wahrscheinliche Ursache

auszuschließenIn den isi_cbind_d-Protokollen kann zum Zeitpunkt des Auftretens der Probleme Folgendes angezeigt werden:
isi_cbind_d[76119]: [0x800703400]binden: CBIND_send_query(1161) Warnung: Stallset DNS verfügt über keine verfügbaren Stalls

Diese finden Sie durch Ausführen von:
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

Standardmäßig läuft unsere AD-LDAP-DC-Verbindung alle 15 Minuten proaktiv ab. Der Ablauf der DC-Verbindung erfolgt zu dem Zeitpunkt, zu dem die Verbindung verwendet wird (d. h. während der Authentifizierung), wodurch der Prozess gestartet wird:
  1. Sperren der AD-DC-Verbindung Mutex (dadurch werden alle Anforderungen blockiert, bis ein neuer DC ausgewählt wird)
  2. Vorhandene Verbindung ablaufen lassen
  3. Listen Sie eine Liste von DCs auf, mit denen eine Verbindung hergestellt werden soll (DNS-SRV-Eintrag; _ldap._tcp.dc._msdcs.domain.com)
  4. Auflösen von DNS-Namen in IP-Adressen aus der Liste der DCs (DNS-Suchen mit A-Eintrag)
  5. Senden Sie einen CLDAP-Ping an alle DCs. Auf die schnellsten Antworter warten (Ende des Sendens/Empfangens nach 10 ms nach der ersten Antwort)
  6. Intelligente Auswahl aus den reagierenden DCs (halbzufällig anhand historischer DC-Statistiken)
In der Phase der DNS-A-Datensatzsuche (4, oben) kann es zu Verzögerungen kommen. Auf einem Isilon-Cluster, auf dem OneFS 8.x ausgeführt wird, ist der Gruppennetz-DNS-Cache standardmäßig aktiviert (isi_cbind_d). Wenn isi_cbind_d (DNS-Cache-Daemon) nicht in der Lage ist, DNS-Lookups zu bedienen (beide reagieren nicht auf die Anfrage und können keinen externen DC erreichen), führt der Kernel-DNS-Resolver ein Failover zum nächsten verfügbaren DNS-Server über /etc/resolv.conf durch (oder genauer gesagt, zu den DNS-Servern, die für das betreffende Gruppennetz konfiguriert wurden). Dies führt zu einem 5-Sekunden-Timeout/einer Verzögerung für jede A-Datensatzabfrage.

Die Gesamtverzögerung, die DNS-Abfragen zugeordnet wird, entspricht dem 5-fachen der Anzahl der A-Einträge, die wir auflösen müssen. Wenn die Anzahl der Datensätze 12 Datensätze überschreitet, löst dies ein 60-Sekunden-Timeout/Zurücksetzen vom Client aus, welche Fehler auf dem Client im Zusammenhang mit der Unfähigkeit, den Cluster/die Freigabe zu erreichen, angezeigt werden.

ANMERKUNG: Der häufigste Übeltäter in dieser Situation wird isi_cbind_d DNS-Lookups zugeschrieben, kann aber auch das Ergebnis anderer Faktoren sein

Resolution

Angenommen, es ist Folgendes gegeben:
  1. Das Problem wird ohne Eingreifen der Administratoren selbst behoben
  2. Verzögerungen in Schritten von 5 Sekunden
  3. Die Häufigkeit pro Node beträgt ~15 Minuten
Der schnellste Weg zur Lösung und Validierung besteht darin, das DNS-Caching für das verwendete Gruppennetz zu deaktivieren:
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

Alternativ (wenn Sie es vorziehen, den DNS-Cache aktiviert zu lassen) besteht eine Minderung darin, den DNS-Caching-Dienst auf allen Nodes neu zu starten:
# isi_for_array 'killall -9 isi_cbind_d'

Und überprüfen Sie, ob er auf allen Nodes neu gestartet wurde (basierend auf dem Zeitstempel, als der Prozess gestartet wurde):
# isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
HINWEIS: Dies muss möglicherweise wiederholt werden, wenn das Problem in Zukunft erneut auftritt. Dann ist eine manuelle Intervention erforderlich, um proaktiv neu zu starten oder den Cache zu deaktivieren, bis ein Upgrade durchgeführt werden kann (Details unten)

Wenn das Problem durch die oben genannten Schritte nicht behoben werden kann, spielen möglicherweise andere Faktoren eine Rolle, für die eine Unterstützung durch den Dell EMC Isilon-Support erforderlich ist.

OneFS-Versionen 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1 enthalten die Korrektur (ID 205142) für isi_cbind_d, die eine wahrscheinliche Ursache für die in diesem Wissensdatenbankartikel beschriebenen DNS-Fehler ist. Isilon empfiehlt, sobald verfügbar, ein Upgrade auf diese Version durchzuführen, wodurch der DNS-Cache wieder aktiviert werden kann.

Wenn das Problem nach dem Upgrade auf die oben genannten Versionen weiterhin besteht oder das DNS-Caching in dem/den Gruppennetz(en) auf "false " eingestellt ist, sind möglicherweise zusätzliche Details und eine Datenerfassung erforderlich, um die genaue Ursache zu ermitteln.

Wenn Sie Fragen zu diesem Problem und den zugehörigen Lösungspfaden haben oder Unterstützung benötigen, wenden Sie sich an den Isilon-Support.

Additional Information

Zugehöriger Wissensdatenbank-Artikel: 502259 (Latenzen können auch als Folge des Fehlfindens eines GC auftreten; der auch anfällig für das in diesem Wissensdatenbankartikel beschriebene isi_cbind_d Problem sein kann)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.