{ISILON} OneFS: Sporadyczne powolne uwierzytelnianie SMB lub wydajność wyliczania udziałów; isi_cbind_d opóźnienia DNS

Summary: Sporadyczne opóźnione lub nieodpowiadające (przekroczenie limitu czasu) uwierzytelnianie SMB i/lub wyliczenie udziału

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Użytkownicy mogą napotkać sporadyczne opóźnienia lub przekroczenie limitu czasu podczas próby uzyskania dostępu do udziałów przechowywanych w klastrze Isilon. Dostęp jest przywracany bez interwencji w ciągu kilku sekund/minut.

Uwierzytelnianie i/lub wyliczenie udziału może zająć wielokrotność 5 sekund (na przykład 25 sekund), ale w okresowych odstępach czasu (dokładnie ~15 minut na węzeł). Jeden węzeł może napotkać problem, a inne nie. Ponadto w przypadku korzystania z algorytmu okrężnego SmartConnect problem może pojawiać się częściej, ponieważ każdy węzeł doświadcza tego problemu niezależnie od siebie.

NUTA: Ta baza wiedzy obejmuje jedną z możliwych przyczyn powolnego uwierzytelniania SMB i wyliczania udziałów; Mogą istnieć inne przyczyny. Zalecenie rozwiązania w tym przypadku jest sposobem na wykluczenie jednej prawdopodobnej przyczyny

W czasie występowania problemów w dziennikach isi_cbind_d mogą pojawić się następujące elementy:
isi_cbind_d[76119]: [0x800703400]bind: CBIND_send_query(1161) Ostrzeżenie: Stallset dns nie ma dostępnych straganów

Które można znaleźć, uruchamiając:
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

Domyślnie co 15 minut proaktywnie wygasamy nasze połączenie AD LDAP DC. Wygaśnięcie połączenia DC następuje w momencie korzystania z połączenia (tj. podczas uwierzytelniania), co rozpocznie proces:
  1. Zablokuj Mutex połączenia kontrolera domeny usługi AD (blokuje wszystkie żądania do momentu wybrania nowego kontrolera domeny)
  2. Wygaśnięcie istniejącego połączenia
  3. Wylicz listę kontrolerów domeny, z którymi chcesz się połączyć (rekord SRV DNS; _ldap._tcp.dc._msdcs.domain.com)
  4. Rozwiąż nazwy DNS z adresem IP z listy wyszukiwań DNS kontrolera domeny (rekord A)
  5. Wyślij polecenie ping CLDAP do wszystkich kontrolerów domeny; Poczekaj na najszybsze odpowiedzi (przestań wysyłać/odbierać po 10 ms od pierwszej odpowiedzi)
  6. Inteligentny wybór spośród odpowiadających kontrolerów domeny (półlosowo przy użyciu historycznych statystyk DC)
To właśnie podczas fazy wyszukiwania rekordu DNS A (4, powyżej) mogą wystąpić opóźnienia. Domyślnie w klastrze Isilon z systemem OneFS 8.x pamięć podręczna DNS groupnet jest włączona (isi_cbind_d). Gdy isi_cbind_d (demon pamięci podręcznej DNS) nie jest w stanie obsłużyć wyszukiwań DNS (zarówno nie odpowie na żądanie, jak i nie skontaktuje się z zewnętrznym kontrolerem domeny), program rozpoznawania nazw DNS jądra przełączy się awaryjnie na następny dostępny serwer DNS za pośrednictwem /etc/resolv.conf (lub dokładniej serwerów DNS skonfigurowanych dla danej groupnetu), co powoduje 5-sekundowy limit czasu/opóźnienie dla każdego zapytania o rekord A.

Całkowite opóźnienie przypisane do wyszukiwań DNS jest równe 5-krotności liczby rekordów A, które musimy rozwiązać. Jeśli liczba rekordów przekroczy 12, spowoduje to 60-sekundowy limit czasu/reset klienta, który to błąd będzie widoczny na kliencie w związku z niemożnością uzyskania dostępu do klastra/udziału.

NUTA: Najczęstszym winowajcą w tej sytuacji jest isi_cbind_d wyszukiwania DNS, ale może być również wynikiem innych czynników

Resolution

Przy założeniu, że:
  1. Problem można rozwiązać samodzielnie bez interwencji administratorów
  2. Opóźnienia osiągają 5-sekundowe przyrosty czasu
  3. Częstotliwość na węzeł wynosi ~15 minut
Najszybszą ścieżką do rozwiązania problemu i weryfikacji jest wyłączenie buforowania DNS dla używanej groupnet:
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

Alternatywnie (jeśli wolisz zachować włączoną pamięć podręczną DNS) środkiem zaradczym byłoby ponowne uruchomienie usługi buforowania DNS na wszystkich węzłach:
#isi_for_array 'killall -9 isi_cbind_d'

I sprawdź, czy został uruchomiony ponownie na wszystkich węzłach (na podstawie sygnatury czasowej rozpoczęcia procesu):
#isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
UWAGA: Jeśli problem wystąpi ponownie w przyszłości, może być konieczne powtórzenie tej czynności, w którym to czasie wymagana będzie ręczna interwencja w celu proaktywnego ponownego uruchomienia lub wyłączenia pamięci podręcznej do czasu przeprowadzenia uaktualnienia (szczegóły poniżej)

Jeśli powyższe nie rozwiąże problemu, w grę mogą wchodzić inne czynniki, które wymagają pomocy pomocy technicznej Dell EMC Isilon.

OneFS w wersji 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1.1 zawiera poprawkę (identyfikator 205142) dotyczącą isi_cbind_d, która jest prawdopodobną przyczyną błędów DNS opisanych w tej bazie wiedzy. Po udostępnieniu tej wersji Isilon zaleca uaktualnienie do tej wersji, w której będzie można ponownie włączyć pamięć podręczną DNS.

Jeśli problem nadal występuje po aktualizacji do wyżej wymienionych wersji lub buforowanie DNS jest ustawione na false w groupnet(s), mogą być konieczne dodatkowe szczegóły i zebranie danych w celu ustalenia dokładnej przyczyny.

W przypadku jakichkolwiek pytań dotyczących tego problemu i powiązanych ścieżek jego rozwiązania lub jeśli wymagana jest pomoc, skontaktuj się z działem pomocy technicznej Isilon.

Additional Information

Powiązany artykuł z bazy wiedzy: 502259 (opóźnienia mogą być również widoczne jako wynik niepowodzenia w znalezieniu GC; co może być również podatne na problem isi_cbind_d opisany w tej bazie wiedzy)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.