{ИСИЛОН} OneFS: Периодически замедляется выполнение аутентификации SMB или перечисления общих ресурсов; isi_cbind_d Задержки DNS

Summary: Периодическая задержка или отсутствие ответа (тайм-аут) аутентификации SMB и/или перечисления общих ресурсов

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Пользователи могут испытывать периодические задержки или истечение времени ожидания при попытке доступа к общим ресурсам, хранящимся в кластере Isilon. Доступ восстанавливается без вмешательства в течение нескольких секунд/минут.

Аутентификация и/или перечисление общих ресурсов могут занимать кратно 5 секундам (например, 25 секунд), но с периодическими интервалами (максимум ~15 минут на узел). На одном узле эта проблема может возникать, а на других ее нет. Кроме того, при использовании циклического перебора SmartConnect эта проблема может возникать чаще, так как все узлы сталкиваются с этой проблемой независимо друг от друга.

ЗАМЕТКА: В этой статье базы знаний рассматривается одна из возможных причин медленной аутентификации SMB и перечисления общих ресурсов. Могут существовать и другие причины. Рекомендация по разрешению проблемы в данном случае является средством исключения одной вероятной причины

Во время возникновения проблем в журналах isi_cbind_d может появляться следующее:
isi_cbind_d[76119]: [0x800703400]привязать: CBIND_send_query(1161) Предупреждение: Stallset dns не имеет доступных стойл

Его можно найти, выполнив команду:
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

По умолчанию срок действия подключения LDAP к ЦОД Active Directory истекает каждые 15 минут. Истечение срока действия подключения к контроллеру домена наступает в момент его использования (т. е. во время аутентификации), что запустит процесс:
  1. Заблокируйте Mutex подключения постоянного тока Active Directory (это заблокирует все запросы до тех пор, пока не будет выбран новый контроллер домена).
  2. Завершить срок действия существующего подключения
  3. Перечислите список контроллеров домена, к которым необходимо подключиться (запись DNS SRV; _ldap._tcp.dc._msdcs.domain.com)
  4. Разрешение имен DNS на IP-адрес из списка DNS-запросов (DNS-поиск записи A)
  5. Отправка запроса CLDAP ping на все контроллеры домена; Ожидание самых быстрых ответчиков (прекращение отправки/получения через 10 мс с момента первого ответа)
  6. Интеллектуальный выбор из отвечающих контроллеров домена (полуслучайный с использованием статистики по историческим контроллерам домена)
Задержки могут возникать именно на этапе поиска записи DNS A (4, выше). По умолчанию в кластере Isilon с OneFS 8.x включен кэш DNS groupnet (isi_cbind_d). Когда isi_cbind_d (демон кэша DNS) не может обслуживать DNS-поиски (оба не отвечают на запрос и не могут связаться с внешним контроллером домена), DNS-преобразователь ядра переключается на следующий доступный DNS-сервер через /etc/resolv.conf (или, точнее, DNS-серверы, настроенные для рассматриваемой groupnet), что влечет за собой 5-секундный тайм-аут/задержку для каждого запроса записи A.

Общая задержка, относящаяся к DNS-поискам, в 5 раз превышает количество A-записей, которые нам нужно разрешить. Если количество записей превысит 12, клиент запустит 60-секундный тайм-аут/сброс, после чего на клиенте будут отображаться ошибки, связанные с невозможностью доступа к кластеру или общему ресурсу.

ЗАМЕТКА: Наиболее распространенным виновником в этой ситуации является isi_cbind_d DNS-поиск, но также может быть результатом других факторов

Resolution

Предположим следующее:
  1. Проблема устраняется автоматически без вмешательства администраторов
  2. Задержки достигают 5 секунд
  3. Частота для каждого узла ~15 минут
Самый быстрый путь к разрешению проблемы и проверке — отключить DNS-кэширование для используемой сети групп:
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

В качестве альтернативы (если вы предпочитаете оставить кэш DNS включенным), для устранения проблемы можно перезапустить службу кэширования DNS на всех узлах:
# isi_for_array 'killall -9 isi_cbind_d'

И убедитесь, что он был перезапущен на всех узлах (на основе метки времени при запуске процесса):
# isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
ПРИМЕЧАНИЕ. При повторном возникновении проблемы в будущем может потребоваться повторить процедуру, и тогда потребуется ручное вмешательство для упреждающего перезапуска или отключения кэша до тех пор, пока не будет выполнено обновление (подробные сведения см. ниже)

Если описанные выше действия не помогли устранить проблему, может быть несколько других факторов, для которых может потребоваться помощь службы поддержки DellEMC Isilon.

OneFS версий 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1 содержит исправление (идентификатор 205142) для isi_cbind_d, которое является вероятной причиной сбоев DNS, описанных в этой статье базы знаний, и после того, как оно станет доступно, Isilon рекомендует выполнить обновление до этого выпуска, после чего кэш DNS можно будет снова включить.

Если проблема по-прежнему сохраняется после обновления до указанных выше версий или кэширование DNS установлено в false, может потребоваться дополнительная информация и сбор данных для определения точной причины.

Если у вас есть вопросы относительно этой проблемы и связанных с ней путей решения или требуется помощь, обратитесь в службу поддержки Isilon.

Additional Information

Связанные статьи базы знаний: 502259 (задержки также могут наблюдаться в результате невозможности найти сборку мусора; которая также может быть подвержена isi_cbind_d проблеме, описанной в данной статье базы знаний)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.