{ISILON} OneFS:SMB 身份验证或共享枚举性能间歇性缓慢;isi_cbind_d DNS 延迟

Summary: 间歇性延迟或无响应(超时) SMB 身份验证和/或共享枚举

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

用户在尝试访问存储在 Isilon 群集上的共享时,可能会遇到间歇性延迟或超时;在几秒钟/几分钟内恢复访问,无需干预。

认证和/或共享枚举可能需要5秒的倍数(例如,25秒)才能完成,但以周期性间隔(准确地说,每个节点~15分钟)完成。一个节点可能会遇到此问题,而其他节点则不会。此外,当使用 SmartConnect 循环调度时,此问题可能会更频繁,因为每个节点都相互独立地遇到此问题。

注意:本知识库文章介绍了 SMB 身份验证和共享枚举速度缓慢的一个可能原因;可能存在其他原因。此处的解决建议是排除一个可能原因

的一种手段在问题发生前后,isi_cbind_d日志中可能会出现以下内容:
isi_cbind_d[76119]:[0x800703400]bind:CBIND_send_query(1161) 警告:Stallset dns has no available stalls

可以通过运行以下命令找到:
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

默认情况下,我们将每 15 分钟主动使 AD LDAP DC 连接过期一次。DC 连接到期发生在使用连接时(即在身份验证期间),这将启动以下过程:
  1. 锁定 AD DC 连接互斥锁 (这将阻止所有请求,直到选择新的 DC)
  2. 使现有连接过期
  3. 枚举要连接到的 DC 的列表(DNS SRV 记录; _ldap._tcp.dc._msdcs.domain.com
  4. 从域控制器列表中将 DNS 名称解析为 IP 地址(A 记录 DNS 查找)
  5. 将 CLDAP ping 发送到所有 DC;等待最快的响应者(在第一次响应 10 毫秒后停止发送/接收)
  6. 从响应 DC 中智能选择(使用历史 DC 统计信息半随机)
在 DNS A 记录查找阶段(如上文第 4 条),可能会引入延迟。默认情况下,在运行 OneFS 8.x 的 Isilon 群集上,groupnet DNS 缓存处于启用状态 (isi_cbind_d)。当 isi_cbind_d(DNS 缓存守护程序)无法为 DNS 查找提供服务(两者都无法响应请求并且无法联系到外部 DC)时,内核 DNS 解析器将通过 /etc/resolv.conf 故障切换到下一个可用的 DNS 服务器(或更具体地说,为相关 groupnet 配置的 DNS 服务器), 对于每个 A 记录查询,这会导致 5 秒超时/延迟。

归因于 DNS 查找的总延迟等于我们需要解析的 A 记录数的 5 倍。如果记录计数超过 12 条记录,这将触发客户端的 60 秒超时/重置,客户端上会显示与无法访问群集/共享相关的错误。

注意:这种情况 最常见的 罪魁祸首归因于isi_cbind_d DNS 查找,但也可能是其他因素的结果

Resolution

假设以下情况:
  1. 此问题可自行修复,无需管理员干预
  2. 延迟达到 5 秒的时间增量
  3. 每个节点的频率为 ~15 分钟
解析和验证的最快途径是禁用正在使用的 groupnet 的 DNS 缓存:
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

或者(如果您希望保持启用 DNS 缓存),缓解方法是在所有节点上重新启动 DNS 缓存服务:
# isi_for_array 'killall -9 isi_cbind_d'

并验证它已在所有节点上重新启动(基于进程启动时的时间戳):
# isi_for_array 'ps auxwp 'pgrep isi_cbind_d''
提醒:如果将来问题再次发生,则可能需要重复此作,此时需要手动干预以主动重新启动或求助于禁用缓存,直到可以管理升级(详细信息如下)

如果上述方法无法解决您的问题,则可能还有其他一些因素在起作用,这需要 DellEMC Isilon 支持人员的协助。

OneFS 版本 8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1 包含isi_cbind_d的修复程序 (ID 205142),该修复程序是导致本知识库文章中所述的 DNS 故障的可能原因,一旦可用,Isilon 建议升级到该版本,此时可以重新启用 DNS 缓存。

如果升级到上述版本后问题仍然存在,或者 groupnet 上的 DNS 缓存设置为 false ,则可能需要其他详细信息和数据收集来确定确切原因。

如果对此问题和相关解决方法有任何疑问,或者需要帮助,请联系 Isilon 支持。

Additional Information

相关 KB:502259(延迟也可能是找不到 GC 的结果;这也可能容易受到本知识库文章中描述的isi_cbind_d问题的影响)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.