{ISILON} OneFS:SMB認証または共有列挙のパフォーマンスが断続的に遅くなる。DNS遅延isi_cbind_d

Summary: 断続的、遅延、または応答なし(タイムアウト) SMB認証および/または共有の列挙

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

ユーザーがIsilonクラスターに保存されている共有にアクセスしようとすると、断続的なレイテンシーまたはタイムアウトが発生する場合があります。介入なしで数秒/数分以内にアクセスがリストアされます。

認証や共有の列挙は、完了するまでに5秒の倍数(例:25秒)かかる場合がありますが、定期的に(正確にはノードあたり~15分)。1つのノードで問題が発生し、他のノードでは発生しない場合があります。また、SmartConnectラウンドロビンを使用している場合は、各ノードでこの問題が互いに独立して発生するため、この問題が頻繁に発生する場合があります。

手記:このKBでは、SMB認証と共有列挙が遅くなる原因の1つについて説明します。他の原因が存在する可能性があります。ここでの解決の推奨事項は、考えられる原因の 1 つを除外する手段です

問題の前後にisi_cbind_dログに次の内容が表示される場合があります。
isi_cbind_d[76119]: [0x800703400]バインド: CBIND_send_query(1161)警告: ストールセット dns に使用可能なストールがありません

これは、次のコマンドを実行すると見つかります。
# isi_for_array 'zegrep Stallset /var/log/isi_cbind_d.log*'

Cause

既定では、15 分ごとに AD LDAP DC 接続がプロアクティブに期限切れになります。DC接続の有効期限は、接続が使用された時点(つまり、認証中)に発生し、次のプロセスが開始されます。
  1. AD DC接続ミューテックスをロックします(これにより、新しいDCが選択されるまですべての要求がブロックされます)
  2. 既存の接続を期限切れにする
  3. 接続するDCのリストを列挙します(DNS SRVレコード; _ldap._tcp.dc._msdcs.domain.com)
  4. DCのリストからIPアドレスにDNS名を解決します(AレコードのDNSルックアップ)
  5. CLDAP ping をすべての DC に送信します。最速の応答者を待つ(最初の応答から10ミリ秒後に送受信を停止します)
  6. 応答したDCからインテリジェントに選択します(DCの履歴統計を使用した半ランダム)
遅延が発生する可能性があるのは、DNS A レコード ルックアップ フェーズ (上記の 4) 中です。OneFS 8.xを実行しているIsilonクラスターでは、デフォルトでグループネットDNSキャッシュが有効になっています(isi_cbind_d)。isi_cbind_d (DNS キャッシュデーモン) が DNS ルックアップを処理できない場合 (要求への応答に失敗し、外部 DC への到達に失敗した場合)、カーネル DNS リゾルバーは /etc/resolv.conf を介して次に使用可能な DNS サーバー (より具体的には、問題のグループネット用に構成された DNS サーバー) にフェールオーバーします。 これにより、A レコード クエリごとに 5 秒のタイムアウト/遅延が発生します

DNSルックアップに起因する遅延の合計は、解決する必要があるAレコードの数の5倍に相当します。レコード数が12レコードを超えると、クライアントから60秒のタイムアウト/リセットがトリガーされ、クラスター/共有に到達できないことに関連するエラーがクライアントに表示されます

手記:この状況の 最も一般的な 原因は、isi_cbind_d DNSルックアップに起因しますが、他の要因の結果である可能性もあります

Resolution

以下を前提としています。
  1. この問題は、管理者の介入なしに自己修復されます
  2. 遅延が5秒刻みで発生する
  3. ノードごとの頻度は~15分
解決と検証への最短のパスは、使用中のグループネットのDNSキャッシュを無効にすることです。
# isi network groupnets modify <groupnet> --dns-cache-enabled=false
 

または(DNSキャッシュを有効にしたままにする場合)、軽減策として、すべてのノードでDNSキャッシュ サービスを再起動できます。
#isi_for_array「killall -9 isi_cbind_d」

そして、すべてのノードで再起動されたことを確認します(プロセス開始時のタイムスタンプに基づく)。
#isi_for_array'psのauxwp'pgrepのisi_cbind_d''
メモ: 将来的に問題が再発する場合は、これを繰り返す必要があります。その時点で、アップグレードを管理できるようになるまで、プロアクティブに再起動するか、キャッシュを無効にするために手動操作が必要になります(詳細は以下を参照)。

上記で問題が解決しない場合は、他の要因が関係している可能性があり、Dell EMC Isilonサポートのサポートが必要です

OneFSバージョン8.0.0.6/8.0.1.3/8.1.0.2/8.1.1.1には、このKBに記載されているDNS障害の原因として考えられるisi_cbind_dの修正(ID 205142)が含まれています。Isilonでは、利用可能になったら、DNSキャッシュを再度有効にできるリリースにアップグレードすることをお勧めします。

前述のバージョンにアップグレードした後も問題が解決しない場合、またはグループネットでDNSキャッシュがfalseに設定されている場合は、正確な原因を特定するために、追加の詳細とデータ収集が必要になる場合があります

この問題および関連する解決パスに関する質問がある場合、またはサポートが必要な場合は、Isilonサポートにお問い合わせください。

Additional Information

関連するKB:502259(レイテンシーは、GCの検出に失敗した結果として見られることもあります。このKBで説明されているisi_cbind_dの問題の影響を受けやすい場合もあります)

Affected Products

PowerScale OneFS

Products

PowerScale OneFS
Article Properties
Article Number: 000170774
Article Type: Solution
Last Modified: 08 Jul 2025
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.