新しい会話を開始

未解決

Community Manager

 • 

3.1K メッセージ

899

2019年9月12日 19:00

すべての管理者がIsilonクラスタの正常性を維持するために知っている必要がある主なヒント(000517416)

プライマリ製品:Isilon OneFS 8.0
製品:Isilon OneFS 8.0、Isilon OneFS 8.1、Isilon OneFS 7.1、Isilon OneFS 7.2、Isilon OneFS 7.2.0、Isilon OneFS 7.1.0、Isilon OneFS 7.1.1
バージョン:9
記事タイプ:ナビゲーション
対象読者:レベル30 = お客様
最終発行日:2018年2月15日木曜日21:52:06(GMT)

サマリー:
説明:
Isilon OneFSクラスタの正常性を維持するには、次のヒントを参照してください。
注:
目次
 Isilon OneFSクラスタの使用率
 保護レベル
 ターゲット コード
 パッチ
 ファームウェア
 EMCテクニカル アドバイザリおよびセキュリティ アドバイザリ
 ESRS
 Isilonのメンテナンス ジョブ
 Isilonイベント
 クラスタのヘルス チェック

Isilon OneFSクラスタの使用率:90%未満に保つ
 一般的な経験則では、クラスタの使用率を90%未満に保ちます。ノードに8TBと10TBのドライブがある場合は、使用率を80%未満に維持してパフォーマンスを向上させることをお勧めします。推奨される使用率レベルを超えるとシステムのパフォーマンスが低下する可能性があります。
 ドライブの使用率が90%を超えた状態でドライブで障害が発生すると、ドライブのsmartfail(再保護)にかかる時間が長くなります。90%以上のノードの障害では長時間かかる場合があり、容量が足
りない場合には完了しない場合があります。
注:Isilonのノード障害はsmartfail(再保護)プロセスを開始しません。管理者が開始する必要があります。
 容量が90%を超えた状態でドライブに障害が発生すると、残りのドライブの負荷が増加し、パフォーマンスがさらに低下します。
 ドライブの障害時に、ジョブ エンジンはFlexProtectまたはFlexProtectLinを実行するために縮退ステータスになり、Isilonメンテナンス ジョブは残りのドライブのデータを再保護します。デフォルトでは、他のメンテナンス ジョブ(SnapshotDeleteやCollectなど)は、サポートが特定の状況で他のジョブを実行するために縮退状態を変更できるという例外を除いて実行できませんでした。これは、削除保留のスナップショットが蓄積されるため、使用率が急激に増加する可能性があることを意味します。
 ノード、ノード プール、diskpoolsが90%未満であるいることを確認します。Isilon OneFSには、バランスを保つためのメンテナンス ジョブがありますが、場合によってはワークフローの要件(filepoolポリシーの使用、ノード追加、データ削除など)によって、ノード、ノード プール、ディスク プールのいずれかが90%以上になることがあります。
 Isilonシステムの使用率を90%未満に保つことで、多くの問題を防ぐことができます。セールス サイクルと内部および外部でノードをオンサイトで取得してクラスタに追加するプロセスによっては、使用率が80~85%に達したら、ノードの追加を検討し始めてください。
 詳細については、『Best Practices Guide for Maintaining Enough Free Space on Isilon clusters』を参照してください。

 

保護レベル:ノード プールを推奨される保護レベルに保持する
 OneFSはN+Mの保護にリード ソロモン アルゴリズムを使用しています。N+Mデータ保護モデルでは、Nはデータ ストライプ ユニット数を表し、Mは、データ消失を発生させることなくクラスタが対処可能なノードまたはドライブの同時障害数(またはノードとドライブの障害の組み合わせ)を表します。NはMより大きい必要があります。
 OneFS 7.2.x以降では、[ファイル システム]>[ストレージ プール]>[SmartPools]のWeb管理インターフェイスの各ノード プールに対する保護レベルを推奨しています。 新しいノードを追加するたびに保護レベルを再評価し、各ノード プールて推奨されている保護レベルを使用します。
 保護レベルを変更すると、より高い/新しい保護レベルでデータを保護する必要があるため、容量使用率が変わることがあります。使用率が高い場合は、Dell EMC Isilonエキスパートに問い合わせて、使用率への影響を検討してください。
 同じまたは同等のノード(『Isilon Support and Compatibility Guide』を参照)は、同じノード プールに置きます。
 Isilonメンテナンス ジョブが正常に完了すると、新しい保護レベルでデータが再保護されます。

 

ターゲット コード:常にターゲット コードまたはTarget - 1に維持する
 Dell EMC Isilonの一般に利用可能な(GA)リリース コードは、内部テストが完了した後で使用可能です。コードが特定の条件を満たすと、ターゲット コードとして指定されます。これらの条件には、フィールドでの作業時間、全サポート ノード プラットフォームへの導入、その他の品質メトリクスなどがあります。最も安定して信頼性の高いバージョンのOneFSをIsilonクラスタで動作させるために、ビジネス ニーズを満たすOneFSファミリーの最新の入手可能なターゲット コードにアップグレードしてください。ターゲットにアップグレードできない場合は、少なくともTarget - 1のコードをご利用ください。これらのガイドラインにはいくつかの例外があり、Dell EMCサポートやTAM(テクニカル アカウント マネージャー)などのIsilonエキスパートは、ターゲット コードではない特定のコードを推奨することがあります。詳細については、IsilonアップタイムInfo Hubを参照してください。
 アップグレードを計画し、OneFS Upgrades - Isilon Info Hubを参照してください。アカウント チームまたはDell EMCサポートに問い合わせて、Dell EMC RPS(リモート プロアクティブ サポート)チームを利用して、事前のヘルス チェックとアップグレードを行うことができるかどうかを確認します。

 

パッチ:適用可能なパッチの確認とインストール
 OneFSの任意のバージョンのパッチに関する情報を見つけるには、現在のIsilon OneFSパッチ ガイドを参照してください。
 使用しているバージョンのOneFSとワークフローに適用可能なパッチを探します。
o 各パッチには、パッチのサマリー、適用されるOneFSのバージョン、およびバグが修正されているMRバージョンが一覧で示されます。
o すべてのパッチがワークフローに適用できるわけではありません(たとえば、HDFSを使用しない場合、HDFSパッチは必要ありません)。
o パッチによっては、ノードの再起動を必要とする場合があります。サービスの再起動を必要とするものも、オンラインでいられるものもあります。
o パッチIDをクリックして、パッチ ファイルをダウンロードします。zipファイルにはパッチとREADMEがあります。
READMEファイルには、パッチのインストールの影響と処理手順に関するすべての詳細が記載されています。
o このビデオを視聴して、パッチとインストール プロセスを理解することもできます。
 システムに適用されてワークフローに関連する新しいパッチを定期的にチェックします。

 

ファームウェア:3か月ごとにファームウェアのバージョンをチェックする
 Dell EMC Isilonは、ノードおよびドライブのファームウェア アップデートを定期的にリリースします。
注:第5世代ノード(S210、X410、X210、NL410、HD400)では、同様にアップグレードする必要があるBMCファームウェアとCMCファームウェアがあります。これらのアップデートには、新しい機能が含まれ、お客様に関連する可能性のある既知の問題を解決します。ノードのファームウェアではノードの再起動が必要です。BMCファームウェアではノードの再起動が必要です。ドライブのファームウェアは、特定のドライブ モデルやOneFSのバージョンの一部の例外を除いて、ほとんどがオンラインです。
 ファームウェアによっては、パッチまたはOneFSの要件があります。ファームウェアをアップグレードする前に、必ずリリース ノートを確認してください。OneFSの各バージョンのリリース ノートは、IsilonアップタイムInfo Hubの[ターゲット コード]セクションにあります。
 最新のファームウェアのバージョンを確認するには、『Current Isilon Software Releases』を参照してください。

 

EMCテクニカル アドバイザリおよびセキュリティ アドバイザリ:無視しないでください
 ETA(EMCテクニカル アドバイザリ)およびESA(EMCセキュリティ アドバイザリ)を受信するために、Dell EMC Webサイトに登録されていることを確認してください。
o Eメールが届いたら、注意深く読んでください。質問がある場合は、Dell EMCサポート、セールス、その他のDell EMC従業員(TAM、SAM、CSA、DSEなど)に問い合わせて、詳細を入手してください。
o サブスクライブするステップについては、Dell EMCナレッジベース記事334017を参照するか、または以下のビデオを視聴してください。
 ETAとESAはOneFSバージョンに固有なので、そのバージョンのOneFSを実行しているIsilonクラスタがあるかどうか、およびお使いのIsilonクラスタに影響があるかどうかを確認してください。
 ETAは、データ消失、データの使用不可、システム機能の喪失、重大な安全上のリスクをもたらす可能性のあるものなど、本番環境に重大な悪影響を与える可能性のあるハードウェアまたはソフトウェアの問題について警告します。このアドバイザリには、この問題に関する具体的な詳細情報と、問題を防止または軽減するための手順が含まれます。ETAの影響を確認するには、ETAおよび影響を受けたOneFSバージョンの影響セクションにある重大度の評価の説明を読んでください。詳細については、次を参照してください。Isilon OneFSの ETA(EMC テクニカル アドバイザリ)
 ESAは、Dell EMC製品の潜在的なセキュリティの脆弱性と対応策を警告します。このアドバイザリには、この問題に関する具体的な詳細情報と、問題を防止または軽減するための手順が含まれます。一般的なCVE(脆弱性とエクスポージャー)は、一般に知られているセキュリティの問題を識別します。Dell EMC ESAは、1つ以上のCVEに対応できます。詳細については、次を参照してください。ESA(EMC Isilonセキュリティ アドバイザリ)

 

ESRS/アラート:ESRSを通じてIsilonシステムをEMCに接続し、イベントをEメールで設定します。
 OneFS 7.1のリリースにより、Isilon製品はリモート接続でESRSを利用できます(ビデオ)。
注:ESRSバージョンは2.24以上でなければなりません。Isilonイベントは、Eメール、SNMP、またはESRSを介して開始できます。すべてのイベントがIsilon SRを生成するわけではないので、イベントのEメール通知を設定することが重要です。
 また、ESRSでは、リモート サポートが可能で、ログを収集し、安全にデバイスに接続することができます。ESRSポリシー マネージャーを使用して、デバイスへのアクセスを管理できます。
 ESRSやEメール通知がなければ、Dell EMCがお客様のデータセンター内のデバイスに関する情報を持っていない可能性があるため、重要なイベントやFCOを見逃す可能性があります。
 ESRSの設定の詳細については、Dell EMCサポート担当者にお問い合わせください(無償)。

Isilonのメンテナンス ジョブ:実行中であることを確認する
OneFSは、ジョブ エンジンを使用して、ジョブと呼ばれるメンテナンス タスクをスケジュールします。これらのジョブの一部は、実行が必須です(たとえば、期限切れのスナップショットを削除するSnapshotDelete、すべてのノードの使用率をバランスよく維持するMultiScanまたはAutobalance、障害が発生したデバイスの
データを再保護するFlexProtectなど)。コマンドを使用してジョブ エンジンのステータスを確認して、ジョブが実行されていることを定期的に確認する必要があります。
Isilonジョブ エンジンに関する詳細については、『Ask the Expert: The What, Why and How of the Isilon Job Engine.』を参照してください。次の記事も参照してください。
 ジョブ エンジンの利点
 Understanding Parallel Processing and Job Impacts in the OneFS Job Engine
ジョブの数、作業者数、優先度、および各ジョブの影響には、多くの構成オプションが用意されています。これらのオプションは、Dell EMCエンジニアが指示した場合にのみ変更してください。

 

Isilonイベント:自分とクラスタがイベント アラートを受信していることを確認する
Isilonクラスタは、問題を検出するとイベントを作成します。すべてのイベントがDell EMC Servicesリクエストにつながるわけではありません(クォータ超過やSyncIq RPOなど)。これらのイベントを監視し、これらのイベントを受信する方法(SMTPやSNMPなど)を構成しておくことが重要です。
 イベントを受け取らない場合は、SMTPチャネルおよびSNMPチャネルを確認してください。これらの機能が動作している場合は、CELOG(Clusterwideイベント ログ)データベースのリセットを試みてください。
 週に1回テスト イベントを送信して、システムがイベントを送信していることを確認します。参照:OneFS: 記事304312『How to reset the CELOG database and clear all historical events』
 OneFS 8.0以上では、CELOGをメンテナンス モードにして、Isilonクラスタでテストまたは計画されたアクティビティが行われている間に、アラートの受信やダイヤル ホーム サービス リクエストのトリガーを回避できる新しい機能が追加されています。記事494523『OneFS 8.0+ How to place the CELOG into Maintenance mode』を参照してください。

 

クラスタのヘルス チェック:Isilon AdvisorとInsightIQを使用してログを収集し、正常性をチェックしてパフォーマンスを監視する
 IA(Isilonアドバイザ)(フリー アプリケーション)を使用して、Isilonクラスタの正常性をチェックし、一般的なIsilonの問題を解決します。
o Isilon Advisorをダウンロードし、ビデオを視聴して、その機能と使い方を理解してください。
 InsightIQは、パフォーマンスとファイル システムの統計情報を監視し、システムが通常の運用中にどのように実行されているかを理解し、Isilon OneFSに書き込まれているファイルのタイプを調べるために利用できるDell EMCソフトウェアです。これ1つでさまざまなIsilonシステムのパフォーマンスを監視できます。
注:InsightIQにはライセンスが必要です。アカウント担当者に問い合わせてライセンスを取得してください。
 InsightIQのダウンロード(support.emc.comにログインする必要があります)
追加情報 その他のトラブルシューティングの詳細については、Customer Troubleshooting Info Hubにアクセスして、一般的なIsilonの問題の解決に役立つトラブルシューティング ガイドを参照してください。

 

プライマリ製品:
Isilon OneFS 8.0
製品:
Isilon OneFS 8.0、Isilon OneFS 8.1、Isilon OneFS 7.1、Isilon OneFS 7.2、Isilon OneFS 7.2.0、Isilon OneFS 7.1.0、Isilon OneFS 7.1.1

1添付ファイル

レスポンスがありません。
イベントは見つかりませんでした!

Top