Dell Unity:Unityパフォーマンス分析に必要な情報を収集する方法」
Summary: この記事では、Unityアレイのパフォーマンスの問題を診断するためにログとデータを収集する方法について説明します。
Instructions
課題
-
接続されているホストの読み取り/書き込み(または両方)のパフォーマンスが低い、またはレスポンス タイムが長い。
-
ホスト アプリケーションのレスポンス タイムが増加しているか、または許容上限を超えている。
-
Dell Unityアレイにおけるパフォーマンス分析が必要なパフォーマンスの問題。
パフォーマンスの問題には、いくつかの原因が考えられます。たとえば、ネットワーク構成、混雑状態、ホスト構成、ハードウェア障害、ディスク競合(同じドライブを共有する複数のビジーLUN)、ストレージアレイの使用率の最大化など、さまざまな原因が考えられます。
Unityテクニカル サポートは、次の情報が提供されるまで、パフォーマンスの問題を完全に調査およびトラブルシューティングすることはできません。
- サービス データ ファイル(Data Collect)
- UPAファイル(Unityパフォーマンス アーカイブ)
- 本番環境で発生した症状の詳細な説明
このDellナレッジベース記事(KB)の情報を迅速に提供しないと、解決時間が長くなる可能性があります。
パフォーマンスの問題の詳細(症状、タイム スタンプなど)は、エンジニア型社員が(原因ではなく)問題を見つけるためだけに数時間を費やすのではなく、どこに焦点を当てるべきか(時間、LUN、ホストなど)を把握するために極めて重要です。この詳細がなければ、問題の検索に何時間も費やし、一般的なパフォーマンス統計しか分析できなくなる可能性があります。
スコープ
カスタマー サポート サービスは、パフォーマンス ケースを調査して、お客様のサイトに影響を与える問題を特定します。パフォーマンス チューニング(ホストまたはアプリケーションのピーク時における性能を達成するため)と再構成は、ストレージ管理者またはソリューション アーキテクトのタスクであるため、故障修理サービス リクエストでは処理されません。
アレイ上の現在のワークロード レベルのレポートの要求など、定義された問題を伴わないサービス リクエストは、サポートの範囲外です。セルフヘルプの場合、またはアレイ上のワークロード レベルの確認についてサポートが必要な場合は、LiveOpticsサービスを使用できます。このオプションの詳細については、次の記事を参照してください。
詳細なパフォーマンス分析のためのデータおよび情報要件
テクニカル サポートは、各イベントについて、インシデント期間をカバーする次のログと情報を必要とします。
- 問題が発生した直後に生成されるサービス データ ファイル(Data Collectsとも呼ばれる)。
- レプリケーションが使用中の場合は、両方のアレイからのData CollectsおよびUPAファイルが必要です。
- 問題が発生した期間全体をカバーするUnity UPAファイル(Unityパフォーマンス アーカイブ)。
- 問題がアレイの外部にあるように見える場合は、ホストGrabとスイッチのログも必要になる場合があります。
- Unityネットワーク トレースも必要になる場合があります。
ブロックの問題
- 明確で詳細な問題の説明を入力します。
- 問題が発生したのはいつですか?(日付、時刻、タイム ゾーン)
- どのLUNに影響がありますか?
- これは 検索を絞り込むために重要です。
- 問題が発生しているLUNで、データ削減または高度な重複排除が有効になっていますか?データ削減は他のLUNで有効になっていますか?(『Dell Unity: Best Practices Guide』の「CPU Utilization」セクション(9ページ)を参照してください)
- レプリケーションは使用されていますか?レプリケーションのRPOに関する情報と、レプリケーションが一時停止された場合にパフォーマンスの問題が改善されるかどうかを説明してください。
- アクティブなデータ使用不可の状態は、存在しますか、または存在したことがありますか?
- 指定された時間に他に何か実行されていますか?(バックアップ、ジョブ、バッチ、ウイルス スキャン、ホスト ディスク最適化(TRIM/UNMAP)など)
- 何かが正常に作動していない場合、これまでは正常に作動していましたか?または、これは新しい実装/セットアップの一部ですか?最近、新しいアプリケーションやホストが追加されましたか?
- パフォーマンスはどのように測定されますか、またはどのような影響がありますか?ホスト側で遅延またはエラーが発生していますか?エンド ユーザーから遅いという報告がありますか?
- SAN環境(ホスト、スイッチ、アレイ)に最近変更がありましたか?
- 影響(影響を受けるアプリケーション、影響を受けるサーバーの数、影響を受けるユーザーの数など)
- 問題はどのくらいの頻度で発生しますか?(継続的/定期的/1回/ランダム)
- 影響を受けるホストの名前は何ですか?
- どのようなトポロジーが使用されていますか?FC、iSCSI、またはEthernetですか?(iSCSIを使用している場合は、すべてのホストでTCP遅延ACKを無効にする必要があります。
- 接続に問題がある場合は、サポートはトポロジー図を要求する場合があります。
- ネットワークに既知の問題が同時に存在しますか、または最近ネットワークがアップグレードされましたか?また、iSCSIが内部LANで使用されておらず、使用されているスイッチがエンタープライズ クラスのスイッチである必要があることを確認します。
ファイルに関する問題
- 明確で詳細な問題の説明を入力します。
- 関連する特定のプロトコルは何ですか?
- Example: NFS(バージョン)、CIFS(バージョン)、NDMP、iSCSI、FTPなど
- 問題は、特定のエクスポート/共有、ファイル システム/LUNに関連していますか?
- 問題は何時に発生しますか?(日付、時刻、タイム ゾーン)
- その時点でアクティブなワークロードは何ですか?
- 例:ログイン、ログアウト、バックアップ、バッチ ジョブなど
- どのようなホストが関連しますか?
- Example: バックアップ、VM、ワークステーション、サーバーなど
- アプリケーションの具体的な詳細。
- ネットワーク構成はどのようになっていますか?
- 特定のインターフェイス/NICの詳細を入力します。
- ネットワーク インターフェイスは別々のNICで分離されていますか?
- Example: 専用NICのレプリケーション トラフィック
サービス データ ファイル(Data Collect)の収集
サービス データ ファイル(Data Collect)を収集するには、「LKB 000023676」を参照してください。アレイでサービス データ ファイルを実行して出力されたファイルは、詳細なアレイ構成と、アレイで発生したすべてのイベントを表示するために必要です。サポートでは、イベントが発生した後にお客様ができるだけ早くサービス データ ファイル(Data Collect)を収集することをお勧めします。
サービス データ ファイルには、最後の完全なUPAファイル(1時間)と使用可能な -tmp.archive UPAファイルが含まれていることに注意してください。多くの場合、これは適切なパフォーマンス レビューには十分な情報ではなく、追加のUPAが必要です。
サービス データ ファイル(Data Collect)内でUPAファイルを検索するには、次に移動します。 spx\cmd_outputs\metrics\
-
spx= プライマリーSP -
Example: SPAがアクティブSPの場合、UPAは次の場所にあります。
spa\cmd_outputs\metrics
UPAファイルの収集
- サポートは追加のUPAファイルを要求する場合があります。
- サービス データ ファイル(Data Collect)とは異なり、アレイには最大48時間のUPAファイルが格納されます。
- UPAファイルは以下の例のようになります。各ファイル名には、ファイル内の最初のデータ ポイントの日付と時刻が含まれています。間隔は10秒で、1時間から10秒を引いた時間をカバーします。ファイル名の日付と時刻はUTC/GMTです。
- 下の例にある最後のUPAファイルは、最新のアーカイブです(
-tmp.archive)を使用するシステムで一般的に行われる、繰り返しのプログラムおよび消去サイクルによって劣化しやすい傾向があります。これには現在のパフォーマンス データが含まれており、アレイからコピーして(SSH/CLIの使用のみ)最新のデータを確認できます。このファイルを使用すると、サポートは次の時間まで待つことなく、パフォーマンス イベントを表示できます。
- 下の例にある最後のUPAファイルは、最新のアーカイブです(
Dell Unityアレイに格納されているUPAファイルの例:01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 01:00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
オプション1:Unisphereリスト
このオプションは、Unity OE 4.2以降でのみ使用できます。使用可能なすべてのUPAがここに表示されるとは限りません。UI (Unisphere)には制限があり、一部の使用可能なファイルのみを一覧表示できます。必要なUPAファイルがリストされていない場合は、オプション2に移動するか、SSH/CLIを使用します。
オプション2: Unisphereの時間範囲
- システムが使用可能なUPAを取得するための時間範囲を選択できます。
- 必要なログのみがダウンロードされるように、ログを収集する前に問題の時間を確認してください。
- カスタム時間の範囲はローカル ブラウザーの時間になり、多くの場合、ワークステーションの現在の時間と同じになることに注意してください。
- このオプションは、Unity OE 4.2以降でのみ使用できます。

SSH/CLIを使用する場合
また、CLIを使用して、Unityアレイ上のより多くのUPAにアクセスすることもできます(ただし、オプション1のUI (Unisphere)には表示されません)。
-
「service」ユーザーとサービス パスワードを使用してログインします
-
目的のログを次の場所にコピーします:
/cores/service/userfrom/EMC/backend/metricsluna1/archives -
WinSCPまたは同様のツールを使用して、これらのログをダウンロードします
-
アレイがOE 4.5.X以降の場合は、ファイル プロトコルをSCPに変更します
-
「service」ユーザーとサービス パスワードでログインします。
-
ll /EMC/backend/metricsluna1/archives/
cp /EMC/backend/metricsluna1/archives/_default_20230221_180000.archive.gz /cores/service/user
注:バックエンドには使用可能なUPAファイルが数十個あるため、現在のUPAのみを収集する場合は、|tail-10をお勧めします。ただし、すべてをリストすることもできます。

ホスト データ コレクション
特定のホストに固有の問題の場合は、ホストのGrab(またはEMCレポート)の出力ファイルが必要になる場合があります。
-
https://www.dell.com/support/home/(Dellサポート サイト)に移動し、適切なホストOSのGrabユーティリティーを検索します(例:ESXiホストGrab)
-
ユーティリティーとREADMEファイルをダウンロードします。
-
READMEファイルに従って、選択したホスト オペレーティング システム用のユーティリティーを実行します。
スイッチ ログ
パフォーマンスの問題が特定のパスにのみ存在する場合は、スイッチ ログが必要になることがあります。手順については、次のLKBを参照してください(使用されているモデルに基づく)。
Brocade/Connectrix