Metroノード: metroノードからログを収集する方法
Summary: この記事では、metroノードからログを収集する手順と、パフォーマンスの問題に必要なログ/データについて説明します。
Instructions
次のタスクを実行するための手順:
- メトロ ノードの問題をデバッグするには、どのようなログが必要ですか?
- metroノード クラスターでcollect-diagnosticsをキャプチャーする方法を教えてください。
- Management Server上の既存のcollect-diagnosticsパッケージを検証する方法。
- メトロ ノードで進行中の収集診断をキャンセルしてクリーンアップする方法を教えてください。
ある。メトロ ノードの問題をデバッグするには、どのようなログが必要ですか?
-
metroノードからログを収集するために必要なコマンドは「collect-diagnostics」と呼ばれ、metroノード セットアップ内の任意のノード(*1)から実行できます。メトロ ノード クラスターの1つのダイレクターでこのコマンドを実行すると、クラスターの全ノードのすべてのダイレクターからのすべてのデータが必要です。このコマンドは、一度に複数のノードで実行しないでください。
*1 注: Metro構成の場合は1つのクラスターのみで、1つのダイレクターのみから「collect-diagnostics」コマンドを実行し、そのコマンドが完全に完了するまで待ってから、必要に応じて別のダイレクターまたはピア クラスターからCDを収集します。 -
「collect-diagnostics」コマンドは、構成ファイルとログ ファイルを含む圧縮tar.gzログ ファイルを生成します。collect-diagnosticsファイルは、実行元のノードの/diag/collect-diagnostics-out/ディレクトリーに配置されます。コマンドが完了したら、WINSCP、または同等のSCPユーティリティーを使用してノードからファイルをコピーし、分析のためにサポートに提供できるようにします。このコマンドの使用方法の詳細については、以下のセクションBを参照してください。
メモ:- 「collect-diagnostics」コマンドがオプションなしで実行されている場合は、ベース ファイルと拡張ファイルの2つのファイルが生成されます。拡張されたシステムでは、これには非常に長い時間がかかる場合があります。
- メトロ ノードのサポートでは、通常ベース ファイルのみが必要ですが、状況によっては、パフォーマンス上の問題により、拡張ファイルも必要になる場合があります。
- collect-diagnosticsの実行時に使用を求められる可能性のある標準オプションは次のとおりです。
- 」
--noextended": このオプションは、拡張診断の収集を省略します。 - 」
--last-logs": このオプションは、x時間またはx日前にさかのぼってログをキャプチャします。
- 」
- コマンドの詳細については、「collect-diagnostics -h」と入力します。
これらは、これら2つのファイル名がどのように見えるかのサンプルです。YYYY-MM-DD-HH.MM.SS として表示される日付と時刻は、これらが収集された日付と時刻からのものです。
- ベース ファイル:
<Serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz - 拡張ファイル:
<Serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz
-
パフォーマンスの問題は複雑で、多くの特定の情報を収集する必要があります。そのため、このプロセスを迅速化するために、パフォーマンスに関するアンケートをご用意しております。お客様にはご記入をお願いしております。アンケートは、このナレッジベース記事の最後にある添付ファイル セクションに添付されています。
-
パフォーマンスの問題の種類によっては、「fe_perf_stats」と呼ばれる追加のログを取得すると便利です。ログは継続的に生成されますが、collect-diagnosticsによってキャプチャされません。このログを取得するには、cd(ディレクトリーの変更)を各クラスターのノード上の/var/log/VPlex/cliに実行し、「tar cvzf fe-perf-stats.tar.gz fe_perf_stats*」コマンドを実行して、ファイルのデータをtarファイルに圧縮します。WINSCPまたは同等のSCPユーティリティーを使用してノードに接続し、/var/log/VPlex/cliを参照します。「fe-perf-stats.tar.gz」ファイルをシステムにコピーします。サポートから要求された場合は、tarファイルと1つ以上のcollect-diagnosticsファイルをSRまたはサポートが提供するFTPリンクとEメールにアップロードします。
-
診断の収集に加えて、次の情報を取得すると役立つ場合があります。
- PuTTYセッションのオープン ログ
- 次に、以下のコマンドを実行します。
- 次に、PuTTYログを収集し、システムにダウンロードします。
- 次に、PuTTYログ、collect-diagnostics、および要求されたその他のデータをSRに添付します。
次のコマンドは、VPlexcliプロンプトから実行します。
cluster statusll clusters/**/storage-views/* --fullll ~portsshow-use-hierarchy /clusters/**/virtual-volumes/*ll ~system-volumesls -t /clusters/*/directors/*::serial-number(このコマンドは、各ノードのすべてのDSTを一覧表示します)ls -t /clusters/**/director-*/::hostname(表示されるホスト名はIPアドレスであり、これは想定された動作です)
B.metroノード クラスターでcollect-diagnosticsをキャプチャーする方法を教えてください。
このデータを収集するには、フラグ「--noextended」と「--last-logs 30d」を指定してcollect-diagnosticsコマンドを実行します。
-
ダイレクター ノードのLinuxプロンプト( 例:service@director-1-1-a)でSSHセッションを確立してから、vplexcliにログインします。
出力例:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
-
collect-diagnosticsを開始するには、次の例に示すように、vplexcliプロンプトから指示されたオプションを指定して「collect-diagnostics」コマンドを実行します。
出力例:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. ダイレクター/ノード上の既存のcollect-diagnosticsパッケージを検証する方法。
-
collect-diagnosticsコマンドが完了してvplexcliプロンプトに戻ったら、winscp(または同等のSCPユーティリティー)を使用してコマンドを実行したダイレクターに接続し、フォルダー/diag/collect-diagnostics-out/を参照します。
-
正しいタイムスタンプを持つ1つ以上のログ ファイルを特定し、ローカル ワークステーションにダウンロードします。
D. 進行中の収集診断をキャンセルする方法
-
collect-diagnosticsを開始したPuTTYセッションが続いている場合は、collect-diagnositcsの出力がストリーミングで表示され、まだ実行中であることを確認できます。
出力例:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. -
複製されたPuTTYセッションを開き、サービス アカウントを使用して、collect-diagnosticsを開始したダイレクターにログインします。
出力例:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
-
ダイレクターで、次のコマンドを使用して管理コンソールを再起動し、実行中のcollect-diagnosticsをキャンセルします。
出力例:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
-
管理コンソールを再起動したときに、collect-diagnosticsが実行されている最初のPuTTYセッションを振り返ると、最後にメモされた出力として、collect-diagnosticsレポートが次のように表示されます。
"Connection closed by foreign host."
出力例(出力の最後の行を確認してください):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<< -
collect-diagnosticsが停止したことが表示されたら、上記の手順3で2番目のPuTTYセッションに戻り、「cd」で/diagディレクトリーに移動してから「ll 」を実行すると、追加のディレクトリーがいくつか表示されます。
collect-diagnostics-tmpcollect-diagnostics-jobscollect-diagnostics-tmp-ext*
*拡張ファイルを省略しなかった場合
出力例:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
これらの各ディレクトリーの中を見ると、キャンセルされたcollect-diagnosticsを開始した日付と時刻を含むファイルがあります。これらのファイルは/diagパーティションの領域を占有するため、削除する必要があります。
-
/diagディレクトリーからファイルを削除/削除するには、「rm -r collect-diagnostics-jobs」と「rm -r collect-diagnostics-tmp」と入力し、もう一度「ll」と入力して、ディレクトリーが削除または削除されたことを確認します。
出力例:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
-
「collect-diagnostics-tmp-ext」ディレクトリーが存在する場合は、「rm -r collect-diagnostics-tmp-ext」を実行して削除します。
注:拡張ファイルは通常、ノードのクラッシュを調査するために使用されます。ノード クラッシュに関する継続的な調査が進行中で、サポートが必要なすべてのログを取得していない場合は、collect-diagnostics-tmp-extディレクトリーをクリーンアップする前にサポートに確認してください。必要なコア ファイルが削除される可能性があります。