状態がWaitingのすべてのスケジュール済みジョブ
概要: ジョブは実行中ではありません。スケジュールされたジョブはすべてWaiting状態です。
この記事は次に適用されます:
この記事は次には適用されません:
この記事は、特定の製品に関連付けられていません。
すべての製品パージョンがこの記事に記載されているわけではありません。
現象
実行中のジョブはありません。ジョブ ステータスには、すべてのジョブがWaiting状態であることを示します。
lifs010-13# isi job jobs list ID Type State Impact Pri Phase Running Time ----------------------------------------------------------------- 1500 AutoBalanceLin Waiting Low 4 1/3 38d 21h 51m 1662 ShadowStoreProtect Waiting Low 6 1/1 - 1712 Collect Waiting Low 5 1/2 2d 6h 46m 1724 SnapshotDelete Waiting Low 2 1/2 - 1725 WormQueue Waiting Low 6 1/1 - 1726 ShadowStoreDelete Waiting Low 2 1/1 - 1727 QuotaScan Waiting Low 6 1/2 - ----------------------------------------------------------------- Total: 7
原因
これは、ノードの1つがジョブ エンジン コーディネーターから切断された場合に発生する可能性があります。
lifs010-102# isi job status --verbose
The job engine may temporarily delay running jobs.
Coordinator: 10
Connected: False
Disconnected Nodes: 8
Down or Read-Only Nodes: False
Statistics Ready: True
Cluster Is Degraded: False
Run Jobs When Degraded: False
Running and queued jobs:
ID Type State Impact Pri Phase Running Time
-----------------------------------------------------------------
1500 AutoBalanceLin Waiting Low 4 1/3 38d 21h 51m
1662 ShadowStoreProtect Waiting Low 6 1/1 -
1712 Collect Waiting Low 5 1/2 2d 6h 46m
1724 SnapshotDelete Waiting Low 2 1/2 -
1725 WormQueue Waiting Low 6 1/1 -
1726 ShadowStoreDelete Waiting Low 2 1/1 -
1727 QuotaScan Waiting Low 6 1/2 -
-----------------------------------------------------------------
Total: 7
Recent finished jobs:
ID Type State Time
------------------------------------------------------
1721 SnapshotDelete Succeeded 2016-04-21T11:00:20
1663 MultiScan User Cancelled 2016-04-22T15:35:08
1722 SnapshotDelete Succeeded 2016-04-22T17:25:29
1723 WormQueue Succeeded 2016-04-22T17:25:55
------------------------------------------------------
Total: 4
解決方法
切断されたノードの論理ノード番号(LNN)を確認します。ノードLNNは、ノードIDと常に一致するとは限りません。
# isi_nodes %{id} %{node} %{lnn} %{address}
Example output:
lifs010-2# isi_nodes %{id} %{node} %{lnn} %{address}
1 lifs010-1 1 192.168.41.101
2 lifs010-2 2 192.168.41.102
3 lifs010-3 3 192.168.41.103
4 lifs010-4 4 192.168.41.104
5 lifs010-5 5 192.168.41.105
6 lifs010-6 6 192.168.41.106
7 lifs010-7 7 192.168.41.107
8 lifs010-8 8 192.168.41.108
9 lifs010-9 9 192.168.41.109
10 lifs010-10 10 192.168.41.110
11 lifs010-11 11 192.168.41.111
12 lifs010-13 12 192.168.41.112
すべてのノードでisi_mcpプロセスが実行されているかどうかを確認します。
# isi_for_array -s ps auxw | grep mcp | grep -v grep
出力例: (ノード8がリストされていないことを確認します)
lifs010-2# isi_for_array -s ps auxw | grep mcp | grep -v grep lifs010-1: root 1690 0.0 0.1 48708 18248 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-1: root 1692 0.0 0.1 59968 18212 - Is Sat09 0:00.40 isi_mcp: forker (isi_mcp) lifs010-1: root 1910 0.0 0.3 101728 31272 - Ss Sat09 44:23.35 isi_mcp: master (isi_mcp) lifs010-2: root 1751 0.0 0.1 53060 18228 - Is 12Jun25 0:00.11 isi_mcp: failsafe (isi_mcp) lifs010-2: root 1816 0.0 0.1 72896 18160 - Is 12Jun25 0:00.58 isi_mcp: forker (isi_mcp) lifs010-2: root 1901 0.0 0.3 86140 31368 - Ss 12Jun25 148:00.09 isi_mcp: master (isi_mcp) lifs010-3: root 1681 0.0 0.1 78532 18228 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-3: root 1683 0.0 0.1 55616 18172 - Is Sat09 0:05.67 isi_mcp: forker (isi_mcp) lifs010-3: root 1678 0.0 0.3 104324 31652 - Ss Sat09 46:12.73 isi_mcp: master (isi_mcp) lifs010-4: root 1691 0.0 0.1 48708 18248 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-4: root 1643 0.0 0.1 59968 18212 - Is Sat09 0:00.40 isi_mcp: forker (isi_mcp) lifs010-4: root 1312 0.0 0.3 101728 31272 - Ss Sat09 44:23.35 isi_mcp: master (isi_mcp) lifs010-5: root 1755 0.0 0.1 53060 18228 - Is 12Jun25 0:00.12 isi_mcp: failsafe (isi_mcp) lifs010-5: root 1256 0.0 0.1 72896 18160 - Is 12Jun25 0:00.58 isi_mcp: forker (isi_mcp) lifs010-5: root 1967 0.0 0.3 86140 31368 - Ss 12Jun25 148:00.09 isi_mcp: master (isi_mcp) lifs010-6: root 3456 0.0 0.1 78532 18228 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-6: root 2754 0.0 0.1 55616 18172 - Is Sat09 0:05.67 isi_mcp: forker (isi_mcp) lifs010-6: root 1923 0.0 0.3 104324 31652 - Ss Sat09 46:12.73 isi_mcp: master (isi_mcp) lifs010-7: root 1888 0.0 0.1 48708 18248 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-7: root 3654 0.0 0.1 59968 18212 - Is Sat09 0:00.40 isi_mcp: forker (isi_mcp) lifs010-7: root 1236 0.0 0.3 101728 31272 - Ss Sat09 44:23.35 isi_mcp: master (isi_mcp) lifs010-9: root 1030 0.0 0.1 78532 18228 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-9: root 1601 0.0 0.1 55616 18172 - Is Sat09 0:05.67 isi_mcp: forker (isi_mcp) lifs010-9: root 1922 0.0 0.3 104324 31652 - Ss Sat09 46:12.73 isi_mcp: master (isi_mcp) lifs010-10: root 1599 0.0 0.1 48708 18248 - Is Sat09 0:00.01 isi_mcp: failsafe (isi_mcp) lifs010-10: root 1633 0.0 0.1 59968 18212 - Is Sat09 0:00.40 isi_mcp: forker (isi_mcp) lifs010-10: root 1933 0.0 0.3 101728 31272 - Ss Sat09 44:23.35 isi_mcp: master (isi_mcp)
isi_mcpが実行されていないノードでisi_mcpを開始します。
# isi_for_array -n 8 isi_mcp
スケジュールされたジョブの状態を確認します。
# isi job status --verbose The job engine is running. Coordinator: 2 Connected: True Disconnected Nodes: - Down or Read-Only Nodes: False Statistics Ready: True Cluster Is Degraded: False Run Jobs When Degraded: False Running and queued jobs: ID Type State Impact Pri Phase Running Time ----------------------------------------------------------------- 1500 AutoBalanceLin Running Low 4 1/3 38d 21h 51m 1662 ShadowStoreProtect Waiting Low 6 1/1 - 1712 Collect Waiting Low 5 1/2 2d 6h 46m 1724 SnapshotDelete Running Low 2 1/2 3s 1725 WormQueue Waiting Low 6 1/1 - 1726 ShadowStoreDelete Running Low 2 1/1 2s 1727 QuotaScan Waiting Low 6 1/2 - ----------------------------------------------------------------- Total: 7
この問題は、ノードが分割、オフライン、パニック、読み取り専用、応答しない場合にも発生する可能性があり、その結果ノードはジョブ エンジン コーディネーターから切断されているように見えます。ノードを正常な状態に戻すには、さらにトラブルシューティングが必要になる場合があります。サポートが必要な場合は、 Dellテクニカル サポートにお問い合わせください。
対象製品
Isilon文書のプロパティ
文書番号: 000017115
文書の種類: Solution
最終更新: 10 9月 2025
バージョン: 5
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。