状態がWaitingのすべてのスケジュール済みジョブ

概要: ジョブは実行中ではありません。スケジュールされたジョブはすべてWaiting状態です。

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

現象

実行中のジョブはありません。ジョブ ステータスには、すべてのジョブがWaiting状態であることを示します。
 

lifs010-13# isi job jobs list
ID   Type               State   Impact  Pri  Phase  Running Time
-----------------------------------------------------------------
1500 AutoBalanceLin     Waiting Low     4    1/3    38d 21h 51m
1662 ShadowStoreProtect Waiting Low     6    1/1    -
1712 Collect            Waiting Low     5    1/2    2d 6h 46m
1724 SnapshotDelete     Waiting Low     2    1/2    -
1725 WormQueue          Waiting Low     6    1/1    -
1726 ShadowStoreDelete  Waiting Low     2    1/1    -
1727 QuotaScan          Waiting Low     6    1/2    -
-----------------------------------------------------------------
Total: 7

原因

これは、ノードの1つがジョブ エンジン コーディネーターから切断された場合に発生する可能性があります。

lifs010-102# isi job status --verbose
The job engine may temporarily delay running jobs.
            Coordinator: 10
              Connected: False
     Disconnected Nodes: 8
Down or Read-Only Nodes: False
       Statistics Ready: True
    Cluster Is Degraded: False
 Run Jobs When Degraded: False
 
Running and queued jobs:
ID   Type               State   Impact  Pri  Phase  Running Time
-----------------------------------------------------------------
1500 AutoBalanceLin     Waiting Low     4    1/3    38d 21h 51m
1662 ShadowStoreProtect Waiting Low     6    1/1    -
1712 Collect            Waiting Low     5    1/2    2d 6h 46m
1724 SnapshotDelete     Waiting Low     2    1/2    -
1725 WormQueue          Waiting Low     6    1/1    -
1726 ShadowStoreDelete  Waiting Low     2    1/1    -
1727 QuotaScan          Waiting Low     6    1/2    -
-----------------------------------------------------------------
Total: 7
 
Recent finished jobs:
ID   Type           State          Time
------------------------------------------------------
1721 SnapshotDelete Succeeded      2016-04-21T11:00:20
1663 MultiScan      User Cancelled 2016-04-22T15:35:08
1722 SnapshotDelete Succeeded      2016-04-22T17:25:29
1723 WormQueue      Succeeded      2016-04-22T17:25:55
------------------------------------------------------
Total: 4

 

解決方法

切断されたノードの論理ノード番号(LNN)を確認します。ノードLNNは、ノードIDと常に一致するとは限りません。

# isi_nodes %{id} %{node} %{lnn} %{address}


Example output: 

lifs010-2# isi_nodes %{id} %{node} %{lnn} %{address}
1 lifs010-1 1 192.168.41.101
2 lifs010-2 2 192.168.41.102
3 lifs010-3 3 192.168.41.103
4 lifs010-4 4 192.168.41.104
5 lifs010-5 5 192.168.41.105
6 lifs010-6 6 192.168.41.106
7 lifs010-7 7 192.168.41.107
8 lifs010-8 8 192.168.41.108
9 lifs010-9 9 192.168.41.109
10 lifs010-10 10 192.168.41.110
11 lifs010-11 11 192.168.41.111
12 lifs010-13 12 192.168.41.112

 

すべてのノードでisi_mcpプロセスが実行されているかどうかを確認します。

# isi_for_array -s ps auxw | grep mcp | grep -v grep


出力例: (ノード8がリストされていないことを確認します)

lifs010-2# isi_for_array -s ps auxw | grep mcp | grep -v grep
lifs010-1: root    1690   0.0  0.1  48708  18248  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-1: root    1692   0.0  0.1  59968  18212  -  Is   Sat09       0:00.40 isi_mcp: forker (isi_mcp)
lifs010-1: root    1910   0.0  0.3 101728  31272  -  Ss   Sat09      44:23.35 isi_mcp: master (isi_mcp)
lifs010-2: root    1751   0.0  0.1  53060  18228  -  Is   12Jun25      0:00.11 isi_mcp: failsafe (isi_mcp)
lifs010-2: root    1816   0.0  0.1  72896  18160  -  Is   12Jun25      0:00.58 isi_mcp: forker (isi_mcp)
lifs010-2: root    1901   0.0  0.3  86140  31368  -  Ss   12Jun25    148:00.09 isi_mcp: master (isi_mcp)
lifs010-3: root    1681   0.0  0.1  78532  18228  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-3: root    1683   0.0  0.1  55616  18172  -  Is   Sat09       0:05.67 isi_mcp: forker (isi_mcp)
lifs010-3: root    1678   0.0  0.3 104324  31652  -  Ss   Sat09      46:12.73 isi_mcp: master (isi_mcp)
lifs010-4: root    1691   0.0  0.1  48708  18248  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-4: root    1643   0.0  0.1  59968  18212  -  Is   Sat09       0:00.40 isi_mcp: forker (isi_mcp)
lifs010-4: root    1312   0.0  0.3 101728  31272  -  Ss   Sat09      44:23.35 isi_mcp: master (isi_mcp)
lifs010-5: root    1755   0.0  0.1  53060  18228  -  Is   12Jun25      0:00.12 isi_mcp: failsafe (isi_mcp)
lifs010-5: root    1256   0.0  0.1  72896  18160  -  Is   12Jun25      0:00.58 isi_mcp: forker (isi_mcp)
lifs010-5: root    1967   0.0  0.3  86140  31368  -  Ss   12Jun25    148:00.09 isi_mcp: master (isi_mcp)
lifs010-6: root    3456   0.0  0.1  78532  18228  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-6: root    2754   0.0  0.1  55616  18172  -  Is   Sat09       0:05.67 isi_mcp: forker (isi_mcp)
lifs010-6: root    1923   0.0  0.3 104324  31652  -  Ss   Sat09      46:12.73 isi_mcp: master (isi_mcp)
lifs010-7: root    1888   0.0  0.1  48708  18248  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-7: root    3654   0.0  0.1  59968  18212  -  Is   Sat09       0:00.40 isi_mcp: forker (isi_mcp)
lifs010-7: root    1236   0.0  0.3 101728  31272  -  Ss   Sat09      44:23.35 isi_mcp: master (isi_mcp)
lifs010-9: root    1030   0.0  0.1  78532  18228  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-9: root    1601   0.0  0.1  55616  18172  -  Is   Sat09       0:05.67 isi_mcp: forker (isi_mcp)
lifs010-9: root    1922   0.0  0.3 104324  31652  -  Ss   Sat09      46:12.73 isi_mcp: master (isi_mcp)
lifs010-10: root    1599   0.0  0.1  48708  18248  -  Is   Sat09       0:00.01 isi_mcp: failsafe (isi_mcp)
lifs010-10: root    1633   0.0  0.1  59968  18212  -  Is   Sat09       0:00.40 isi_mcp: forker (isi_mcp)
lifs010-10: root    1933   0.0  0.3 101728  31272  -  Ss   Sat09      44:23.35 isi_mcp: master (isi_mcp)

 

isi_mcpが実行されていないノードでisi_mcpを開始します。

# isi_for_array -n 8 isi_mcp

 

スケジュールされたジョブの状態を確認します。

# isi job status --verbose
The job engine is running.
            Coordinator: 2
              Connected: True
     Disconnected Nodes: -
Down or Read-Only Nodes: False
       Statistics Ready: True
    Cluster Is Degraded: False
 Run Jobs When Degraded: False
 
Running and queued jobs:
ID   Type               State   Impact  Pri  Phase  Running Time
-----------------------------------------------------------------
1500 AutoBalanceLin     Running Low     4    1/3    38d 21h 51m
1662 ShadowStoreProtect Waiting Low     6    1/1    -
1712 Collect            Waiting Low     5    1/2    2d 6h 46m
1724 SnapshotDelete     Running Low     2    1/2    3s
1725 WormQueue          Waiting Low     6    1/1    -
1726 ShadowStoreDelete  Running Low     2    1/1    2s
1727 QuotaScan          Waiting Low     6    1/2    -
-----------------------------------------------------------------
Total: 7


この問題は、ノードが分割、オフライン、パニック、読み取り専用、応答しない場合にも発生する可能性があり、その結果ノードはジョブ エンジン コーディネーターから切断されているように見えます。ノードを正常な状態に戻すには、さらにトラブルシューティングが必要になる場合があります。サポートが必要な場合は、 Dellテクニカル サポートにお問い合わせください。

対象製品

Isilon
文書のプロパティ
文書番号: 000017115
文書の種類: Solution
最終更新: 10 9月 2025
バージョン:  5
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。