Isilon OneFS 8.2 - 再ストライピング ジョブによってノードがパニック状態になることがある(000534903)

モデレーター
モデレーター

Isilon OneFS 8.2 - 再ストライピング ジョブによってノードがパニック状態になることがある(000534903)

ナレッジベース記事:000534903 Isilon OneFS 8.2 - 再ストライピング ジョブによってノードがパニック状態になることがある(000534903)

プライマリ製品:Isilon OneFS 8.2

製品:Isilon OneFS 8.2、Isilon OneFS

バージョン:8
記事タイプ:不具合修正
対象読者:レベル30 = お客様
最終発行日:2019年7月17日水曜日10:09:24(GMT)

サマリー:
データの移動またはMediaScanに関連するジョブは、
SATAからSSDにデータを移動することがあり、inodeのサイズを変更する操作を含みますが、
ソフトウェアの問題が発生し、ノードがパニック状態になります。

問題:
以前にOneFS 7.xバージョンを実行し、現在はOneFS 8.2.0(ビルド009)を実行しているクラスターでは、クラスターにアクセスできなくなり、ノードがパニック状態になるシナリオが発生することがあります。 OneFS 8.0.xまたは8.1.xから8.2.0に最近アップグレードされたクラスターでは、過去にバージョン 7.xのOneFSを実行した場合、依然として問題が発生する可能性があります。
• OneFS 8.2.0(ビルド009)では、FlexProtect、Autobalance、SmartPools、MediaScanなどの再ストライピングを行うすべてのジョブが実行され、ノードのパニックが発生する可能性が高くなり、クライアントはクラスターにアクセスできなくなります。トリガー条件:
• クラスターは、現在OneFS 8.2.0(ビルド009)を実行しています。
• 過去のある時点で、クラスターはOneFS 7.xを実行していました。
• 再ストライピング ジョブを実行して、inodeを8Kから512バイトに移動します。
• メタデータは512バイトを超えており、拡張ブロックにスピルオーバーが必要です。
• 実行中のジョブがない場合でもパニックが発生する可能性がありますが、その可能性は低くなります。
• ノード パニックを即座にマウントしようとすると、1つまたは複数のノードでループが発生することがあります。
• 特にクォーラムが失われた場合、クラスターの操作で重大な影響が発生する可能性があります。
• 再ストライピング操作が行われると、8.2.0へのアップグレード中またはその後に問題が発生する可能性があります。
• アップグレードがコミットされる前に発生する可能性があります
• 次のスタックが見つかります。
Stack: --------------------------------------------------
kernel:isi_assert_halt+0x2e
kernel:ifm_get_sbt_key_size+0x66
kernel:sbt_get_txn_params+0x10
kernel:ibt_op_start_txn+0x3c
kernel:sbt_op_apply_mods+0x69
kernel:ifm_end_operation+0x9de
kernel:txn_i_end+0x5b8
kernel:bam_restripe_inodes+0xcb8
kernel:_pctl2_start_restripe+0x88f
kernel:_sys_pctl2_start_restripe+0x39f
kernel:amd64_syscall+0x483
--------------------------------------------------
*** FAILED ASSERTION flags.u.bits.sf_type == SF_SBT @ /b/mnt/src/sys/ifs/ifm/ifm_dinode.c:5215:

原因:
次の要素を含むジョブ操作:
1. inodeを8Kから512バイトにサイズ変更します。
2. 7.x属性を含むinode(8.2.0は廃止されています)。 これは、7.xで使用されたのではなく、作成された古い形式(廃止)の属性であることを意味します
3. inodeは512バイトを超えて拡張され、拡張ブロックに送られます。
ジョブは、古い形式のinode属性を削除します。 これは、サイズ変更中に属性を削除しようとしたときに発生します。 再ストライピング中に、inodeサイズが512より大きい場合は、残りのメタデータが拡張ブロックに送られ、ここで問題が発生します。 古い属性が誤って削除されると、inodeに正しいタイプのフラグがないため、このinodeでの操作でパニックが発生する可能性があります。

解決策:
回避策:
1. これをトリガーするジョブを無効化することで、再ストライピングを回避します。FlexProtect、FlexProtectLin、Autobalance、AutoBalanceLin、SmartPools、MultiScan、MediaScan
2. クラスターがすべて512バイトのinodeである場合を除き、すべてのディスク プールで8kのinodeを強制的に実行し、サイズが小さくなるのを防ぎます。 クラスター上のすべてのinodeがすでに512バイトである場合は、そのままにします。
ソリューション: 6月21日にリリースされ、こちらで入手可能な8.2.0の新しいビルド(ビルド011)にアップグレードしてください。 問題がある現在のビルド リリース:B_8_2_0_0_009

プライマリ製品:
Isilon OneFS 8.2

製品:
Isilon OneFS 8.2、Isilon OneFS

添付
バージョン履歴
改訂番号
1/1
最終更新:
‎11-20-2019 12:29 PM
更新者:
 
寄稿者: