VxFlex:SDSノードの再起動後に、一部のCloudlinkで暗号化されたSDSデバイスがエラーとマークされる
Summary: VxFlex:SDSノードの再起動後に、一部のCloudlinkで暗号化されたSDSデバイスがエラーとマークされる
Symptoms
SDSの再起動後も、CloudLinkで暗号化された一部のデバイスは機能し続けますが、残りはエラーとしてマークされます。
再起動したSDSで「エラー」状態とマークされた複数のSDSデバイス。これにより、容量が減少し、再構築時間が長くなる可能性があります。
SDS trc の場合:
21/06 13:09:34.917236 0x7fed52ebbeb0:mosAsyncIO_OpenFileEx:00376: WARNING: Failed to open IO file /dev/mapper/svm_sdg with rc 3 21/06 13:09:34.917238 0x7fed52ebbeb0:file_OpenEx:00707: Open error /dev/mapper/svm_sdg, NOT_FOUND 21/06 13:09:34.917241 0x7fed52ebbeb0:phyDev_ReadDevId:02649: failed to open file: path=/dev/mapper/svm_sdg, NOT_FOUND
SDSの cfg/partitions ファイルには、mapper/svm_sdのプレフィックスが付いたSDSデバイスのエントリーが1つ以上含まれ、プレフィックスのないエントリーが1つ以上含まれています
次の例は、両方のタイプのエントリを示しています。
8 96 1875374424 mapper/svm_sdg 8 112 1875374424 sdh The device errors can be cleared after the affected SDS has been restarted.
症状は似ていますが、使用中のScaleIOバージョンが2.0.1.3より高く、KB 000158993は適用されません。
Cause
CloudLinkでディスク チェックに問題があり、SDSを開始する前に一部のデバイスのみがロック解除されます。SDSが起動すると、 /dev/mapper/svm_sd* アンロックされていないディスクのデバイス ファイルはまだ作成されていないため、SDSデバイス エラーが報告されます。
Resolution
この問題は、Cloud Link 6.8で修正されています。サポート マトリックスを参照して、環境が引き続きサポートされていることを確認してください。
この問題からリカバリーするには、SDSサービスを手動で再起動し、影響を受けるSDSデバイス エラーをクリアします。
この問題が発生しないようにするには、CloudLinkがすべてのディスクのロックを解除した後にSDSを開始します。
- ノードをシャットダウンする前に、「/opt/emc/scaleio/sds/bin/delete_service.sh」を実行します。再起動後、SDSデバイスとして使用されているすべてのディスクがロック解除されるまで待ってから(「SVM status」またはCloudLink Control Centerが表示されます)、「/opt/emc/scaleio/sds/bin/create_service.sh」を実行します。又は
- 「/opt/emc/extra/pre_run.sh」を編集し、最後の行の上に「sleep 30」を挿入します(問題が引き続き発生する場合、つまり、SDSプロセスの開始時にすべてのデバイスがロック解除されない場合は、この数値を30大きく調整することを検討してください)。
... sleep 30 echo pre_run returned...$(date) >> /var/log/svm-sds
Additional Information
メモ: 上記のスリープ回避策は、アップグレード(この問題に対する永続的な修正がまだ含まれていないため、6.7に)に含まれていないため、再度適用する必要がある場合があります。
これはScaleIOソフトウェアの問題ではありません。この問題は、Cloud Link 6.6および6.7で発生し、Cloud Link 6.8で修正されています。
追跡のために、すべてのバージョンで「#CCTFY25Q4」をキーワードとして保持してください。