Problème de performances de PowerFlex 3.x avec des erreurs d’E/S potentielles lors de la reconstruction en amont

Résumé: Des erreurs d’E/S peuvent être signalées lors d’événements de reconstruction en amont. Dans les cas graves, les volumes peuvent devenir en lecture seule et entraîner une indisponibilité des données. Lors d’une reconstruction en amont, les rôles de peigne (principal/secondaire) sont inversés. Une reconstruction en amont peut se produire lorsqu’un SDS est 1) retiré du mode maintenance, ou 2) lorsqu’un SDS tombe en panne et revient rapidement. ...

Cet article concerne Cet article ne concerne pas Cet article n’est associé à aucun produit spécifique. Toutes les versions du produit ne sont pas identifiées dans cet article.

Symptômes

Scénario
Le MDM envoie de nombreuses commandes de contrôle à un SDS lors d’une reconstruction, mais le SDS ne peut pas les traiter rapidement.

Symptômes
Dans les entrées suivantes, le MDM tente d’effectuer un commutateur de rôle en peigne, mais le SDS a mis 30 s pour terminer l’opération. Ce délai de 30 secondes était suffisant pour que le volume passe en lecture seule dans cet exemple.

15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 
(...)
15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357
15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353
15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227  NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE) 

Pour vérifier cette condition (les 2e et 3e colonnes doivent être identiques et définies sur 100) :

scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100 

La sortie query_all signalera également le problème comme suit :

grep CONTROL_UMT query_all.txt
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100

 

Impact

 Des erreurs d’E/S peuvent être signalées et les volumes peuvent passer en lecture seule dans les cas graves.

Cause

Le SDS ne peut pas traiter le nombre élevé de commandes de contrôle car SDS_NUMBER_SDS_CONTROL_UMT est uniquement défini sur 10. Cela peut se produire lorsque le profil de performances SDS est défini sur Compact ou lorsqu’il est défini sur High Performance, mais que le système a été mis à niveau de PowerFlex 2.x vers 3.x.

Le profil high_performance définit SDS_NUMBER_SDS_CONTROL_UMT à 100 ; Toutefois, il se peut qu’il soit défini par erreur sur 10 lors de la mise à niveau de n’importe quelle version 2.x vers n’importe quelle version 3.x antérieure à 3.0.1.5/3.5.1.3.

10 est le paramètre attendu pour SDS_NUMBER_SDS_CONTROL_UMT lorsque le profil de performances compact est défini (dans la version 3.x, le profil high_performance est la valeur par défaut).

 

Résolution

Si vous utilisez un profil SDS high_performance, exécutez la commande suivante pour corriger ce problème :

scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100 

Si vous utilisez un profil SDS compact, passez à high_performance.

Versions
concernéesToutes les versions de 3.x antérieures à 3.0.1.5 et 3.5.1.3

Problème résolu dans la version
3.0.1.5 et 3.5.1.3

Produits concernés

PowerFlex Software
Propriétés de l’article
Numéro d’article: 000195572
Type d’article: Solution
Dernière modification: 13 mai 2026
Version:  5
Trouvez des réponses à vos questions auprès d’autres utilisateurs Dell
Services de support
Vérifiez si votre appareil est couvert par les services de support.