PowerFlex 3.x prestatieprobleem met mogelijke I/O-fouten tijdens achterwaartse rebuild
Samenvatting: I/O-fouten kunnen worden gemeld tijdens achterwaartse rebuild-gebeurtenissen. In ernstige gevallen kunnen volumes alleen-lezen worden en data niet beschikbaar zijn. Tijdens een achterwaartse rebuild worden de kamrollen (primair/secundair) verwisseld. Een achterwaartse rebuild kan optreden wanneer een SDS 1) uit de onderhoudsmodus wordt verwijderd of 2) wanneer een SDS uitvalt en direct weer terugkomt. ...
Symptomen
Scenario
De MDM stuurt tijdens een rebuild veel besturingsopdrachten naar een SDS, maar de SDS kan deze niet onmiddellijk verwerken.
Symptomen
In de volgende vermeldingen probeert de MDM een kamrolwisseling uit te voeren, maar het duurde 30 seconden voordat de SDS de bewerking had voltooid. Deze vertraging van 30 seconden was voldoende om het volume in dit voorbeeld alleen-lezen te maken.
15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE (...) 15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357 15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353 15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227 NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE)
U kunt als volgt controleren op deze voorwaarde (de 2e en 3e kolom moeten hetzelfde zijn en zijn ingesteld op 100):
scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
Dit wordt ook als volgt gerapporteerd in de query_all-uitvoer:
grep CONTROL_UMT query_all.txt
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
SDS_NUMBER_SDS_CONTROL_UMT 10 100
Impact
I/O-fouten kunnen worden gemeld en volumes kunnen in ernstige gevallen alleen-lezen worden.
Oorzaak
De SDS kan het grote aantal besturingsopdrachten niet verwerken omdat SDS_NUMBER_SDS_CONTROL_UMT alleen op 10 is ingesteld. Dit kan gebeuren wanneer het SDS-prestatieprofiel is ingesteld op Compact of wanneer het is ingesteld op High Performance, maar het systeem is geüpgraded van PowerFlex 2.x naar 3.x.
Het high_performance profiel stelt SDS_NUMBER_SDS_CONTROL_UMT in op 100; Dit kan echter ten onrechte worden gewijzigd in 10 bij het upgraden van een 2.x-versie naar een 3.x-versie lager dan 3.0.1.5/3.5.1.3.
10 is de verwachte instelling voor SDS_NUMBER_SDS_CONTROL_UMT wanneer het compacte prestatieprofiel is ingesteld (in versie 3.x is het high_performance profiel de standaardinstelling).
Oplossing
Als u een high_performance SDS-profiel gebruikt, voert u de volgende opdracht uit om dit probleem op te lossen:
scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100
Als u een compact SDS-profiel gebruikt, wijzigt u in high_performance.
Versies
waarop dit van toepassing isAlle versies van 3.x lager dan 3.0.1.5 en 3.5.1.3
Opgelost in versie
3.0.1.5 en 3.5.1.3