Problema de rendimiento de PowerFlex 3.x con posibles errores de I/O durante la reconstrucción hacia atrás

Resumen: Es posible que se informen errores de I/O durante eventos de reconstrucción hacia atrás. En casos graves, los volúmenes pueden pasar a ser de solo lectura y causar falta de disponibilidad de datos. Durante una reconstrucción hacia atrás, se intercambian las funciones de peine (primaria/secundaria). Una reconstrucción hacia atrás puede ocurrir cuando un SDS se quita 1) del modo de mantenimiento o 2) cuando un SDS deja de funcionar y vuelve rápidamente. ...

Este artículo se aplica a Este artículo no se aplica a Este artículo no está vinculado a ningún producto específico. No se identifican todas las versiones del producto en este artículo.

Síntomas

Escenario
El MDM envía muchos comandos de control a un SDS durante una reconstrucción, pero el SDS no puede procesarlos rápidamente.

Síntomas
En las siguientes entradas, el MDM intenta realizar un cambio de función de peine, pero el SDS tardó 30 segundos en completar la operación. Este retraso de 30 segundos fue suficiente para que el volumen pasara a ser de solo lectura en este ejemplo.

15/06 04:18:18.362502 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:23.364575 0x7f3cc5904db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:28.370493 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:33.379554 0x7f3cc5928db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:38.380498 0x7f3cc5955db0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE
15/06 04:18:43.380564 0x7f3cc590ddb0:multiHeadMgr_HandleNetRPCResponse:02653: TgtId: 5ce02d7e00000003 RC: TIMEOUT CombID: 71e0000480e3 msgType: TGT_MSG_TYPE__SET_COMB_STATE 
(...)
15/06 04:18:43.380573 0x7f3cc590ddb0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ff7fb6fc00030006 CombId: 71e0000480e3 CombState: PRI->SEC RaidState: 0x1->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 9 MH: 71746 Connection: 1357
15/06 04:18:46.920989 0x7f3cc5943db0:mdmTgtMsg_SendAsyncSetCombState:06228: devId: ffd7690d00070009 CombId: 71e0000480e3 CombState: SEC->PRI RaidState: 0x21->0x1 ProtType: SECONDARY Switch roles (subtask) GenNums: Primary: 71707 Cmd: 11 MH: 71758 Connection: 1353
15/06 04:18:46.921312 0x7f3cc5955db0:multiHeadRow_MoveState_Inner:03054: [multiHead_HandleNormStateFlow:1359]: MultiHead: e3c00009 Row: 227  NORMAL->NORMAL (NORM2NORM_ROLE_BALANCE) 

Para comprobar esta condición (las columnas 2 y 3 deben ser las mismas y configuradas en 100):

scli --query_performance_parameters --all_sds --print_all | grep SDS_NUMBER_SDS_CONTROL_UMT
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                   10               100 

Esto también se informará en el resultado de query_all de la siguiente manera:

grep CONTROL_UMT query_all.txt
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100
        SDS_NUMBER_SDS_CONTROL_UMT                                    10               100

 

Impacto

 Es posible que se informen errores de I/O y que los volúmenes pasen a ser de solo lectura en casos graves.

Causa

El SDS no puede procesar la gran cantidad de comandos de control porque SDS_NUMBER_SDS_CONTROL_UMT solo está establecido en 10. Esto puede suceder cuando el perfil de rendimiento del SDS se establece en Compacto o cuando se establece en Alto rendimiento, pero el sistema se actualizó de PowerFlex 2.x a 3.x.

El perfil de high_performance establece SDS_NUMBER_SDS_CONTROL_UMT en 100; Sin embargo, esto se puede cambiar incorrectamente a 10 cuando se actualiza desde cualquier versión 2.x a cualquier versión 3.x anterior a 3.0.1.5/3.5.1.3.

10 es la configuración esperada para SDS_NUMBER_SDS_CONTROL_UMT cuando se establece el perfil de rendimiento compacto (en la versión 3.x, el perfil high_performance es el predeterminado).

 

Resolución

Si utiliza un perfil de SDS high_performance, ejecute el siguiente comando para corregir este problema:

scli --set_performance_parameters --tech --all_sds --sds_number_sds_control_umt 100 

Si utiliza un perfil SDS compacto, cambie a high_performance.

Versiones
afectadasTodas las versiones de 3.x anteriores a 3.0.1.5 y 3.5.1.3

Solucionado en la versión
3.0.1.5 y 3.5.1.3

Productos afectados

PowerFlex Software
Propiedades del artículo
Número del artículo: 000195572
Tipo de artículo: Solution
Última modificación: 13 may. 2026
Versión:  5
Encuentre respuestas a sus preguntas de otros usuarios de Dell
Servicios de soporte
Compruebe si el dispositivo está cubierto por los servicios de soporte.