Redefinindo erros oscilantes do PowerFlex

Summary: Etapas para redefinir erros oscilantes do PowerFlex.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Redefinindo erros oscilantes

Erros oscilantes são de natureza cosmética e não causam problemas. Quando os clientes estão realizando upgrades de RCM, implementando um novo serviço ou qualquer coisa que faça a troca de hosts para cima e para baixo com frequência suficiente, o PowerFlex relata isso como um erro oscilante.

Nota: A mensagem de erros oscilantes pode permanecer após a execução dos comandos de redefinição abaixo. O motivo disso é que eles podem ser armazenados em cache no MDM primário atual. Nesse cenário, a etapa final para limpar o alerta exige que o MDM primário seja alternado para o MDM secundário. Esse processo é uma ação intrusiva. Esta etapa de correção deve ser confirmada com o cliente antes de continuar. Consulte o artigo da Dell Servidor de apresentação PowerFlex: Não foi possível apagar os alertas de rede relatados192262 para obter mais informações (é necessário fazer login como um usuário registrado do Suporte Dell para visualizar o artigo).


Os vários contadores de falha de erros oscilantes podem ser zerados. O comando a seguir é útil quando você corrigiu um problema e deseja garantir que um alerta não esteja mais ativo no sistema. Podemos redefinir contadores para todo o sistema, por domínio de proteção ou por pool de armazenamento.
  • SSH para o MDM principal para executar o comando de redefinição abaixo:

Sintaxe

scli --reset_oscillating_failure_counters (--failure_counter (((-- protection_domain_id | --protection_domain_name ) | --all_sds) | --all_sdc | (((----protection_domain_id | -- protection_domain_name) --storage_pool_name ) | --storage_pool_id ) | --all_devices) | --all_counters)

Parâmetros

--failure_counter <COUNTER>


O contador de falhas oscilantes a ser redefinido para zero; Os contadores são agrupados da seguinte maneira:

  • Grupo de contadores A (contadores relacionados a MDM e SDS):
mdm_sds_network_disconnections

sds_sds_network_disconnections

sds_decoupled

sds_configuration_failures

sds_receive_buffer_allocation_failures
  • Grupo do contador B (contadores relacionados ao SDC):
sdc_mdm_network_disconnections

sdc_sds_network_disconnections

sdc_long_operations

sdc_memory_allocation_failures

sdc_socket_allocation_failures
  • Grupo do contador C (contadores relacionados ao dispositivo SDS):
sds_device_long_successful_ios
 
--protection_domain_id <ID>         Protection Domain ID

--protection_domain_name <NAME>   - Protection Domain name

--storage_pool_name <NAME>        - Storage Pool name

--storage_pool_id <ID>            - Storage Pool ID

--all_sds                         - Reset the counter parameters on all SDSs

--all_sdc                         - Reset the counter parameters on all SDCs

--all_devices                     - Reset the counter parameters on all SDS devices

--all_counters                    - Reset all counters to zero


Exemplo (todos os contadores SDC, SDS, MDM):

# scli --log in --username admin –password <MDM Password>

# scli --reset_oscillating_failure_counters --all_counters --all_sdc

# scli --reset_oscillating_failure_counters --all_counters --all_sds

# scli --reset_oscillating_failure_counters --all_counters --all_mdm


Exemplo (contador específico):

# scli --log in --username admin –password <MDM Password>

# scli --reset_oscillating_failure_counters --failure_counter mdm_sds_network_disconnections --all_sds


Informações adicionais - Detalhes específicos do contador:

sds_configuration_failures              - measures the number of MDM's failures to configure an SDS when connecting to an SDS (failures in the reconfiguration phase)
sds_receive_buffer_allocation_failures  - measures the number of times SDS fails to allocate buffer for receiving messages

sdc_mdm_network_disconnections
sdc_sds_network_disconnections
sdc_long_operations                     - measures the number of SDC RPC operations which took more time than a predefined threshold
sdc_memory_allocation_failures          - measures the number of memory allocation failures in each SDC
sdc_socket_allocation_failures          - measures the number of socket allocation failures in each SDC

sds_device_long_successful_ios          - measures the number of successful IOs to an SDS device that took longer than a predefined threshold

O limite padrão é de 250 milissegundos.
 

Affected Products

PowerFlex rack connectivity, PowerFlex rack HW
Article Properties
Article Number: 000213116
Article Type: How To
Last Modified: 21 Jan 2025
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.