O Data Domain Cloud Tier com ECS é desconectado porque o ECS encontrou um erro interno ou ficou cheio
Resumo: Há muitos motivos diferentes pelos quais o Data Domain File System informa que o perfil do Cloud Tier foi desconectado, causando a interrupção ou o encerramento dos processos de movimentação de dados, recuperação ou limpeza de nuvem em execução porque a unidade de nuvem entrou no estado UNAVAILABLE. Um deles é o recebimento de um erro interno 500 de servidor do ECS ...
Este artigo aplica-se a
Este artigo não se aplica a
Este artigo não está vinculado a nenhum produto específico.
Nem todas as versões do produto estão identificadas neste artigo.
Sintomas
Há muitos motivos diferentes pelos quais o Data Domain File System informa que o perfil do Cloud Tier foi desconectado, causando a interrupção ou o encerramento dos processos de movimentação de dados, recuperação ou limpeza de nuvem em execução porque a unidade de nuvem entrou no estado UNAVAILABLE.
Um dos motivos para a desconexão da unidade do Cloud Tier é o recebimento de um erro interno do ECS, em que a operação HTTP exibe o código 500.
Quando isso acontecer, receberemos uma mensagem de alerta semelhante a esta:
Hora: Sun Mar 1 00:08:44 2020 Alert Id: m0-3761 Event Id: EVT-CLOUD-00001 Event Message: Unable to access provider for cloud unit XXXX-XXXX-XXX. Object: CloudUnit=XXXX-XXXX-XXXX Additional Information: Cause=We encountered an internal error. Please try again.
Devido a esse erro, o processo de limpeza do Cloud Tier poderá ser encerrado se estiver em andamento:
Cloud Cleaning Status --------------------- Cloud tier cleaning started on cloud unit "XXXX-XXXX-XXXX" at 2020/02/12 15:56:11 and was aborted at 2020/02/14 03:12:56. Cloud tier cleaning was aborted because cloud is unavailable Background deletion completed.
No arquivo de log ddfs.info, podemos ver mensagens de erro semelhantes para o motivo da desconexão da unidade do Cloud Tier:
02/02 10:35:58.067 (tid 0xbf47f70): ERROR: CAL cl_request_convert_httpcode_to_err:1539 - HTTP operation returned code:500, request error:We encountered an internal error. Please try again. [5009] .... 02/02 10:35:58.067 (tid 0x7f6ab4714fd0): INFO: CAL cal_cloudunit_set_unavail:1339 - Marking cloud unit:XXXX-XXXX-XXXX-XXXX as UNAVAILABLE .... 02/02 10:35:58.067 (tid 0x7f77e22e2370): Fmig: fmig2_process_cal_event: XXXX-XXXX-XXXX-XXXX (path=cloud1/cp1): receiving DDR_EVENT_CAL_UNIT_UNAVAIL event .... 02/02 10:35:59.229 (tid 0x7f6ab4714fd0): INFO: Event posted: m0-1361 (21000551:553649489): EVT-CLOUD-00001: Unable to access provider for cloud unit XXXX-XXXX-XXXX-XXXX.EVT-OBJ::CloudUnit=XXXX-XXXX-XXXX-XXXX EVT-INFO::Cause=We encountered an internal error. Please try again. ... 02/02 10:35:58.067 (tid 0x7f6ab4714fd0): INFO: CAL cal_cloudunit_set_unavail:1339 - Marking cloud unit:XXXX-XXXX-XXXX as UNAVAILABLE
O erro interno 500 de servidor é um código de status geral do HTTP que significa que aconteceu algo de errado no servidor.
Os erros 5xx são os códigos de status exibidos pelo servidor quando ele encontra uma condição inesperada que o impediu de atender à solicitação de um client; em nosso caso, o sistema Data Domain.
Essa resposta de erro é uma resposta de erro genérica que precisa ser investigada mais a fundo para entender o motivo por trás dela.
No AutoSupport mais recente, você pode acompanhar o estado das solicitações de nuvem verificando as estatísticas de erro de nuvem do bucket de dados de sua unidade de nuvem:
Cloud error stats for bucket:<name of the bucket>-d0 Number of Retries : 9180 ... Number of http 400 errors : 0 Number of http 403 errors : 0 ... Number of http 416 errors : 0 Number of http 429 errors : 0 Number of http 500 errors : 10195 ----------->lots of 500 errors Number of http 503 errors : 0 ...
Causa
Motivo 1:
Um dos principais motivos para o DD receber essa mensagem de erro é que o ECS ficou completamente cheio, o que faz com que ele recuse as solicitações recebidas da unidade do Data Domain. Para resolver esse problema, libere espaço do ECS para restaurar a conexão do DD com a nuvem do ECS.
Motivo 2:
O ECS está ocupado e, portanto, não consegue atender a todas as solicitações recebidas
Também há outros motivos que podem causar esse erro
Um dos principais motivos para o DD receber essa mensagem de erro é que o ECS ficou completamente cheio, o que faz com que ele recuse as solicitações recebidas da unidade do Data Domain. Para resolver esse problema, libere espaço do ECS para restaurar a conexão do DD com a nuvem do ECS.
Motivo 2:
O ECS está ocupado e, portanto, não consegue atender a todas as solicitações recebidas
Também há outros motivos que podem causar esse erro
Resolução
Solução:
se a nuvem do ECS ficar cheia, o Data Domain continuará recebendo mensagens de erro de desconexão até que o perfil do Cloud Tier tenha espaço livre para que o sistema Data Domain possa restaurar a comunicação.
Solução:
Se a nuvem do ECS estiver ocupada, não se recomenda a execução simultânea dos processos de coleta de lixo, movimentação de dados ou recuperação. Se você receber erros internos 500 do servidor, tente agendar esses processos para execução em horários diferentes para dar espaço para que o ECS Cloud Tier lide com todas as solicitações recebidas. Peça ajuda do suporte do ECS para identificar quaisquer problemas adicionais
se a nuvem do ECS ficar cheia, o Data Domain continuará recebendo mensagens de erro de desconexão até que o perfil do Cloud Tier tenha espaço livre para que o sistema Data Domain possa restaurar a comunicação.
Solução:
Se a nuvem do ECS estiver ocupada, não se recomenda a execução simultânea dos processos de coleta de lixo, movimentação de dados ou recuperação. Se você receber erros internos 500 do servidor, tente agendar esses processos para execução em horários diferentes para dar espaço para que o ECS Cloud Tier lide com todas as solicitações recebidas. Peça ajuda do suporte do ECS para identificar quaisquer problemas adicionais
Mais informações
Se o problema não for resolvido, abra um novo caso de suporte com o suporte do ECS e do Data Domain para que eles façam a triagem desse problema juntos.
Colete e carregue um novo pacote de suporte ao abrir um novo caso de suporte do Data Domain
Colete e carregue um novo pacote de suporte ao abrir um novo caso de suporte do Data Domain
Produtos afetados
Data DomainProdutos
Data Domain, Data Domain Deduplication Storage SystemsPropriedades do artigo
Número do artigo: 000081881
Tipo de artigo: Solution
Último modificado: 11 dez. 2023
Versão: 4
Encontre as respostas de outros usuários da Dell para suas perguntas.
Serviços de suporte
Verifique se o dispositivo está coberto pelos serviços de suporte.