Data Domain - Solução de problemas de erros de quadro de rede
Summary: Erros de quadro em uma interface de rede indicam um problema com os pacotes de dados à medida que eles se cruzam entre o dispositivo e a rede.
Symptoms
Este artigo descreve como solucionar problemas de erros de quadro de rede no Data Domain.
eth4c Link encap:Ethernet HWaddr x:C7:AA:x:12:7E
inet addr:x.x.x.7 Bcast:x.x.x.x Mask:255.255.254.0
inet6 addr: fe80::f6c7:aaff:fe58:127e/64 Scope:Link
UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1
RX packets:115362856103 errors:0 dropped:2939814 overruns:10098 frame:79198392
TX packets:29061855128 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:167162598519873 (152.0 TiB) TX bytes:25775705362014 (23.4 TiB)
Interrupt:47 Memory:b4020000-b403ffff Cause
Os erros de enquadramento podem ser provenientes de vários fatores que geralmente indicam possíveis problemas de hardware ou compatibilidade. Algumas causas comuns incluem:
- Problema de compatibilidade entre os dois transceptores, embora isso também possa ser exibido como uma seleção de velocidade mais baixa ao usar a negociação automática.
- Problemas de sincronização, relacionados ao número 1, mas podem ocorrer entre transceptores compatíveis.
- Tipo de cabo incorreto. Por exemplo, usar um cabo InfiniBand em vez de um cabo Ethernet padrão suportado.
- Um cabo defeituoso
- Um conector defeituoso no Data Domain ou no switch.
- O transceptor de hardware no Data Domain ou no switch está com defeito.
- O transceptor de hardware é do tipo errado ou não é compatível.
- Para o cobre, sinais externos podem causar ruído na linha e causar erros de enquadramento.
Resolution
Percorra os oito itens listados acima para ver se algum deles contribui para o problema.
Abra um caso com o suporte do Data Domain para obter mais soluções de problemas se nenhum desses itens resolver esse problema.
Verifique se há erros de quadro no suporte automático anterior e historicamente com elysium.
- Erros de quadro indicam um componente com defeito, como um cabo defeituoso ou transceptores conectáveis de formato pequeno.
- Se houver milhares de erros de quadro e a interface for fibra, pode ser um transceptor defeituoso no lado do DD, um cabo óptico com defeito ou um transceptor defeituoso no lado do switch do cliente.
- O cliente é responsável por substituir os cabos e transceptores na lateral.
- Se a interface estiver intermitente ou inativa e houver erros de quadro, os componentes deverão ser substituídos.
- Os erros de quadro também contribuem para o desempenho lento, já que os pacotes devem ser retransmitidos várias vezes.
- A seção net show configuration do suporte automático mostra o exemplo de estatísticas de interface abaixo com uma interface com muitos erros de quadro.
O comando para listar as estatísticas da interface na CLI é:
# net show config Additional Information
Como os erros de quadro afetam o desempenho do Data Domain
Erros de quadro em uma interface de rede indicam quadros Ethernet corrompidos, geralmente causados por cabeamento inválido, incompatibilidades duplex ou problemas de camada física. Esses erros forçam a pilha de rede a descartar e retransmitir pacotes, o que tem um efeito em cascata no sistema Data Domain:
1. Aumento das retransmissões
- Cada quadro corrompido significa que o remetente deve reenviar dados.
- Para o Data Domain, o tráfego de replicação e backup é intenso e contínuo. As retransmissões multiplicam a carga de trabalho porque:
- Os mesmos segmentos de dados são lidos do disco novamente.
- A lógica de compactação e desduplicação é executada novamente para partes retransmitidas.
2. Maior utilização da CPU e da memória
- O Data Domain usa processos com uso intenso de CPU para:
- Desduplicação (segmentos de impressão digital)
- Compactação
- Criptografia (se ativada)
- Quando os quadros falham e os dados são reenviados, esses processos se repetem desnecessariamente, consumindo ciclos extras de CPU e memória.
3. Tensão do file system
- O file system do DD (DDFS) é otimizado para gravações sequenciais e pesquisas de segmento.
- As retransmissões causam padrões de E/S não sequenciais, forçando o file system a:
- Releia os segmentos.
- Recalcular hashes.
- Mantenha a consistência para gravações parcialmente concluídas.
- Isso leva a buscas de disco extra e pressão de cache, diminuindo o throughput geral.
4. A duração do backup aumenta
- Como o throughput efetivo da rede cai (devido a retransmissões e erros), os backups levam muito mais tempo.
- O sistema DD sente-se tributado porque:
- Ela está fazendo mais trabalho por unidade de dados entregue.
- Paralisações de rede causam ineficiências no pipeline; Os threads aguardam os dados, aumentando a latência.
Ponto-chave
Erros de quadro criam um ciclo vicioso:
- Quadros → retransmissões defeituosos → desduplicação/compactação repetidas → E/S de disco extra → tensão da CPU → backups mais lentos.
Correção recomendada
- Verifique a integridade da rede física:
- Substitua os cabos com defeito.
- Verifique a velocidade ou as configurações duplex da placa de interface de rede (NIC).
- Monitorar erros de porta do switch.
- Certifique-se de que as configurações de MTU correspondam ao longo do caminho.
- Se os erros persistirem, considere problemas de hardware de switch ou NIC.