Isilon da 6ª geração: Os clusters de 6ª geração mostram o evento "HW_INFINITY_I2C_FAULT", mas os nós estão em execução - ID do evento: 900160007, 900160014

Summary: Os clusters de 6ª geração às vezes podem mostrar o evento "HW_INFINITY_I2C_FAULT" para vários nós, mesmo que todos os nós estejam em execução. O evento geralmente é cancelado após alguns minutos, mas pode voltar a ocorrer. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Os clusters de 6ª geração às vezes podem mostrar o evento crítico "HW_INFINITY_I2C_FAULT" para vários nós, mesmo que todos os nós estejam em execução. O evento geralmente é cancelado após alguns minutos, mas pode voltar a ocorrer. O evento sugere que ocorreu um erro de comunicação I2C, mas isso não indica necessariamente que ocorreu uma falha de hardware. Além do evento em si, não devem ocorrer efeitos adversos no nó ou cluster. Considerando que essas comunicações I2C geralmente ocorrem entre dois nós, é comum ver esse evento em mais de um nó em um chassi.

Cause

Foi identificado um problema com o firmware enviado do componente BMC em determinados nós de 6ª geração que parece estar causando muitas dessas mensagens de erro. Uma solução parcial para o problema foi incluída na versão 23.90 do firmware do BMC de 6ª geração, que foi lançada no pacote do firmware do nó 10.2.1. A engenharia está investigando outras melhorias para atenuar esse problema. Esse problema não é impactante. Os barramentos I2C redundantes do nó devem garantir que a comunicação necessária do sistema continue normalmente.

Resolution

Uma solução parcial para o problema foi incluída na versão 23.90 do firmware do BMC de 6ª geração, que foi lançada no pacote do firmware do nó 10.2.1. Em muitos clusters, ela resolve totalmente esses alertas. Esse pacote de firmware de nó também contém correções de vários outros problemas específicos da 6ª geração. Também foram feitas melhorias para evitar que esse evento seja gerado no nível de evento crítico desnecessariamente, em vez de no nível de aviso, além de melhorias no processo de upgrade do firmware no OneFS 8.1.0.4 e versões posteriores. É recomendável que você faça upgrade do cluster para o OneFS 8.1.0.4 ou posterior e para o pacote de firmware do nó 10.2.1 ou posterior, nessa ordem, durante a próxima janela de manutenção agendada ou na primeira oportunidade. Se o upgrade do OneFS não for uma opção no momento, o upgrade direto para o pacote de firmware do nó 10.2.1 ou posterior deverá resolver a maioria das instâncias dessa mensagem de erro falsa.

Nota: O upgrade do firmware do nó e/ou do OneFS exigirá que cada nó seja reinicializado no final do ciclo de upgrade. Essa é uma parte obrigatória do processo de upgrade e não pode ser evitada.

O pacote de firmware de nó mais recente e o pacote de instalação do OneFS, bem como os respectivos documentos de notas da versão, podem ser baixados do site support.emc.com. As instruções para instalar o pacote de firmware e atualizar o firmware do cluster, bem como as instruções para atualizar o OneFS, podem ser encontradas em seus respectivos documentos de notas da versão.

Affected Products

Isilon

Products

Isilon, Isilon A200, Isilon F800, Isilon Gen6, Isilon H400, Isilon H500, Isilon H600
Article Properties
Article Number: 000050378
Article Type: Solution
Last Modified: 24 Apr 2021
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.