Isilon: O par de nós par de DE Gen6 (H400, A200, A2000) gera eventos e mensagens de console indicando problemas com o link NTB após uma substituição ou movimentação do módulo de computação

Zusammenfassung: Um par de nós par de DE Gen6 (H400, A200, A2000) às vezes pode começar a gerar mensagens de erro indicando problemas com seu link NTB. Os erros podem incluir mensagens repetidas "NTB link up/down" e erros de negociação de velocidade de link. ...

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Um par de nós par gen6 DE (H400, A200, A2000) às vezes pode começar a gerar mensagens de erro indicando problemas com seu link NTB. Os erros podem incluir mensagens repetidas de "link ativo/inativo", bem como erros de negociação de velocidade de link, por exemplo:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


Como alternativa, os registros e/ou o console podem simplesmente mostrar o link NTB como inativo e não aparecer. Atualmente, parece haver várias causas possíveis para esse problema, algumas das quais ainda estão sendo investigadas. Se um ou ambos os nós afetados tiverem sido movidos recentemente para um slot de chassi diferente ou tiverem seu módulo de computação substituído, o problema e a resolução documentados neste artigo da KB poderão ser aplicados. Esse problema não afeta os nós EP (F800, H600, H500).  

Ursache

Os nós de mesmo nível se comunicam entre si por meio de um canal de comunicação especial chamado NTB (NonTransparent Bridge) incorporado ao backplane do chassi. Em operação normal, os dois nós em um par de pares devem ter um valor PPD diferente para poder se comunicar uns com os outros por meio do NTB. Os valores de PPD são atribuídos com base no ID do slot do nó no chassi. Esse problema é causado pelo BIOS do nó que retém o ID do slot antigo do nó quando um nó ou módulo de computação é trocado em um slot diferente do original, em vez de detectar o novo ID de slot. Isso pode fazer com que o valor do PPD seja definido incorretamente, o que causa um conflito que impede que os nós estabeleciem um link NTB.

Lösung

Execute o seguinte comando emambos os nós do par de pares afetados para verificar se o problema documentado neste KB é aplicável:
# sysctl dev.ntb_hw.0.debug_info.ppd

Cada nó responderá com:

dev.ntb_hw.0.debug_info.ppd:
73

Ou:
dev.ntb_hw.0.debug_info.ppd: 93

- Se um nó em um par responder com 73 e o outro responder com 93, esses nós não serão afetados atualmente pelo problema documentado neste artigo da KB.
Entre em contato com o suporte técnico do EMC Isilon para obter mais assistência.

- Se ambos os nós responderem com o mesmo número, seja 73 ou 93, eles serão afetados pelo problema documentado neste artigo da KB. Esse problema é resolvido no firmware de nó atualizado incluído no Pacote de firmware do nó 10.1.6 e posterior, bem como em uma correção de código incluída no OneFS 8.1.0.4 e versões posteriores. Embora cada atualização individualmente corrija o problema, ambas as versões contêm outras correções importantes, portanto, é recomendável instalar as duas.

Betroffene Produkte

Isilon, Isilon Gen6
Artikeleigenschaften
Artikelnummer: 000056963
Artikeltyp: Solution
Zuletzt geändert: 28 Juni 2023
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.