Isilon: O par de nós par de DE Gen6 (H400, A200, A2000) gera eventos e mensagens de console indicando problemas com o link NTB após uma substituição ou movimentação do módulo de computação
Summary: Um par de nós par de DE Gen6 (H400, A200, A2000) às vezes pode começar a gerar mensagens de erro indicando problemas com seu link NTB. Os erros podem incluir mensagens repetidas "NTB link up/down" e erros de negociação de velocidade de link. ...
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Um par de nós par gen6 DE (H400, A200, A2000) às vezes pode começar a gerar mensagens de erro indicando problemas com seu link NTB. Os erros podem incluir mensagens repetidas de "link ativo/inativo", bem como erros de negociação de velocidade de link, por exemplo:
mnv0: HW link down event mnv0: HW link up event mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2. mnv0: transport link up mnv0: peer up
Como alternativa, os registros e/ou o console podem simplesmente mostrar o link NTB como inativo e não aparecer. Atualmente, parece haver várias causas possíveis para esse problema, algumas das quais ainda estão sendo investigadas. Se um ou ambos os nós afetados tiverem sido movidos recentemente para um slot de chassi diferente ou tiverem seu módulo de computação substituído, o problema e a resolução documentados neste artigo da KB poderão ser aplicados. Esse problema não afeta os nós EP (F800, H600, H500).
Cause
Os nós de mesmo nível se comunicam entre si por meio de um canal de comunicação especial chamado NTB (NonTransparent Bridge) incorporado ao backplane do chassi. Em operação normal, os dois nós em um par de pares devem ter um valor PPD diferente para poder se comunicar uns com os outros por meio do NTB. Os valores de PPD são atribuídos com base no ID do slot do nó no chassi. Esse problema é causado pelo BIOS do nó que retém o ID do slot antigo do nó quando um nó ou módulo de computação é trocado em um slot diferente do original, em vez de detectar o novo ID de slot. Isso pode fazer com que o valor do PPD seja definido incorretamente, o que causa um conflito que impede que os nós estabeleciem um link NTB.
Resolution
Execute o seguinte comando emambos os nós do par de pares afetados para verificar se o problema documentado neste KB é aplicável:
# sysctl dev.ntb_hw.0.debug_info.ppd
Cada nó responderá com:
dev.ntb_hw.0.debug_info.ppd:
73
Ou:
dev.ntb_hw.0.debug_info.ppd: 93
- Se um nó em um par responder com 73 e o outro responder com 93, esses nós não serão afetados atualmente pelo problema documentado neste artigo da KB.
Entre em contato com o suporte técnico do EMC Isilon para obter mais assistência.
- Se ambos os nós responderem com o mesmo número, seja 73 ou 93, eles serão afetados pelo problema documentado neste artigo da KB. Esse problema é resolvido no firmware de nó atualizado incluído no Pacote de firmware do nó 10.1.6 e posterior, bem como em uma correção de código incluída no OneFS 8.1.0.4 e versões posteriores. Embora cada atualização individualmente corrija o problema, ambas as versões contêm outras correções importantes, portanto, é recomendável instalar as duas.
# sysctl dev.ntb_hw.0.debug_info.ppd
Cada nó responderá com:
dev.ntb_hw.0.debug_info.ppd:
73
Ou:
dev.ntb_hw.0.debug_info.ppd: 93
- Se um nó em um par responder com 73 e o outro responder com 93, esses nós não serão afetados atualmente pelo problema documentado neste artigo da KB.
Entre em contato com o suporte técnico do EMC Isilon para obter mais assistência.
- Se ambos os nós responderem com o mesmo número, seja 73 ou 93, eles serão afetados pelo problema documentado neste artigo da KB. Esse problema é resolvido no firmware de nó atualizado incluído no Pacote de firmware do nó 10.1.6 e posterior, bem como em uma correção de código incluída no OneFS 8.1.0.4 e versões posteriores. Embora cada atualização individualmente corrija o problema, ambas as versões contêm outras correções importantes, portanto, é recomendável instalar as duas.
Affected Products
Isilon, Isilon Gen6Article Properties
Article Number: 000056963
Article Type: Solution
Last Modified: 28 Jun 2023
Version: 6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.