Isilon: Gen6 DE 對等節點配對 (H400、A200、A2000) 會產生事件和控制台訊息,指出在更換或移動運算模組後,其 NTB 鏈接出現問題

Zusammenfassung: Gen6 DE 對等節點配對 (H400、A200、A2000) 有時會開始產生錯誤訊息,指出其 NTB 鏈接發生問題。錯誤可能包括重複的「NTB 連結向上/中斷」訊息,以及連結速度交涉錯誤。

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Gen6 DE (H400、A200、A2000) 對等節點組有時可能會產生錯誤訊息,指出其NTB鏈接發生問題。錯誤可能包括重複的「連結向上/中斷」訊息,以及連結速度交涉錯誤,例如:
 
mnv0: HW link down event
mnv0: HW link up event
mnv0: Failed to negotiate PCIe lane speed; expected 3 lane speed, got 2.
mnv0: transport link up
mnv0: peer up


或者,記錄及/或控制台可能只會將NTB鏈接顯示為「down」,而不會出現。此問題目前有多種可能的原因,其中一些原因仍在調查中。如果一個或兩個受影響的節點最近移入不同的機箱插槽,或更換其運算模組,則可能適用此 KB 中記錄的問題和解決方案。此問題不會影響 EP 節點 (F800、H600、H500)。  

Ursache

對等節點透過內嵌於機箱背板的非透明橋接 (NTB) 特殊通訊通道進行通訊。在正常運作中,對等組中的兩個節點必須有不同的PPD值,才能透過NTB互相通訊。PPD 值是根據機箱中的節點插槽 ID 來指派。當節點或運算模組換成與原本不同的插槽時,節點的 BIOS 會保留節點的舊插槽 ID,而非偵測到新的插槽 ID,因此會造成此問題。這可能會導致PPD值設定不正確,進而導致衝突,使節點無法建立NTB連結。

Lösung

在受影響的對等組中的兩個節點上執行下列命令,以確認此 KB 中記錄的問題是否適用:
# sysctl dev.ntb_hw.0.debug_info.ppd每個節點

會回應任一:

dev.ntb_hw.0.debug_info.ppd:
73

或:
dev.ntb_hw.0.debug_info.ppd:93

- 如果配對中的一個節點回應 73,而另一個回應 93,這些節點目前不會受到此知識庫文章中記錄的問題影響。
如需進一步協助,請聯絡 EMC Isilon 技術支持部門。

- 如果兩個節點回應的號碼 相同 ,無論是 73 或 93,都會受到此 KB 中記錄的問題影響。此問題已在節點韌體 套件 10.1.6 及更新版本所包含的更新節點韌體中解決,以及 OneFS 8.1.0.4 及更新版本中隨附的程式代碼修正程式中已解決。雖然每個更新都會個別修正問題,但兩個版本都包含其他重要的修正程式,因此建議同時安裝兩者。

Betroffene Produkte

Isilon, Isilon Gen6
Artikeleigenschaften
Artikelnummer: 000056963
Artikeltyp: Solution
Zuletzt geändert: 28 Juni 2023
Version:  6
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.