VxRail: vCenter'da "High pnic rx generic error rate detected (Yüksek pnic rx genel hata oranı algılandı)" veya "High pNic error rate detected (Yüksek pNic hata oranı algılandı)" uyarısı gösteriliyor
Summary: vCenter'da "Warning: High pnic rx generic error rate detected on vmnicX (vmnicX'te yüksek pnic rx genel hatası algılandı)"; "High pNic error rate detected, Check the host's vSAN performance view for details (Yüksek pNic hata oranı algılandı, ayrıntılar için ana bilgisayarın vSAN performans görünümünü kontrol edin)" gibi uyarı mesajları görüntüleniyor. ...
Symptoms
Bu mesajın farklı şekilde ele alınması gereken iki farklı sorun vardır.
1. Sorun:
vCenter web istemcisi, birden fazla ana bilgisayar için aşağıdaki mesajı gösterir. Uyarıdaki vmnic, ana bilgisayarların ağa bağlandığı herhangi bir vmnic olabilir.
**Bu, 2. sorundan farklıdır (aşağıda bahsedilmiştir). 2. sorunun alarmındaki vmnic yalnızca vSAN'ın Aktif ve (veya) Yedek durumundaki vmnic'idir.**
Warning: High pnic rx generic error rate detected on vmnicX.
ESXi ana bilgisayarında aşağıdaki komutu çalıştırırken kullanıcılar çok sayıda rx (Alma) uzunluğu hatası görüyor ve hata büyümeye devam ediyor. Bu, uyarıyı tetikler.
("X" harfini uygun vmnic numarasıyla değiştirin)
esxcli network nic stats get -n vmnicX vmnic0 Packets received: 2611289 Receive length errors: 279662 Multicast packets received: 529478 Broadcast packets received: 512315 vmnic1 packets received: 5812398 Receive length errors: 279518 Multicast packets received: 538956 Broadcast packets received: 427913
Ana bilgisayardaki tüm vmnic'ler neredeyse aynı "Receive length error" sayıdadır. Bu şu anlama geliyor: "Multicast packets received" veya "Broadcast packets received" şuna katkıda bulunuyor: "Receive length errors."
**Çok noktaya yayın paketleri, genellikle yayın paketlerinde olduğu gibi aynı VLAN'a dolar.
Alma uzunluğu hatası ve Yayın paketlerinin oranını veya alma uzunluğu hatası ve çok noktaya yayın paketlerinin oranını hesaplayabiliriz. Ardından bunları diğer düğümlerle karşılaştırabiliriz.
Farklı düğümlerde bile, çok noktaya yayın veya yayının neden olduğu alma uzunluğu hatası yüzdesi hemen hemen aynıdır.**
Sorun 1'i gidermek için vmnic'de paketleri yakalayın:
- Düğüme SSH ile bağlanın
- Aşağıdaki komutunu çalıştırın: ("
vmnicX" uzunluk hatası alan vmnic ile değiştirin)pktcap-uw --uplink vmnicX --dir 2 -o /tmp/lengtherror.pcap
- Hata uplink paketlerini yakalayın ve ctrl+c tuşlarına basarak işlemi durdurun.
- .pcap dosyasını yerel masaüstüne indirin ve Wireshark ile açın.
- Yayın paketleri için Filtre:
ip.addr == 255.255.255.255 - Çok noktaya yayın paketleri için Filtre:
eth.dst == ff:ff:ff:ff:ff:ff - Filtre sonucundan "Hatalı Biçimlendirilmiş Paket"i bulmaya çalışın.
- Bazen bu filtre çalışır (yalnızca Wireshark 4.0.12'de):
((eth.len != frame.len - 14) || eth.len != frame.len - 18)

2. Sorun:
Alarma ad verilmiş olması.
High pNic error rate detected Check the host's vSAN performance view for details.
Kullanıcı, ana bilgisayarın vSAN performans görünümünü kontrol ettiğinde alarmda belirtilen vmnic'nin her zaman vSAN trafiğinin Aktif veya (ve) Yedek vmnic'si olduğunu görebilir.
Çoğu zaman vmnic, vSAN'ın yedeğidir.
Bu alarm vSphere 7.0U2'de yer alır.
Bkz: https://knowledge.broadcom.com/external/article/312096/alarm-about-high-pnic-error-rate-being-d.html
Aşağıdaki tabloda, vSAN için kullanılan ve izlenen pNIC'lere ilişkin ölçümler ve bunların alarm eşikleri gösterilmektedir:
Bu tür hatalar vSAN performansını etkileyebilir.
Cause
Sorun 1:
Bu örnekte bir paket yakalama, CAPWAP-Control paketleri gönderen bir Cisco Erişim Noktası (AP) denetleyicisini gösterir.
Wireshark bunları Hatalı Biçimlendirilmiş Paket olarak işaretler.
ESXi de genellikle bu tür paketleri kaldıramaz.
Wireshark, analizi sırasında protokolün beklenen yapısına uymayan bir paketle karşılaşırsa paketi "Hatalı Biçimlendirilmiş" olarak işaretler. Bu genellikle paketin iletim sırasında bozulmuş olabileceğini gösterir veya bir protokolün olağan dışı veya yanlış bir şekilde uygulandığını temsil eder.
Aşağıdaki filtre başka bir çıktı türü sağlayabilir (çerçeve uzunluğu desteklenmediğinden) ve ayrıca "received length error."
Ancak bu doğru değildir, bu nedenle raporu müşteriye göndermeden önce bu filtrenin çıktısına daha fazla analiz yapılmalıdır.((eth.len != frame.len - 14) || eth.len != frame.len - 18)
2. Sorun:
VMware, vSAN performansını etkileyebilecek hataları izlemek için bu alarmı tanıtmıştır.
Hatanın yüzdesi özel değere ulaştığında. Kullanıcıya vSAN performansının önemsenmesi gerektiğini belirtmek üzere bir alarm tetiklenir.
Ancak alarm tetikleme algoritmasının sorunları olabileceğini gözledik. Hata paketi oranı hesaplanırken kısa vadedeki veri paketlerinin sayısı ve toplam hata paketi miktarı kullanılır.
Bu nedenle, vmnic üzerinde daha az trafik olduğundan çoğu zaman vmnic hatası her zaman vSAN'ın yedek vmnic'idir.
Resolution
1. Sorun:
- 1. Sorun örneğinde kaynak IP adresi, VLAN 1'e bağlı bir Cisco AP denetleyicisidir.
- VLAN 1 kullanan trafik olmadığından emin olmak için VxRail kümesinin vDS ayarlarını kontrol edin.
- VLAN 1'i, VxRail ana bilgisayarlarına bağlı TOR anahtarı bağlantı noktalarından kaldırın.
- VLAN 1'de değilse VLAN'ı anahtar bağlantı noktalarından kaldırmak için aynı adımları izleyin.
- VLAN küme trafiğini taşıyorsa VLAN'ı anahtar bağlantı noktalarından kaldıramayız. Kullanıcının, alınan uzunluk hatasına neden olan trafiği VxRail kümesinden yalıtmak için ağ tasarımını değiştirmesi gerekebilir.
2. Sorun:
Bu tür bir sorunu ele almak için çeşitli senaryolar mevcuttur.
- Vmnic raporlama hatası, vSAN'ın yedek vmnic'sidir ve hata paketi büyümesi yavaştır.
Bu, algoritmanın neden olduğu yanlış bir alarmdır ve vSAN performansını etkilemez. Müşterilerin bu alarmı görmezden gelmelerini önerebiliriz ancak bu alarm zaman zaman yeniden ortaya çıkar.
- vmnic raporlama hatası, vSAN'ın veya yedek vminc'sinin etkin vmnic'sidir ancak hata paketleri büyümeye devam eder.
Farklı hata türleri farklı çözünürlükleri takip eder, genellikle CRC hatası, Alım İşleminde Uzunluk hatası ve Duraklatma Çerçevesi nedeniyle oluşan alarmla karşılaşırız.
-
Vmnic'de CRC hataları alındı.
Bir donanım sorunu genellikle CRC hatalarına neden olur. Hem düğüm hem de anahtar tarafında çoğunlukla Kablo, SFP ve Ağ bağdaştırıcısı ile ilgilidir
Sorunu bulmak için donanım sorunlarını giderme işlemini uygulayın. -
Vmnic'de uzunluk hataları alındı.
Temel neden, 1. Sorun ile aynıdır. Bu senaryo için 1. Sorun'daki sorun giderme adımlarını izleyebilirsiniz.
-
vmnic'de alınan çerçeveyi duraklatın.
Duraklatma Çerçevesi, ağ akış kontrolü için kullanılır.
Akış kontrolünü etkinleştirin. Ağ kararsızlığı veya tıkanıklığı, VxRail'de düşük performansa katkıda bulunur ve vSAN I-O veri deposu işlemleri üzerinde olumsuz bir etkiye sahiptir.
Akış denetimi, arabelleğin fazladan çalışmasını önlemek için veri aktarımı hızını yönetmeye yardımcı olan bir anahtar özelliğidir.
VxRail, akış kontrolünün"receive on" and "transmit off."
Bkz. https://www.delltechnologies.com/asset/en-us/products/converged-infrastructure/technical-support/h15300-vxrail-network-guide.pdf sayfa 88.
Anahtarın akış kontrolünü etkinleştirip etkinleştirmediği nasıl kontrol edilir?
Örnek olarak Dell anahtarını ele alalım:
Run the command "show interface ethernet 1/1/1," replacing the switch interface number with the interface connecting the node
Vxrail-S5048-01# show interface ethernet 1/1/1 Ethernet 1/1/1 is up, line protocol is down Pluggable media present, SFP28 type is SFP28 25GBASE-SR-NOF Wavelength is 850 Interface index is 15 Internet address is not set Mode of IPv4 Address Assignment: not set Interface IPv6 oper status: Disabled MTU 1532 bytes, IP MTU 1500 bytes LineSpeed 0, Auto-Negotiation off Configured FEC is cl108-rs, Negotiated FEC is cl108-rs Flowcontrol rx on tx on ----- tx on means that the flow control is transmit on
Akış kontrolü iletimi nasıl devre dışı bırakılır?
Vxrail-S5048-01# configure terminal vxrail-S5048-01(config)# interface e1/1/1 ----replace the switch interface number Vxrail-S5048-01(conf-if-eth1/1/1)# flowcontrol transmit off
vSAN vmnic'lere bağlı tüm anahtar arayüzlerini aktarım kapalı olacak şekilde yapılandırın.
Alarmı yeşile sıfırlayın ve alarmın geri dönüp dönmediğini izleyin.