Connectrix: Bağlantı noktası veya SFP iletişim sorunlarını ortadan kaldırma, Kendi Kendine Yardım ile anahtarlama için Fiber Kanal düğümünde sorun giderme, Kendi Kendine Yardım.
Summary: Bu makalede, eleme yöntemiyle Fiber Kanal düğümünden anahtar bağlantı noktasına veya SFP iletişim sorunlarının nasıl giderileceği açıklanmaktadır.
Symptoms
Bağlantı noktası veya SFP iletişim sorunlarını ortadan kaldırma, Kendi Kendine Yardım ile anahtarlama için Fiber Kanal düğümünde sorun giderme.
Çok fazla pro-aktif SFP değişimi
Bağlantı hatası
G bağlantı noktası
Işık yok
Çalışma Dışı Sıra (NOS)
Hat Dışı Sıra (OLS)
Sinyal Kaybı
Hatalı SFP
FC bağlantı noktası sorunlarını giderin
FC bağlantı noktasındaki hatalar
Cause
Sorun SFP'nin veya anahtarın dışındayken çok fazla SFP proaktif olarak değiştirildi.
Resolution
Bu sorunu çözmek için:
- İletişim hatasında rol oynayan düğümü ve anahtar bağlantı noktasını belirleyin.
- Anahtar bağlantı noktasının yönetim düzeyinde açık (engeli kaldırılmış, kapalı değil) veya etkin olduğundan emin olun.
- Devam etmeden önce bağlı aygıtta kullanılabilir yedek yollar olduğundan emin olun.
- SFP sorununu ortadan kaldırmak için aşağıdakileri yapın:
- Anahtarda boş bağlantı noktası olup olmadığını kontrol edin.
- Anahtarda belirlenen boş bağlantı noktasını devre dışı bırakın.
- Kabloyu araştırılacak bağlantı noktasından önceki adımda devre dışı bırakılan yeni boş bağlantı noktasına taşıyın.
- Durumu etkinleştirmek (veya yönetimsel olarak açık) ve aygıtı tekrar çevrimiçi duruma getirmek için devre dışı bağlantı noktasını değiştirin.
- Anahtardaki istatistikleri/sayaçları temizleyin/sıfırlayın.
Brocade için şu KBA'ya bakın:
Cisco için şu KBA'ya bakın:
Connectrix - MDS Serisi Cisco: Bir MDS'de arayüzün ve ASIC sayaçları nasıl temizlenir?
- Bağlantı noktasını ilgili komutlarla 4-6 saat izleyin.
SONUÇLAR:
- Hata sayaçları artarsa sorun anahtarın dışındadır ve müşteriye/kullanıcıya/SAN yöneticisine şunlar önerilmelidir:
-
- Yeni bağlantı noktası SFP'sinin ve Kablonun temizlenmesi gerekir. (Kirli bir kablonun SFP'sinde kirlenmeyi önlemek için profesyonel bir temizleme kiti kullanmayı düşünün.)
- Takılan aygıt, aygıtı destekleyen kişi tarafından daha ayrıntılı araştırılmalıdır.
- Cisco anahtarında "errdisabled" durumu sayaç artışı olmadan geri gelirse daha fazla arka uç araştırması için bir SR açılmalıdır.
- Hatalar artmazsa (veya Cisco anahtarındaki Errdisabled durumu geri gelmezse) önceki bağlantı noktasındaki SFP arızalıdır, yukarıdaki analiz sonuçlarını, log çıktılarını, SFP detaylarını (SM veya MM ve hız vb. dahil) içeren SFP değişimi için SR (Servis İsteği) oluşturun
Additional Information
Donanım arızaları, soruna basit bir algoritma uygulanarak kolayca izole edilebilir; bu bu donanım parçası değilse diğer parçadır. Sorunlu donanıma işaret eden arızayı izole edene kadar döngüyü sürdürün.
BROCADE ÖRNEKLERİ:
Connectrix B Serisi: Brocade porterrshow çıktısı nasıl yorumlanır ve sayaçların anlamı nedir? Kendi Kendine Yardım
Örnek 1: LINK FAIL ve LOSS SYNC ile ENC OUT:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. madde altında listelendiği şekilde) ve sayaçları kontrol edin ve 4-6 saat sonra verileri tekrar alın.
Hatalardan, bağlantı hatası ve senkronizasyon kaybı *ART*I enc out hatalarını görebiliriz; bunlar ayrıca sinyal kaybı hatasını da içerebilir.
Bu hata kombinasyonları genellikle bir anahtarın dışından bir ana bilgisayar yeniden başlatması veya bir bağlantı sıfırlaması olduğunu gösterir. "enc out" hataları, bağlantı başlatma işleminin bir parçası olarak hız uzlaşması sırasında ortaya çıkar.
Beklenen Eylemler:
Bağlantı noktasına bağlı aygıtın çevrimdışı ve/veya çevrimiçi duruma geçmek için geçerli bir nedeni olduğunu doğrulayın. Örneğin, ana bilgisayarın yeniden başlatılması. Değilse bir SR oluşturun.
Örnek 2 ENC OUT:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. nokta altında listelendiği şekilde) ve 4-6 saat sonra verileri tekrar alın.
Enc out hataları, ilişkili başka hatalar yoksa kirli kabloya işaret eder.
Beklenen Eylemler:
Bu bağlantı noktasına ve bağlı aygıtlara bağlı kablo ve SFP'deki tüm optik yüzeyleri inceleyip temizleyin.
Örnek 3 CRC ve CRC G_EOF:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. nokta altında listelendiği şekilde) ve 4-6 saat sonra verileri tekrar alın.
Çerçeve, anahtar bağlantı noktasına bozuk CRC ile giriyor ancak çerçeve sonu yine de iyi durumda olarak işaretlenmiş.
Bu durum, söz konusu bağlantı noktasının bozuk çerçeve kaydedilen ilk bağlantı noktası olduğunun göstergesidir. Dolayısıyla sorun, bu bağlantı noktasındaki SFP/Kablo/Bağlı aygıt arayüzüyle ilgilidir.
Beklenen Eylemler:
Çözüm bölümündeki varsayılan eyleme bakın.
Bir ISL bağlantı noktası için istatistikleri temizleyin (yukarıda 9. nokta altında listelendiği şekilde), sayaçları kontrol edin ve 4-6 saat sonra verileri tekrar alın, her iki anahtardan da supportsaves toplayın ve normal sorun giderme için SR (Servis İsteği) açın.
Örnek 4 CRC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. nokta altında listelendiği şekilde) ve 4-6 saat sonra verileri tekrar alın.
Bağlantı noktası, bozuk CRC çerçevesiyle anahtara giren bir çerçeveyi kayıt altına alıyor ancak çerçeve halihazırda bozuk olarak işaretlenmiş. Normalde bunu ISL ve NPIV F-bağlantı noktalarında görürsünüz.
Beklenen Eylemler:
NPIV bağlantı noktasında CRC hataları günlüğe kaydediliyorsa aygıtın incelenmesi için bakım tedarikçisine başvurun!
Bir ISL bağlantı noktası için yapıdaki tüm portları Örnek 3'teki gibi herhangi bir portun crc g_oef ve eylem kaydettiğini kontrol edin.
Örnek 5 BAĞLANTI HATASI ve SENKRONİZASYON KAYBI ile PCS HATASI:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. nokta altında listelendiği şekilde) ve 4-6 saat sonra verileri tekrar alın.
Bu yalnızca, 10 GB/sn veya 16 Gb/sn veya daha yüksek hızlı bağlantı noktalarını destekleyen platformlarda (6505/6510/6520/DCX-8510) geçerlidir ve GEN5 Platformu olan Condor3 ASIC ile birlikte kullanıma sunulmuştur.
ER_PCS_BLK, Fiziksel Kodlama Alt Katmanı (PCS) blok hatalarının sayısını gösterir. Bu sayaç, 8 GB/4 GB bağlantı için enc_out ile eşdeğerdir ve yalnızca 10 GB, 16 GB ve daha yüksek hızlar için kullanılır.
Hatalardan bağlantı hatası ve senkronizasyon kaybı ile pcs err hatalarını da görebilirsiniz. Bu hatalar, kayıp sig hatasını da içerebilir.
Bu hata kombinasyonları genellikle ana bilgisayarın yeniden başlatılmasını veya anahtara harici bağlantı sıfırlamasını gösterir.
Pcs err hataları, bağlantı başlatmanın bir parçası olarak hız anlaşması sırasında ortaya çıkar.
Beklenen Eylemler:
Bağlantı noktasına bağlı aygıtın çevrimdışı veya çevrimiçi olma nedeninin meşru olup olmadığını doğrulayın. Örneğin, ana bilgisayarın yeniden başlatılması. Aksi takdirde SR (Servis İsteği) oluşturun.
Örnek 6 PCS ERR:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Genel Neden:
Yalnızca son 24 saat içinde bağlantı noktası istatistikleri temizlenmişse geçerlidir. Aksi takdirde bu sayaçları geçmiş olarak sınıflandırın. Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. madde altında listelendiği şekilde) ve 4-6 saat sonra verileri tekrar alın.
PCS ERR hataları, ilişkili başka hatalar yoksa kirli kabloya işaret eder.
Beklenen Eylemler:
Bu bağlantı noktasına ve bağlı aygıtlara bağlı kablo ve SFP'deki tüm optik yüzeyleri inceleyip temizleyin.
CISCO ÖRNEKLERİ:
Örnek 1 Errdisabled:
Errdisabled - arayüz hataları artmıyor
fc1/1 is down (Error disabled - bit error rate too high) Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN). 5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 179 frames input, 7668 bytes 0 discards, 0 errors 0 CRC, 0 unknown class 0 too long, 0 too short 23 frames output, 1320 bytes 0 discards, 0 errors 1 input OLS, 1 LRR, 0 NOS, 1 loop inits 2 output OLS, 0 LRR, 0 NOS, 1 loop inits Interface last changed at Thu Jun 5 01:51:00 2014
Genel Neden:
Bir arayüzün "Errdisabled" durumu biraz yanıltıcı olabilir, çünkü arayüz sayaçları ön uçta temiz olabilir ve anahtar "errdisabled" durumuyla bağlantı noktasını kapatıyor gibi görünür ve arka uçta hata sayaçları artar (ASIC/dahili/linecard).
Beklenen Eylemler:
Çözümdeki varsayılan eyleme bakın. Yeniden ortaya çıkıyorsa teknik destek ayrıntıları çıktısını alın ve SR (Servis İsteği) oluşturun.
- Arızalı veya bozuk kablo
- Arızalı veya hatalı SFP
- SFP'nin 1 Gb/sn de çalışacak şekilde belirtilmesi ancak 2 Gb/sn'de kullanılması.
- SFP'nin, 2 Gb/sn de çalışacak şekilde belirtilmesi ancak 4 Gb/sn'de kullanılması.
- Kısa mesafeli kablonun uzun mesafe için veya uzun mesafeli kablonun kısa mesafe için kullanılması.
- Anlık senkronizasyon kaybı
- Bir veya her iki uçta gevşek kablo bağlantısı
- Bir veya her iki uçta uygun olmayan SFP bağlantısı
5 dakikalık bir sürede 15 hata oluştuğunda bir bit hata oranı eşiğinin tespit edilmesi. Varsayılan olarak eşiğe ulaşıldığında anahtar arayüzü devre dışı bırakır. Arayüzü yeniden etkinleştirmek için aşağıdaki komutları sırayla girebilirsiniz.
shutdown
no shutdown Anahtarı, eşik aşıldığında bir arayüzü devre dışı bırakmayacak şekilde yapılandırabilirsiniz.
Varsayılan olarak eşik, arayüzü devre dışı bırakır.
Örnek 2: CRC
CRC'lerin artması
fc13/1 is down (Initializing)
Port description is ***
Hardware is Fibre Channel, SFP is long wave laser cost reduced.
5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
162 frames input, 6136 bytes
0 discards, 17 errors
17 CRC, 0 unknown class
0 too long, 17 too short
74 frames output, 6304 bytes
2 discards, 0 errors
108 input OLS, 54 LRR, 2 NOS, 0 loop inits
83 output OLS, 26 LRR, 56 NOS, 0 loop inits
Interface last changed at Tue May 27 08:37:20 2014
Genel Neden:
Bağlantı noktası, hatalı CRC'ye sahip ancak iyi bir çerçeve sonuna sahip bir çerçeveyi anahtara girerken kaydeder. CRC sayacı yalnızca hatayı günlüğe kaydeden belirli giriş bağlantı noktasında artar ve tüm araştırmalar bu fiziksel bağlantıda yapılmalıdır.
Beklenen Eylemler:
Çözümdeki varsayılan eyleme bakın.
Bağlantı noktası istatistiklerini temizleyin (yukarıda 9. maddede listelendiği gibi), sayaçları kontrol edin ve 4-6 saat sonra verileri yeniden alın.
Örnek 3: NOS
Çalışma Dışı Sıra (NOS)
show int fc1/1 counters
fc1/1
5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
2741512190 frames input, 2542476084276 bytes
0 class-2 frames, 0 bytes
2741512190 class-3 frames, 2542476084276 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors, 0 CRC
0 unknown class, 0 too long, 0 too short
3410405365 frames output, 5164364339412 bytes
0 class-2 frames, 0 bytes
3410405365 class-3 frames, 5164364339412 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors
1 input OLS, 1 LRR, 0 NOS, 307 loop inits
289 output OLS, 289 LRR, 289 NOS, 289 loop inits
0 link failures, 0 sync losses, 0 signal losses
48276 BB credit transitions from zero
16 receive B2B credit remaining
3 transmit B2B credit remaining
3 low priority transmit B2B credit remaining
Genel Neden:
Bağlantı anlaşmaları öncesinde bağlantı kaybı.
Beklenen Eylemler:
Katman 1'i (fiziksel katman) ve kaynak aygıtı kontrol edin.