Коннектор: Як усунути неполадки вузла Fibre Channel для перемикання портів або проблем зі зв'язком SFP шляхом усунення, Самодопомога.
Summary: У цій статті пояснюється, як усунути неполадки вузла Fibre Channel для перемикання портів або зв'язку SFP.
Symptoms
Як усунути неполадки вузла Fibre Channel для перемикання портів або проблеми зі зв'язком SFP шляхом усунення?
Забагато активних замін
SFP Збій
з'єднання Порт G Немає
світла
Не працює послідовність (NOS)
Послідовність відключень лінії (OLS)
Втрата сигналу
Несправний SFP
Усунення несправностей порту
FC Помилки на порту FC
Cause
Занадто багато SFP активно замінюються, тоді як проблема лежить за межами SFP або перемикача.
Resolution
Щоб вирішити цю проблему:
- Визначте вузол і порт комутатора, які беруть участь у збої зв'язку.
- Переконайтеся, що порт комутатора адміністративно відкритий (розблоковано, без вимкнення) або ввімкнено.
- Перш ніж продовжити, переконайтеся, що до підключеного пристрою доступні резервні шляхи.
- Щоб усунути проблему в SFP, виконайте наступне:
- Перевірте наявність вільного порту на комутаторі.
- Вимкніть визначений вільний порт на комутаторі.
- Перемістіть кабель з порту, який потрібно дослідити, на новий відключений вільний порт на попередньому кроці.
- Змініть вимкнений порт, щоб увімкнути стан (або адміністративно активно) і повернути пристрій до Інтернету.
- Очистіть/скиньте статистику/лічильники до нуля на перемикачі.
Про Brocade див.: KBA:
Про Cisco дивіться KBA:
Connectrix - серія MDS від Cisco: Як очистити інтерфейс і ASIC-лічильники на МДС
- Слідкуйте за портом за допомогою відповідних команд протягом 4-6 годин.
РЕЗУЛЬТАТІВ:
- Якщо лічильники помилок збільшуються, проблема криється за межами комутатора, і клієнту / користувачу / адміністратору SAN необхідно порадити:
-
- Новий порт SFP і кабель вимагають очищення. (Щоб запобігти забрудненню SFP брудного кабелю, подумайте про використання професійного набору для чищення.)
- Підключений пристрій повинен бути додатково досліджений тими, хто підтримує пристрій.
- На комутаторі Cisco, якщо стан «помилково вимкнено» повертається без збільшення лічильника, необхідно відкрити SR для подальшого дослідження серверної частини.
- Якщо помилки не збільшуються (або стан Errdisabled на комутаторі Cisco не повертається), SFP на попередньому порту несправний, підніміть SR для заміни SFP за умови наведених вище результатів аналізу, включаючи виходи журналу, деталі SFP (SM або MM, і швидкість, і так далі)
Additional Information
Апаратні збої можна легко ізолювати, застосувавши до проблеми простий алгоритм; Якщо це не апаратна частина, то це інша частина. Зациклюйте, доки не ізолюєте збій, вказуючи на проблемне обладнання.
ПРИКЛАДИ ПАРЧІ:
Connectrix серії B: Як інтерпретувати вихід портершоу Brocade, і що означають лічильники. Самодопомоги
Приклад 1 ENC OUT з LINK FAIL і LOSS SYNC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
З помилок ми можемо побачити помилку зв'язку та помилку втрати синхронізації PLUS enc out, вони також можуть включати помилку втрати sig.
Ці комбінації помилок зазвичай вказують на перезавантаження хоста або скидання посилань за межами комутатора. Помилки enc out виникають під час узгодження швидкості в рамках ініціалізації зв'язку.
Очікувані дії:
Переконайтеся, що пристрій, підключений до порту, мав законну причину для переходу в автономний режим та/або онлайн. Наприклад, перезавантаження хоста. Якщо ні, підніміть СР.
Приклад 2 ENC OUT:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Помилки виводу без будь-яких пов'язаних з цим помилок вказують на забруднення кабелю.
Очікувані дії:
Огляньте та очистіть усі оптичні грані на кабелі та SFP, підключених до цього порту та підключених пристроїв.
Приклад 3 CRC та CRC G_EOF:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Рамка входить в порт комутатора з поганим CRC, але з кінцем рамки, як і раніше, позначена як хороша.
Це вказує на те, що це перший порт, який реєструє пошкоджений фрейм, тому проблема полягає в інтерфейсі SFP/кабелю/підключеного пристрою на цьому конкретному порту.
Очікувані дії:
Дивіться дію за замовчуванням у роздільній здатності.
Для порту ISL очистіть статистику (як зазначено вище під пунктом 9) і перевірте лічильники та перездайте дані через 4-6 годин, зберіть збереження підтримки з обох комутаторів і відкрийте SR для нормального усунення несправностей.
Приклад 4 Конвенції про права дитини:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Порт записує кадр, що надходить на комутатор з поганим кадром CRC, але з уже позначеним кадром як поганий. Зазвичай це відображається на портах ISL та NPIV F.
Очікувані дії:
Якщо помилки CRC реєструються на порту NPIV, перевірте пристрій, підтримуючи постачальника!
Для порту ISL перевірте всі порти в тканині на наявність будь-яких g_oef CRC журналювання портів і дії, як у прикладі 3.
Приклад помилки 5 шт з LINK FAIL і LOSS SYNC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Це стосується лише платформ, які підтримують порти 10 Гбіт/с або 16 Гбіт/с і вище (6505/6510/6520/DCX-8510), і це було представлено з Condor3 ASIC, платформою GEN5.
ER_PCS_BLK показує кількість помилок блоку фізичного кодування (PCS). Цей лічильник еквівалентний enc_out для зв'язку 8Gb/4Gb і використовується тільки для швидкості 10 ГБ і 16 ГБ і вище.
З помилок ми можемо побачити збій з'єднання та втрату синхронізації, а також помилки помилки ПК, вони також можуть включати помилку втрати sig.
Ці комбінації помилок зазвичай вказують на перезавантаження хоста або скидання посилань за межами комутатора.
Помилки pcs err виникають під час узгодження швидкості в рамках ініціалізації зв'язку.
Очікувані дії:
Переконайтеся, що пристрій, підключений до порту, мав законну причину для переходу в автономний режим та/або онлайн. Наприклад, перезавантаження хоста. Якщо ні, підвищуйте СР.
Приклад помилки 6 шт.:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Загальна причина:
Дійсна лише в тому випадку, якщо статистика портів була очищена протягом останніх 24 годин. В іншому випадку віднесіть ці лічильники до історичних. Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Помилки PCS ERR без будь-яких пов'язаних з ними помилок вказують на забруднення кабелю.
Очікувані дії:
Огляньте та очистіть усі оптичні грані на кабелі та SFP, підключених до цього порту та підключених пристроїв.
ПРИКЛАДИ CISCO:
Приклад 1 Помилка:
Errdisabled - немає збільшення помилок інтерфейсу
fc1/1 is down (Error disabled - bit error rate too high) Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN). 5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 179 frames input, 7668 bytes 0 discards, 0 errors 0 CRC, 0 unknown class 0 too long, 0 too short 23 frames output, 1320 bytes 0 discards, 0 errors 1 input OLS, 1 LRR, 0 NOS, 1 loop inits 2 output OLS, 0 LRR, 0 NOS, 1 loop inits Interface last changed at Thu Jun 5 01:51:00 2014
Загальна причина:
Стан "Errdisabled" інтерфейсу може трохи вводити в оману, оскільки лічильники інтерфейсу можуть бути чистими на передній частині, і перемикач, здається, опускає порт зі станом "errdisabled", а лічильники помилок зростають на серверній частині (ASIC/внутрішня/linecard).
Заплановані дії:
Дивіться дію за умовчанням у роздільній здатності. Якщо це повториться, зберіть дані технічної підтримки на виході та відкрийте SR.
- Несправний або поганий кабель
- Несправний або поганий SFP
- SFP призначений для роботи зі швидкістю 1 Гбіт/с, але використовується зі швидкістю 2 Гбіт/с.
- SFP призначений для роботи на швидкості 2 Гбіт/с, але використовується на швидкості 4 Гбіт/с.
- Кабель для коротких перевезень використовується для довгих перевезень, або кабель для довгих перевезень використовується для коротких перевезень.
- Миттєва втрата синхронізації
- Нещільне з'єднання кабелю на одному або обох кінцях
- Неправильне підключення SFP на одному або обох кінцях
Поріг частоти бітових помилок виявляється, коли за 5 хвилин відбувається 15 черг помилок. За замовчуванням перемикач відключає інтерфейс при досягненні порогу. Ви можете послідовно вводити наведені нижче команди, щоб знову увімкнути інтерфейс.
shutdown
no shutdown Ви можете налаштувати перемикач так, щоб він не відключав інтерфейс при перевищенні порогу.
За замовчуванням поріг відключає інтерфейс.
Приклад 2: КПР
Інкрементація КРР
fc13/1 is down (Initializing)
Port description is ***
Hardware is Fibre Channel, SFP is long wave laser cost reduced.
5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
162 frames input, 6136 bytes
0 discards, 17 errors
17 CRC, 0 unknown class
0 too long, 17 too short
74 frames output, 6304 bytes
2 discards, 0 errors
108 input OLS, 54 LRR, 2 NOS, 0 loop inits
83 output OLS, 26 LRR, 56 NOS, 0 loop inits
Interface last changed at Tue May 27 08:37:20 2014
Загальна причина:
Порт записує кадр, що надходить на комутатор з поганим CRC, але хорошим кінцем кадру. Лічильник CRC лише збільшує кількість помилок на конкретному вхідному порту, і будь-які розслідування повинні проводитися за цим фізичним посиланням.
Очікувані дії:
Дивіться дію за замовчуванням у роздільній здатності.
Очистіть статистику портів (як зазначено вище під пунктом 9) і перевірте лічильники та дані перездачі через 4-6 годин.
Приклад 3: NOS
Неопераційна послідовність (NOS)
show int fc1/1 counters
fc1/1
5 minutes input rate 1753296 bits/sec, 219162 bytes/sec, 199 frames/sec
5 minutes output rate 2310384 bits/sec, 288798 bytes/sec, 194 frames/sec
2741512190 frames input, 2542476084276 bytes
0 class-2 frames, 0 bytes
2741512190 class-3 frames, 2542476084276 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors, 0 CRC
0 unknown class, 0 too long, 0 too short
3410405365 frames output, 5164364339412 bytes
0 class-2 frames, 0 bytes
3410405365 class-3 frames, 5164364339412 bytes
0 class-f frames, 0 bytes
0 discards, 0 errors
1 input OLS, 1 LRR, 0 NOS, 307 loop inits
289 output OLS, 289 LRR, 289 NOS, 289 loop inits
0 link failures, 0 sync losses, 0 signal losses
48276 BB credit transitions from zero
16 receive B2B credit remaining
3 transmit B2B credit remaining
3 low priority transmit B2B credit remaining
Загальна причина:
Втрата зв'язку до початку переговорів про зв'язок.
Очікувані дії:
Перевірте рівень 1 (фізичний рівень) і пристрій-джерело.