PowerVault ME5: Кількість помилок PHY хост-посилання перевищує поріг помилки

Summary: Оператори PowerVault ME5 можуть спостерігати випадкові повідомлення про кількість помилок PHY посилання на хост 663 у журналі історії подій під час використання портів інтерфейсу оптоволоконного каналу або контролера SAS, підключених до хостів або комутаторів. Ця подія була представлена у версії прошивки ME5 ME5.1.2.1.0 та вище. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Залежно від конфігурації модуля контролера PowerVault серії ME5 перейдіть до відповідного розділу цієї статті.

Контролери, що використовують порти інтерфейсу з оптоволоконним каналом (FC)

Операторам масивів серії PowerVault ME5 із модулями контролерів, підключеними за допомогою трансиверів SFP з оптоволоконним каналом (FC), можливо, доведеться вжити коригувальних заходів, щоб усунути цей симптом. Часто це не впливає на обробку вводу/виводу, однак повідомлення є ранньою вказівкою на проблему з конфігурацією, потенційним обладнанням або проблему зі з'єднанням із трансивером SFP або волоконно-оптичним кабелем.

У більшості випадків це легко вирішується правильним очищенням торця роз'єму LC на оптоволоконному кабелі для видалення пилу або інших забруднень, що перешкоджають заломленню світла. Щоб отримати інструкції щодо перевірки та очищення кінця роз'єму волоконно-оптичних кабелів, дотримуйтесь вказівок у цій статті бази знань: Забруднення, такі як пил на торці волоконно-оптичного роз'єму, спричиняють низьку роботу вводу-виводу

A41844     2024-08-12 10:45:54  112   INFORMATIONAL  Host link down. (port: 1)
A41853     2024-08-12 10:46:30  111   INFORMATIONAL  Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric)

A42131     2024-10-13 18:44:37  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 1, type: )
A42132     2024-10-13 18:46:44  663   RESOLVED       The host link PHY error count has been resolved. (port: 1, type: resolved)

Версія мікропрограми масиву PowerVault ME5 ME5 і пізніших версій ME5.1.2.1.0 і пізніших версій контролює показник невірної кількості слів при передачі портів FC. Це значення лічильника означає, що слово не було успішно передано, що призвело до помилок кодування. Це значення лічильника не відображається в PowerVault Manager або CLI, однак воно записується в журналі налагодження кожного контролера сховища (SC). Журнали налагодження SC контролера збираються в пакеті підтримки PowerVault ME. Дивіться PowerVault ME5: Як збирати журнали підтримки PowerVault

Якщо це повідомлення про помилку спостерігається часто, оператори можуть вжити таких заходів:

  1. Огляньте установку волоконно-оптичного кабелю та належним чином очистіть торець роз'єму волоконно-оптичного кабелю та стежте за журналами історії подій на предмет повторних подій 663. Див. Забруднення, такі як пил на торці волоконно-оптичного роз'єму, спричиняють низьку роботу вводу-виводу.

  2. Якщо очищення роз'ємів волоконно-оптичного кабелю не вирішить проблему, замініть справний приймач-передавач і волоконно-оптичний кабель. Переконайтеся, що деталі не пошкоджені та з ними правильно поводяться.

  3. Якщо заміна приймачів-передавачів не усуває симптом, операторам слід використовувати перевірені приймачі-передавачі, як зазначено в матриці підтримки систем зберігання даних серії Dell PowerVault ME5, в іншому випадку зверніться до свого постачальника за підтримкою.

  4. У рідкісних випадках операторам, які використовують комутатори старшого покоління 8 Gb FC, може знадобитися налаштувати налаштування порту перемикачаCfgFillword . Дивіться розділ «Додаткова інформація» нижче.

Контролери, що використовують зовнішні порти SCSI (SAS) з послідовним підключенням

Кожне з'єднання SAS між хостом і контролером утворює порт SAS, який складається з більш ніж одного фізичного каналу зв'язку (PHY). Кожен PHY являє собою набір з чотирьох проводів, які використовуються як дві пари диференціальних сигналів, що дозволяє передавати дані в обох напрямках одночасно.

Зазвичай це не впливає на обробку вводу/виводу, подія очікується, коли кабелі SAS вставляються під час формування каналу SAS. У резервних конфігураціях контролера подія 663 записується одночасно на обох контролерах, коли підключений хост-сервер завантажується та завантажує драйвер SAS своєї хост-операційної системи. Подальші дії оператору не потрібні.

Додаткові міркування:
Де контролери PowerVault ME підключаються до Dell SAS HBA355e. З'єднання порту хост-сервера можуть бути розподілені відповідно до звіту PowerVault серії ME5 Порт хоста погіршується при підключенні до контролера Dell HBA355e SAS Після зміни використовувалися порти SAS або SAS HBA. За допомогою PowerVault Manager перевірте, що ідентифікатор ініціатора порту WWN зіставлено з правильними хостами та томами.

Переконайтеся, що кабелі SAS надійно вставлені, обережно потягнувши за кожен кінець кабелю SAS. Якщо кабель SAS втрачається з порту, встановіть його правильно. Ви можете почути клацання, коли засувка роз'єму закріплена. Якщо роз'єм кабелю SAS не може бути належним чином закріплений, перевірте, який слот PCI-e використовується на хост-сервері, розташування слота SAS HBA в корпусі може перешкоджати вставленню роз'єму. Детальніше дивіться моделі PowerEdge 16G: Вибір слота HBA355e PCI-e

Приклад журналу історії подій PowerVault ME5 під час перезавантаження хоста, підключеного до SAS. Обидва контролери записують подію, а остання подія в послідовності вказує на те, що питання вирішено.

B1473      2024-08-15 09:55:22  112   INFORMATIONAL  Host link down. (port: 2)
A3538      2024-08-15 09:55:26  112   INFORMATIONAL  Host link down. (port: 2)

B1483      2024-08-15 09:55:29  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)
A3547      2024-08-15 09:55:32  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)


A3911      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
B1640      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
A3912      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
B1641      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
A3913      2024-10-22 10:12:58  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
B1642      2024-10-22 10:13:33  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
A3914      2024-10-22 10:15:00  663   RESOLVED       The host link PHY error count has been resolved. (port: 2, type: resolved)

 

Additional Information

Оператори, які використовують комутатори Connectrix або Brocade FC старшого покоління, які підтримують 8 Гб, можуть налаштувати параметр заповнення за допомогою portCfgFillword команда. Коли були введені комутатори на 8 Гб, ARBff був прийнятий замість IDLE, головним чином тому, що він міг сприяти зниженню бітової похибки. IDLE, який використовується для ініціалізації, також було змінено на ARBff, разом зі зміною заповнення слова.

Оператори комутаторів FC старшого покоління, які продовжують використовувати їх у виробництві, можуть спостерігати збільшення лічильників кількості невірних слів передачі і їм потрібно встановити значення portcfgfillword, щоб завжди використовувати ARBff. На перемикачі Brocade це вихід «portcfgfillword --help."

admin> portcfgfillword --help

Usage: portCfgFillWord [SlotNumber/]PortNumber Mode  [Passive]

Mode: 0/-idle-idle      - IDLE in Link Init, IDLE as fill word (default)

          1/-arbff-arbff   - ARBFF in Link Init, ARBFF as fill word

          2/-idle-arbff    - IDLE  inLink Init, ARBFF as fill word (SW)

          3/-aa-then-ia  - If ARBFF/ARBFF failed, then do IDLE/ARBFF

Passive: 0/1

admin>

0: Use IDLE for initialization as 4Gb switches do.

1: Always use ARBff.

2: Use IDLE for initialization and use ARBff for between data frames.

3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000240288
Article Type: How To
Last Modified: 19 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.