PowerVault ME5. Количество ошибок PHY канала хоста превышает пороговое значение ошибки

Summary: Операторы PowerVault ME5 могут наблюдать эпизодические сообщения о количестве ошибок счетчика PHY канала хоста по событию 663 в журнале событий при использовании внешних портов Fibre Channel или внешних портов контроллера SAS, подключенных к хостам или коммутаторам. Это событие введено в программном обеспечении ME5 версии ME5.1.2.1.0 и выше. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

В зависимости от конфигурации модуля контроллера серии PowerVault ME5 перейдите к соответствующему разделу настоящей статьи.

Контроллеры, использующие внешние порты Fibre Channel (FC)

Операторам массивов серии PowerVault ME5 с модулями контроллеров, подключенными с помощью приемопередатчиков SFP Fibre Channel (FC), может потребоваться принять корректирующие меры для устранения этого признака. Часто это не влияет на обработку ввода-вывода, однако сообщение служит ранним признаком проблемы конфигурации, потенциальной проблемы с оборудованием или подключением приемопередатчика SFP или оптоволоконного кабеля.

В большинстве случаев это легко устранить, правильно очистив торцевую поверхность разъема LC на оптоволоконном кабеле для удаления пыли или других загрязнений, препятствующих преломлению света. Инструкции по осмотру и очистке торцевой поверхности разъема оптоволоконного кабеля см. в следующей статье базы знаний: Загрязнения, например пыль на торцевой поверхности оптоволоконного разъема, приводят к снижению производительности ввода-вывода

A41844     2024-08-12 10:45:54  112   INFORMATIONAL  Host link down. (port: 1)
A41853     2024-08-12 10:46:30  111   INFORMATIONAL  Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric)

A42131     2024-10-13 18:44:37  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 1, type: )
A42132     2024-10-13 18:46:44  663   RESOLVED       The host link PHY error count has been resolved. (port: 1, type: resolved)

Микропрограмма массива PowerVault ME5 версии ME5.1.2.1.0 и более поздних версий отслеживает метрику Invalid Transmission Word Count в портах FC. Это значение счетчика означает, что слово не передавалось успешно, что вызвало ошибки кодировки. Это значение счетчиков не отображается в PowerVault Manager или интерфейсе командной строки, однако оно записывается в журнал отладки каждого контроллера хранилища (SC). Журналы отладки контроллера SC собираются в пакете поддержки PowerVault ME. См. PowerVault ME5. Как собрать журналы поддержки PowerVault

Если это сообщение ОБ ОШИБКЕ появляется часто, операторы могут выполнить следующие действия:

  1. Осмотреть подключение оптоволоконного кабеля, надлежащим образом очистить торцевую поверхность разъема оптоволоконного кабеля и отслеживать журналы событий на наличие повторяющихся случаев события 663. См. раздел Загрязнения, например пыль на торцевой поверхности оптоволоконного разъема, приводят к снижению производительности ввода-вывода.

  2. Если очистка разъемов оптоволоконного кабеля не помогла устранить проблему, замените заведомо исправный приемопередатчик и оптоволоконный кабель. Убедитесь, что детали не повреждены и с ними правильно обращаются.

  3. Если замена приемопередатчиков не устраняет признак неисправности, операторы должны использовать проверенные приемопередатчики, как указано в таблице поддержки систем хранилищ Dell PowerVault серии ME5, в противном случае обратитесь за поддержкой к своему поставщику.

  4. В редких случаях операторам, использующим коммутаторы FC более старого поколения 8 Гбайт, может потребоваться настроить параметр portCfgFillword коммутатора. См. раздел «Дополнительные примечания» ниже.

Контроллеры, использующие внешние порты Serial Attached SCSI (SAS)

Каждое кабельное подключение хоста к контроллеру SAS формирует порт SAS, который состоит из нескольких физических каналов связи (PHY). Каждый PHY — это набор из четырех проводов, используемых в качестве двух пар дифференциальных сигналов, что позволяет передавать данные в обоих направлениях одновременно.

Обычно это не влияет на обработку операций ввода-вывода, а такое событие ожидается при подключении кабелей SAS по мере формирования канала SAS. В конфигурациях с резервированием контроллера событие 663 записывается одновременно на обоих контроллерах, когда подключенный хост-сервер загружается и загружает драйвер SAS операционной системы хоста. Дальнейшие действия оператора не требуются.

Дополнительные рекомендации.
Если контроллеры PowerVault ME подключены к адаптеру Dell SAS HBA355e. Подключения к портам хост-сервера могут быть распределены в соответствии с отчетом PowerVault серии ME5, порты хоста в состоянии сниженной производительности при подключении к контроллеру Dell HBA355e SAS после изменения используемых HBA-адаптеров SAS или портов HBA-адаптеров SAS сервера. С помощью PowerVault Manager проверьте, что идентификатор WWN инициатора порта сопоставлен с правильными хостами и томами.

Убедитесь, что кабели SAS надежно вставлены, аккуратно потянув за каждый конец кабеля SAS. Если кабель SAS отсоединяется от порта, переустановите его правильно. При фиксации защелки разъема может быть слышен щелчок. Если разъем кабеля SAS не может быть надежно закреплен, проверьте, какой разъем PCI-e используется на хост-сервере, положение разъема HBA-адаптера SAS в корпусе может препятствовать вставке разъема. Дополнительные сведения см. в разделе Модели PowerEdge 16G: Выбор разъема HBA355e PCI-e

Пример журнала событий PowerVault ME5 при перезагрузке подключенного к SAS хоста. Оба контроллера записывают событие, а последнее событие в последовательности указывает на то, что проблема устранена.

B1473      2024-08-15 09:55:22  112   INFORMATIONAL  Host link down. (port: 2)
A3538      2024-08-15 09:55:26  112   INFORMATIONAL  Host link down. (port: 2)

B1483      2024-08-15 09:55:29  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)
A3547      2024-08-15 09:55:32  111   INFORMATIONAL  Host link up. (port: 2, type: SAS)


A3911      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
B1640      2024-10-22 10:10:46  354   WARNING        Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated)
A3912      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
B1641      2024-10-22 10:11:55  354   INFORMATIONAL  Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps)
A3913      2024-10-22 10:12:58  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
B1642      2024-10-22 10:13:33  663   ERROR          The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count)
A3914      2024-10-22 10:15:00  663   RESOLVED       The host link PHY error count has been resolved. (port: 2, type: resolved)

 

Additional Information

Операторы, использующие коммутаторы Connectrix или Brocade FC более старого поколения, которые поддерживают 8 Гбайт, могут настроить параметр заглушки с командой portCfgFillword . Когда были внедрены коммутаторы 8 Гбайт, вместо IDLE использовался ARBff, в основном потому, что это могло привести к ошибке нижнего бита. IDLE, используемый для инициализации, также был изменен на ARBff вместе с изменением заглушки.

Операторы коммутаторов FC более старого поколения, которые продолжают использовать их в производстве, могут заметить увеличение Invalid Transmission Word Count в счетчиках и должны установить значение portcfgfillword на постоянное использование ARBff. На коммутаторе Brocade это вывод «portcfgfillword --help».

admin> portcfgfillword --help

Usage: portCfgFillWord [SlotNumber/]PortNumber Mode  [Passive]

Mode: 0/-idle-idle      - IDLE in Link Init, IDLE as fill word (default)

          1/-arbff-arbff   - ARBFF in Link Init, ARBFF as fill word

          2/-idle-arbff    - IDLE  inLink Init, ARBFF as fill word (SW)

          3/-aa-then-ia  - If ARBFF/ARBFF failed, then do IDLE/ARBFF

Passive: 0/1

admin>

0: Use IDLE for initialization as 4Gb switches do.

1: Always use ARBff.

2: Use IDLE for initialization and use ARBff for between data frames.

3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.

 

Affected Products

ME Series, PowerVault ME5012, PowerVault ME5024, PowerVault ME5084
Article Properties
Article Number: 000240288
Article Type: How To
Last Modified: 19 Nov 2024
Version:  1
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.