PowerVault ME5: Liczba błędów łącza PHY hosta jest większa niż próg błędu
Summary: Operatorzy urządzeń PowerVault ME5 mogą sporadycznie obserwować komunikaty o liczbie błędów łącza PHY hosta 663 w dzienniku historii zdarzeń podczas korzystania z portów frontonu kanału światłowodowego lub kontrolera SAS podłączonych do hostów lub przełączników. To zdarzenie zostało wprowadzone w oprogramowaniu wewnętrznym ME5 w wersji ME5.1.2.1.0 i nowszych. ...
Instructions
W zależności od konfiguracji modułu kontrolera PowerVault serii ME5 przejdź do odpowiedniej sekcji w tym artykule.
- Moduły kontrolera korzystające z portów frontonu kanału światłowodowego (FC)
- Moduły kontrolera korzystające z portów frontonu Serial Attached SCSI (SAS)
Kontrolery korzystające z portów frontonu kanału światłowodowego (FC)
Operatory macierzy PowerVault serii ME5 z modułami kontrolerów podłączonymi za pomocą przekaźników SFP kanału światłowodowego (FC) mogą wymagać podjęcia działań naprawczych w celu rozwiązania tego problemu. Często nie ma to wpływu na przetwarzanie we/wy, jednak komunikat jest wczesną zapowiedzią problemu z konfiguracją, a potencjalnie ze sprzętem lub połączeniem z przekaźnikiem SFP lub kablem światłowodowym.
W większości przypadków można to łatwo rozwiązać, prawidłowo czyszcząc powierzchnię czołową złącza LC na kablu światłowodowym w celu usunięcia kurzu lub innych zanieczyszczeń utrudniających refrakcję światła. Aby uzyskać instrukcje dotyczące sprawdzania i czyszczenia powierzchni czołowych złączy kabli światłowodowych, postępuj zgodnie ze wskazówkami zawartymi w tym artykule bazy wiedzy: Zanieczyszczenia, takie jak kurz na powierzchni czołowej złącza światłowodowego, powodują słabe działanie operacji we/wy
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Oprogramowanie wewnętrzne macierzy PowerVault ME5 w wersji ME5.1.2.1.0 lub nowszej monitoruje wskaźnik Nieprawidłowa liczba słów transmisji portów FC. Ta wartość licznika oznacza, że słowo nie zostało pomyślnie przesłane, co spowodowało błędy kodowania. Ta wartość liczników nie jest wyświetlana w programie PowerVault Manager ani w interfejsie wiersza poleceń, jednak jest rejestrowana w dzienniku debugowania każdego kontrolera pamięci masowej (SC). Dzienniki debugowania kontrolera SC są gromadzone w pakiecie pomocy technicznej PowerVault ME. Patrz PowerVault ME5: Zbieranie wpisów do dziennika diagnostyki PowerVault:
Jeśli ten komunikat o błędzie jest często obserwowany, jako operator możesz podjąć następujące działania:
-
Sprawdź instalację kabla światłowodowego i odpowiednio wyczyść powierzchnię czołową złącza kabla światłowodowego oraz monitoruj dzienniki historii zdarzeń pod kątem powtarzających się wystąpień zdarzenia 663. Patrz Zanieczyszczenia, takie jak kurz na powierzchni czołowej złącza światłowodowego, powodują słabe działanie operacji we/wy
-
Jeśli wyczyszczenie złączy kabla światłowodowego nie rozwiąże problemu, zastosuj znany sprawny przekaźnik i kabel światłowodowy. Upewnij się, że części nie są uszkodzone i są obsługiwane prawidłowo.
-
Jeśli wymiana przekaźników nie rozwiązuje problemu, operatorzy powinni skorzystać ze sprawdzonych przekaźników wymienionych w sekcji Matryca zgodności systemów pamięci masowej Dell PowerVault serii ME5, a w przeciwnym razie skontaktować się z ich dostawcą w celu uzyskania pomocy.
-
W rzadkich przypadkach operatorzy, którzy używają przełączników FC starszej generacji 8 Gb/s, mogą być zmuszeni do dostosowania ustawienia portCfgFillword przełącznika. Zapoznaj się z poniższą sekcją Dodatkowe informacje.
Kontrolery korzystające z portów frontonu Serial Attached SCSI (SAS)
Każde połączenie kablowe SAS między hostem a kontrolerem tworzy port SAS, który składa się z więcej niż jednego łącza fizycznego (PHY). Każde łącze PHY to zestaw czterech przewodów używanych jako dwie pary sygnałów różnicowych, umożliwiający jednoczesne przesyłanie danych w obu kierunkach.
Zazwyczaj nie ma to wpływu na przetwarzanie we/wy; zdarzenie jest oczekiwane, gdy kable SAS są podłączane podczas tworzenia łącza SAS. W przypadku konfiguracji z kontrolerami nadmiarowymi zdarzenie 663 jest rejestrowane jednocześnie na obu kontrolerach podczas rozruchu podłączonego serwera hosta i ładowania sterownika SAS systemu operacyjnego. Operator nie musi podejmować żadnych dalszych działań.
Więcej informacji na ten temat:
Gdzie kontrolery PowerVault ME są podłączone do Dell SAS HBA355e. Połączenia portów serwera hosta mogą być rozdzielane zgodnie z artykułem PowerVault serii ME5 zgłasza niesprawność porta hosta po podłączeniu do kontrolera Dell SAS HBA355e. Po zmianie SAS HBA serwera lub użyciu portów SAS HBA. Użyj programu PowerVault Manager, aby sprawdzić, czy identyfikator WWN inicjatora portów jest zmapowany na prawidłowe hosty i woluminy.
Upewnij się, że kable SAS są prawidłowo podłączone, delikatnie pociągając za każdy koniec kabla SAS. Jeśli kabel SAS wysunie się z portu, wsuń go ponownie i podłącz prawidłowo. Po zablokowaniu zatrzasku złącza może być słyszalne kliknięcie. Jeśli złącza kabla SAS nie da się prawidłowo zablokować, sprawdź, które gniazdo PCI-e jest używane na serwerze hosta, ponieważ gniazdo SAS HBA w obudowie może utrudniać włożenie złącza. Aby uzyskać szczegółowe informacje, zobacz Modele PowerEdge 16. generacji: Wybór gniazda PCI-e HBA355e
Przykładowy dziennik historii zdarzeń PowerVault ME5 po ponownym uruchomieniu hosta podłączonego przez SAS. Oba kontrolery rejestrują zdarzenie, a ostatnie zdarzenie w sekwencji wskazuje, że problem został rozwiązany.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Operatorzy korzystający z przełączników Connectrix lub Brocade FC starszej generacji, które obsługują szybkość 8 Gb/s, mogą skonfigurować ustawienie fillword za pomocą polecenia portCfgFillword . Kiedy wprowadzono przełączniki 8 Gb/s, przyjęto protokół ARBff zamiast IDLE, głównie dlatego, że mógł przyczynić się do zmniejszenia liczby błędów w bitach. Protokół IDLE, który był używany do inicjowania, został również zmieniony na ARBff, wraz ze zmianą fillword.
Operatorzy przełączników FC starszej generacji, którzy nadal używają ich w środowisku produkcyjnym, mogą zaobserwować wzrost liczby nieprawidłowych słów transmisji i muszą ustawić wartość portcfgfillword tak, aby zawsze używać ARBff. Na przełączniku Brocade jest to wyjście „portcfgfillword --help”.
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.