PowerVault ME5: Počet chyb fyzického spojení hostitele překračuje prahovou hodnotu chyb
Summary: Operátoři zařízení PowerVault ME5 mohou v protokolu historie událostí zaznamenat občasné zprávy o počtu chyb PHY připojení hostitele 663 při použití frontendových portů řadiče Fibre Channel nebo SAS připojených k hostitelům nebo přepínačům. Tato událost byla zavedena ve firmwaru ME5 verze ME5.1.2.1.0 a vyšší. ...
Instructions
V závislosti na konfiguraci modulu řadiče PowerVault řady ME5 přejděte k příslušné části tohoto článku.
- Moduly řadiče využívající frontendové porty Fibre Channel (FC)
- Moduly řadiče využívající frontendové porty SAS (Serial Attached SCSI)
Řadiče používající frontendové porty Fibre Channel (FC)
Operátoři polí řady PowerVault ME5 s moduly řadičů připojenými pomocí transceiverů SFP Fibre Channel (FC) mohou vyžadovat nápravnou akci, která tento příznak vyřeší. Často to nemá vliv na zpracování I/O, ale zpráva je včasnou indikací problému s konfigurací, hardwarem nebo připojením k transceiveru SFP či optickému kabelu.
Ve většině případů lze tento problém snadno vyřešit správným vyčištěním čelní plochy LC konektoru na optickém kabelu, aby se odstranil prach nebo jiné nečistoty, které brání lomu světla. Pokyny ke kontrole a čištění čelní plochy konektoru optických kabelů naleznete v tomto článku znalostní databáze: Nečistoty, jako je prach na čelní ploše konektoru z optických vláken, způsobují špatný výkon operací IO
A41844 2024-08-12 10:45:54 112 INFORMATIONAL Host link down. (port: 1) A41853 2024-08-12 10:46:30 111 INFORMATIONAL Host link up. (port: 1, speed: 32 Gbps, point-to-point, fabric) A42131 2024-10-13 18:44:37 663 ERROR The host link PHY error count is greater than the error threshold. (port: 1, type: ) A42132 2024-10-13 18:46:44 663 RESOLVED The host link PHY error count has been resolved. (port: 1, type: resolved)
Verze firmwaru pole PowerVault ME5 ME5.1.2.1.0 a novější monitorují metriku Invalid Transmission Word Count u portů FC. Tato hodnota čítače znamená, že slovo nebylo úspěšně přeneseno, což vedlo k chybám kódování. Tato hodnota čítačů se nezobrazuje v nástroji PowerVault Manager ani v rozhraní příkazového řádku, je však zaznamenána v každém protokolu ladění řadičů úložiště (SC). Protokoly ladění SC se shromažďují v rámci balíčku podpory PowerVault ME. Viz článek PowerVault ME5: Postup shromažďování protokolů podpory PowerVault
Pokud se tato chybová zpráva zobrazuje často, mohou operátoři provést následující akce:
-
Zkontrolujte instalaci optického kabelu, řádně očistěte čelní plochu konektoru optického kabelu a sledujte v protokolech historie událostí, zda se událost 663 nevyskytuje opakovaně. Viz Nečistoty, jako je prach na čelní ploše konektoru z optických vláken, způsobují špatný výkon operací IO
-
Pokud čištění konektorů optického kabelu problém nevyřeší, použijte náhradní transceiver a optický kabel, o kterých bezpečně víte, že fungují. Ujistěte se, že díly nejsou poškozené a je s nimi správně zacházeno.
-
Pokud výměna transceiverů příznak nevyřeší, měli by operátoři použít ověřené transceivery uvedené v matici podpory úložného systému Dell PowerVault řady ME5. V opačném případě kontaktujte výrobce a vyžádejte si podporu.
-
Ve vzácných případech může být nutné, aby operátoři, kteří používají 8Gb přepínače FC starší generace, upravili nastavení portCfgFillword. Viz část „Další poznámky“ níže.
Řadiče používající frontendové porty SAS (Serial Attached SCSI)
Každé kabelové připojení SAS mezi hostitelem a řadičem tvoří port SAS, který se skládá z více než jednoho fyzického spojení (PHY). Každé fyzické spojení je sada čtyř vodičů, které se používají jako dva diferenciální páry signálů a umožňují přenos dat v obou směrech současně.
Obvykle to nemá vliv na zpracování operací I/O, tato událost se očekává při vložení kabelů SAS při vytváření spojení SAS. U konfigurací s redundantním řadičem je událost 663 zaznamenána současně na obou řadičích, když se připojený hostitelský server spouští a načítá ovladač SAS hostitelského operačního systému. Operátor nemusí provádět žádné další kroky.
Další důležité informace:
Pokud jsou řadiče PowerVault ME připojeny k adaptéru Dell SAS HBA355e, připojení hostitelských portů serveru lze rozdělit podle článku Řada PowerVault ME5 hlásí zhoršený stav hostitelského portu při připojení k řadiči SAS Dell HBA355e po změně serveru SAS HBA nebo použití portů SAS HBA. Pomocí nástroje PowerVault Manager zkontrolujte, zda je ID WWN iniciátoru portu namapováno na správné hostitele a svazky.
Jemným zatažením za oba konce kabelu SAS se ujistěte, že jsou kabely SAS bezpečně zasunuty. Pokud se kabel SAS z portu uvolní, znovu jej správně usaďte. Po zajištění západky konektoru se ozve cvaknutí. Pokud konektor kabelu SAS nelze řádně zajistit, zkontrolujte, který slot PCI-e se používá na hostitelském serveru. Poloha slotu adaptéru SAS HBA v šasi může bránit vložení konektoru. Podrobnosti najdete v části Modely PowerEdge 16G: Výběr slotu HBA355e PCI-e
Ukázkový protokol historie událostí úložiště PowerVault ME5 při restartování hostitele připojeného k portu SAS. Oba řadiče zaznamenají událost a poslední událost v pořadí značí, že problém je vyřešen.
B1473 2024-08-15 09:55:22 112 INFORMATIONAL Host link down. (port: 2) A3538 2024-08-15 09:55:26 112 INFORMATIONAL Host link down. (port: 2) B1483 2024-08-15 09:55:29 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3547 2024-08-15 09:55:32 111 INFORMATIONAL Host link up. (port: 2, type: SAS) A3911 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) B1640 2024-10-22 10:10:46 354 WARNING Host SAS topology was changed. (host port: 2, 0 out of 4 PHYs are up, link speed: Autonegotiated) A3912 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) B1641 2024-10-22 10:11:55 354 INFORMATIONAL Host SAS topology was changed. (host port: 2, 4 out of 4 PHYs are up, link speed: 12 Gbps) A3913 2024-10-22 10:12:58 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) B1642 2024-10-22 10:13:33 663 ERROR The host link PHY error count is greater than the error threshold. (port: 2, type: disparity errors, lost dword count, invalid dword count) A3914 2024-10-22 10:15:00 663 RESOLVED The host link PHY error count has been resolved. (port: 2, type: resolved)
Additional Information
Operátoři používající přepínače Connectrix nebo Brocade FC starší generace s podporou 8 Gb mohou nakonfigurovat nastavení placeholderu pomocí příkazu portCfgFillword . Když byly zavedeny 8Gb přepínače, placeholder ARBff byl přijat místo IDLE hlavně proto, že mohl přispět k nižší bitové chybě. IDLE, který se používá pro inicializaci, byl také změněn na ARBff spolu se změnou placeholderu.
Operátoři přepínačů FC starší generace, kteří je nadále používají v produkčním prostředí, mohou zaznamenat nárůst čítačů Invalid Transmission Word Count a musí nastavit hodnotu portcfgfillword tak, aby vždy používala ARBff. Na přepínači Brocade se jedná o výstup „portcfgfillword --help.“
admin> portcfgfillword --help
Usage: portCfgFillWord [SlotNumber/]PortNumber Mode [Passive]
Mode: 0/-idle-idle - IDLE in Link Init, IDLE as fill word (default)
1/-arbff-arbff - ARBFF in Link Init, ARBFF as fill word
2/-idle-arbff - IDLE inLink Init, ARBFF as fill word (SW)
3/-aa-then-ia - If ARBFF/ARBFF failed, then do IDLE/ARBFF
Passive: 0/1
admin>
0: Use IDLE for initialization as 4Gb switches do.
1: Always use ARBff.
2: Use IDLE for initialization and use ARBff for between data frames.
3: Use ARBff for initialization first. If it fails, use IDLE. Use ARBff for between data frames.