PowerEdge: Při restartování ze systému Ubuntu 22.04 se síťovou kartou Solarflare XtremeScale X2522 dochází k závažné chybě sběrnice R7625
Summary: Tento článek obsahuje řešení závažné chyby sběrnice PowerEdge R7625, ke které dochází při restartování ze systému Ubuntu 22.04 pomocí síťové karty Solarflare XtremeScale X2522.
Symptoms
Při restartování systému Ubuntu 20.04 na serveru PowerEdge R7525 se síťovou kartou Solarflare XtremeScale X2522 dochází k závažné chybě sběrnice, přihlaste se k operačnímu systému a zkontrolujte, zda síťová karta funguje. Níže je uveden snímek obrazovky s fatální chybou protokolu systémových událostí.
1. Kontrola protokolu TSR Komponenta PCIe slot7 je síťová karta Solarflare XtremeScale X2522.


2. Při restartování dojde k závažné chybě sběrnice protokolu Lifecycle.
2023-07-31 10:21:37 86 CPU9000 An OEM diagnostic event occurred. 2023-07-31 10:21:36 85 PCI1318 A fatal error was detected on a component at bus 224 device 1 function 1. 2023-07-31 10:21:34 84 PCI1360 A bus fatal error was detected on a component at slot 7. 2023-07-31 10:21:31 83 PST0090 A problem was detected related to the previous server boot. 2023-07-31 10:20:45 82 SYS1005 The server power action is initiated because the host device initiated a warm-reset operation. 2023-07-31 10:20:06 81 SYS1003 System CPU Resetting.
3. Kontrola objednávky síťové karty je objednávka třetí strany, karta jiného výrobce než společnosti Dell.
4. aktualizujte firmware síťové karty Solarflare XtremeScale X2522 na nejnovější verzi a znovu nainstalujte server Ubuntu 22.04. Poté restartujte test operačního systému, závažná chyba sběrnice přetrvávala.
5. Síťová karta Solarflare XtremeScale X2522 se přesouvá do slotu PCIe 4 a restartuje operační systém. Ve slotu 4 byla zjištěna fatální chyba sběrnice. Sledujte síťovou kartu.
6. Pokus o aktualizaci ovladače síťové karty byl neúspěšný.
7. Zkuste nainstalovat Windows 2019 a CentOS 7.9, poté restartujte test operačního systému, nedojde k žádným fatálním chybám sběrnice.
Cause
Resolution
Nevyměňujte žádný hardware***
1.Jedná se o kosmetický problém, který lze bez obav ignorovat. K problému dochází pouze při restartování serveru z operačního systému Ubuntu 22.04.
2. V tomto případě platí pro odkládací instalaci CentOS 7.9 normální.
Alternativní řešení:
Ve webovém rozhraní řadiče iDRAC vymažte protokol systémových událostí, chybovou zprávu lze ignorovat.