Data Domain: Odstraňování problémů s nefunkčními rozhraními či jejich občasnými výpadky u uživatelů
Summary: V tomto článku se zaměříme především na odstraňování problémů s nefunkčním rozhraním, více nefunkčními rozhraními, občasnými výpadky rozhraní a vadnou síťovou kartou. Výměna dílů by měla být posledním krokem při odstraňování problémů s výpadky rozhraní. Když jako první zkontrolujete například stav přepínače a odstraníte příslušné problémy, může jít o nejrychlejší řešení. ...
Instructions
- Zjistěte, zda se problém týká jednoho rozhraní, více rozhraní, občasného výpadku rozhraní nebo síťové karty.
- Určete, zda je rozhraní neaktivní, občas vypadává, nereaguje nebo dochází k problému se síťovou kartou.
- Link Status No je rozhraní, které nedostává žádný elektrický signál a je mimo provoz.
- K občasným výskytům dochází v nepravidelných intervalech, nejedná se o nepřetržitý či pevně daný stav.
- Chcete-li zkontrolovat stav hardwarových rozhraní v systému Data Domain, spusťte příkaz:
# net show hardware
- Chcete-li zkontrolovat aktuální výstrahy, spusťte příkaz:
# alerts show current
- Chcete-li zkontrolovat historii výstrah, spusťte příkaz:
# alerts show history
- Zkontrolujte příkaz „net show settings“ a zjistěte, zda je rozhraní mimo provoz součástí virtuálního spojení, sítě VLAN nebo aliasu.
# net show settings
POZNÁMKA: Aby rozhraní mělo kontrolku spojení a fungovalo, musí být nakonfigurováno pomocí IP adresy nebo spojení. - Pokud je rozhraní neaktivní po upgradu systému DDOS, je velmi nepravděpodobné, že by došlo k selhání hardwaru.
- Pokud rozhraní mimo provoz není ve spojení, můžete jej zakázat a povolit pomocí následujících příkazů.
# net disable ethXx # net enable ethXx
- Před otevřením případu u podpory společnosti Dell důrazně doporučujeme, abyste se síťovým týmem zkontrolovali konfiguraci přepínače.
- Během upgradu se rozhraní odpojí od sítě a občas dojde k vypršení časového limitu přepínače, když rozhraní DD nereaguje, a zakázání portů.
- Pokud vypršel časový limit a došlo k zakázání portů přepínače, podpora Data Domain vám s tím nemůže pomoci a je nutné kontaktovat síťový tým, abyste je mohli opět povolit.
- Pokud máte v datovém centru pracovníky na místě, požádejte terénního technika, aby se dostavil na místo a znovu usadil SFP nebo kabel jak na straně systému DD, tak propojovacího panelu nebo přepínače.
- Pokud jste nakonfigurovali nové rozhraní v systému Data Domain, ale nespouští se, zkontrolujte, zda je k propojovacímu panelu nebo k přepínači připojen kabel.
- Pokud se po prvním nastavení systému Data Domain rozhraní nespustí, ujistěte se, že je nastavena správná rychlost a konfigurace portu na straně přepínače.
- U rozhraní 10G v systému Data Domain by měl být přepínač také nastaven na rychlost 10G.
- U rychlostí 1G v systému Data Domain, je-li přepínač nastaven na rychlost 10G, to nefunguje a může být více kompatibilní pro automatické vyjednávání na přepínači.
- Pokud poprvé nastavujete systém Data Domain s optickými nebo měděnými rozhraními DA, ujistěte se, že máte kompatibilní SFP a kabely.
- Pokud po restartu nebo upgradu systému hlásí aktuální výstrahy „MissingSlave“ a rozhraní jsou nefunkční, restartujte systém Data Domain znovu.
Příkladp0-96 Tue Oct 24 16:47:52 2023 CRITICAL Network MissingSlave=veth0_eth1a EVT-NETM-00012: Network interface eth1a is missing. This is a physical interface for veth0.
- Jedná se o selhání hardwaru nebo falešnou výstrahu kvůli konfliktu časování, ve kterém některé komponenty a vrstvy přešly do režimu online v nesprávném pořadí.
- Pokud se po druhém restartování výstraha MissingSlave nevymaže a rozhraní jsou stále mimo provoz, otevřete případ u podpory hardwaru Data Domain.
- Chcete-li získat výstup s typem nainstalované síťové karty, spusťte následující příkazy:
# system show hardware # enclosure show io-cards
- Chcete-li zobrazit minulé případy automatické podpory a porovnat je s aktuálním stavem, přihlaste se do uživatelského rozhraní a přejděte do části Maintenance > Support > Autosupport reports.
Zde se zobrazí 14 minulých případů automatické podpory, které si můžete stáhnout a otevřít pomocí aplikace Notepad++. - Pokud rozhraní náhle přestalo fungovat a nebylo to v důsledku restartu nebo upgradu, může se také jednat o špatný kabel nebo SFP.
POZNÁMKA: Podpora hardwaru Dell nevyměňuje kabely ani SFP na straně propojovacího panelu zákazníkova přepínače. Výměna kabelů a SFP na straně datového centra je odpovědností zákazníka.
- Obraťte se na pracovníky datového centra a požádejte je o přesazení kabelu nebo SFP.
- Pokud se po přesazení stále nerozsvítí žádná kontrolka spojení, nechte u datového centra vyměnit kabel a optické SFP na straně přepínače.
- Pokud vyměníte kabel a optické SFP, nechte u datového centra zkontrolovat port na propojovacím panelu nebo přepínači a zkuste jiný port.
- Pokud jste provedli všechny kroky a problém přetrvává, otevřete hardwarovou skříň Dell a vyměňte SFP na straně systému DD.
- Kroky odstraňování problémů, pokud je rozhraní, které je nefunkční, součástí virtuálního spojení.
- Pokud rozhraní není funkční po upgradu nebo restartu, požádejte síťový tým, aby zakázal a povolil port přepínače.
- Pokud váš síťový tým zkontroloval port přepínače, zakázal port a povolil jej, můžete to zkusit také na straně systému Data Domain.
- Na straně systému Data Domain můžete zakázat virtuální spojení a znovu jej povolit pomocí následujících příkazů.
# net disable vethXx # net enable vethXx
- Rozhraní můžete ze spojení odebrat a poté jej do něj opět přidat. To lze provést z uživatelského rozhraní nebo příkazového řádku.
#net aggregate del vethX interface ethXx #net aggregate add vethX interface ethXx
#net failover del vethX interfaces ethXx #net failover add vethX interfaces ethXx
- Pokud odebrání a přidání rozhraní problém nevyřeší, zkuste virtuální spojení zrušit a znovu jej vytvořit.
POZNÁMKA: Při zrušení celého spojení buďte opatrní, vždy se je třeba ujistit, že máte redundanci a že jste kromě spojení připojeni i k jinému připojení SSH.To lze provést z uživatelského rozhraní, což je jednodušší.
Pokud nechcete zrušit virtuální spojení a je to vaše jediné připojení k systému Data Domain, nepokračujte.
Data Domain – konfigurace fyzických rozhraní pomocí grafického uživatelského rozhraní (UI) - Pokud zrušení a opětovné vytvoření virtuálního spojení rozhraní nezprovozní, zrušte je znovu a přiřaďte rozhraním IP adresy.
Pokud rozhraní přiřadíte IP adresu a ono se zprovozní, pak s největší pravděpodobností není strana přepínače správně nakonfigurována. To je mimo rozsah podpory systému Data Domain a nejlepší je kontaktovat síťový tým. - Kroky pro odstraňování problémů, pokud je rozhraní stále mimo provoz.
- Obraťte se na pracovníky datového centra a požádejte je o přesazení kabelu nebo SFP.
- Pokud se po přesazení stále nerozsvítí žádná kontrolka spojení, nechte u datového centra vyměnit kabel a optické SFP na straně přepínače.
- Pokud vyměníte kabel a optické SFP, nechte u datového centra zkontrolovat port na propojovacím panelu nebo přepínači a zkuste jiný port.
- Pokud jste provedli všechny kroky a problém přetrvává, otevřete hardwarovou skříň Dell a vyměňte SFP na straně systému DD.
POZNÁMKA: Podpora hardwaru Dell nevyměňuje kabely ani SFP na straně propojovacího panelu zákazníkova přepínače. Výměna kabelů a SFP na straně datového centra je odpovědností zákazníka.
- Pokud máte v datovém centru pracovníky na místě, měli by provést tyto kroky odstraňování problémů.
- Ověřte, zda je kabel řádně připojen k systému Data Domain a k portu přepínače nebo portu propojovacího panelu.
- Pokud je to možné, vysledujte kabel a ujistěte se, že je připojen ke správnému portu na zadní straně systému Data Domain.
- Zkontrolujte, zda na portu přepínače nebo portu propojovacího panelu svítí kontrolka spojení.
- Pokud na portu Data Domain nesvítí kontrolka spojení, přesaďte kabel.
- Pokud na zadní straně portu propojovacího panelu nebo portu přepínače nesvítí kontrolka spojení, odpojte a znovu připojte kabel.
- Pokud po opětovném připojení na straně systému Data Domain a portu propojovacího panelu nebo portu přepínače není k dispozici žádné spojení, vyměňte kabel.
- Pokud jsou na místě terénní pracovníci, můžete je také instruovat, aby přepojili funkční kabel rozhraní do portu rozhraní, který je v systému Data Domain nefunkční.
Po výměně by se měla rozsvítit kontrolka spojení a v systému Data Domain by měl příkaz „net show hardware“ zobrazit výstup „link yes“.# net show hardware
- Pokud se při výměně rozsvítí kontrolka spojení, problém musí spočívat ve špatném SFP v systému Data Domain, špatném kabelu, špatném SFP na straně přepínače nebo špatném portu na straně přepínače propojovacího panelu.
- Dalším krokem odstraňování problémů pro pracovníky datového centra je provedení testu zpětné smyčky.
- Pokud je v systému Data Domain volné nenakonfigurované rozhraní stejného typu, vytvořte smyčku z jednoho rozhraní na druhé.
Pokud je například eth1a měděné a eth4a také měděné, ale nepoužívá se, připojte eth1a k eth4a.
Rozhraní eth4a je nutné nakonfigurovat pomocí fiktivní IP adresy, která může vypadat libovolně, například# net config eth4a 1.2.3.4 netmask 255.255.255.0
Po dokončení testu zpětné smyčky vymažte konfiguraci pro fiktivní IP adresu.# net config eth4a 0.0.0.0
- Pokud test zpětné smyčky nefunguje a SFP nebo kabely či oboje byly nahrazeny, otevřete případ u týmu podpory hardwaru Data Domain.
- Pokud je v systému Data Domain volné nenakonfigurované rozhraní stejného typu, vytvořte smyčku z jednoho rozhraní na druhé.
- Ověřte, zda je kabel řádně připojen k systému Data Domain a k portu přepínače nebo portu propojovacího panelu.
-
Odstraňování problémů s fyzickými rozhraními optických vláken a přímo připojenými měděnými rozhraními.
Níže uvedené příklady nemusí vypadat přesně stejně jako váš výstup.
Příklad výstupu fyzického rozhraní optických vláken.sysadmin@dd3300-ddsupport# net show hardware Port Speed Duplex Supp Speeds Hardware Address Physical Link Status State Autonegotiation ----- -------- ------- ----------- ----------------- -------- ----------- ------- --------------- eth1b unknown unknown 1000/10000 00:0c:29:46:fc:1b Fiber no up on ----- -------- ------- ----------- ----------------- -------- ----------- ------- ---------------
Příklad výstupu fyzického měděného rozhraní DA.sysadmin@ddsupport# net show hardware Net Show Hardware ----------------- Port Speed Duplex Supp Speeds Hardware Address Physical Link Status ----- ------- ------- ----------- ----------------- --------- ----------- ------- eth8a unknown unknown 25000 34:80:0d:94:70:52 DA Copper no up ----- ------- ------- ----------- ----------------- --------- ----------- -------
Ve většině zákaznických prostředí mají rozhraní optických vláken tři komponenty: SFP na straně systému Data Domain, optický kabel a SFP na straně propojovacího panelu zákazníka nebo přepínače.
Někteří zákazníci však mají například systém Data Domain připojený k propojovacímu panelu, pak rozbočovací kabel, který se připojuje k QSFP, který má další připojení.
Někdy je třeba se zeptat na připojení zákazníka, protože problém nemusí být na straně systému Data Domain k propojovacímu panelu nebo přepínači. Na rozhraní mohou mít vliv další komponenty nebo připojení. -
Pokud se po upgradu vygeneruje upozornění, že na rozhraních dochází k nesouladu rychlostí, zkontrolujte následující informace.
Příklad
Id Post Time Severity Class Object Message ------ ------------------------ -------- ------- ----------------------------- -------------------------------------------------------------------------------- p0-618 Tue Oct 20 09:50:53 2023 CRITICAL Network Bonded Interface Name=veth1 EVT-NETM-00015: One or more interfaces in the bonded group has a speed mismatch. ------ ------------------------ -------- ------- ----------------------------- --------------------------------------------------------------------------------
To by mohlo znamenat, že rychlost jednoho rozhraní ve spojení je nastavena na 100 Mb/s, zatímco jiné rozhraní je nastaveno na 1 000 Mb/s.
K tomu může dojít z několika důvodů, které nemusí mít se systémem Data Domain nic společného.- Vadný ethernetový kabel.
- Vadný port na propojovacím panelu nebo na přepínači.
- Konfigurace portu přepínače omezuje rychlost.
- Rychlost přepínače je omezena.
- Rozhraní ve virtuálním spojení není správné.
- Rozhraní je připojeno k nesprávnému přepínači nebo portu přepínače.
Zde je postup pro další odstraňování problémů.
Tyto kroky lze provést také v uživatelském rozhraní.
Data Domain – konfigurace fyzických rozhraní pomocí grafického uživatelského rozhraní (UI)- Chcete-li zkontrolovat stav hardwarových rozhraní v systému Data Domain, spusťte příkaz:
# net show hardware
- Chcete-li zkontrolovat aktuální výstrahy, spusťte příkaz:
# alerts show current
- Zkontrolujte příkaz „net show settings“ a zjistěte, zda je rozhraní mimo provoz součástí virtuální sítě VLAN nebo aliasu.
# net show settings
- Pokud je rozhraní neaktivní po upgradu systému DDOS, je velmi nepravděpodobné, že by došlo k selhání hardwaru.
- Chcete-li zkontrolovat stav hardwarových rozhraní v systému Data Domain, spusťte příkaz:
# net disable ethXx # net enable ethXx
- Rozhraní mohlo být dříve chybně nastaveno, ale upozornění se zobrazuje až nyní po upgradu nebo restartu. Můžete zkontrolovat historii.
# alerts show history
- Ověřte si u svého síťového týmu konfiguraci přepínače a překonfigurujte rychlost přepínače nebo automatické vyjednávání.
- Zakažte a povolte port přepínače.
- Zkontrolujte informace LLDP u automatické podpory a zjistěte, zda jsou ve spojení LACP správná rozhraní, pokud se používá protokol LACP.
- Odeberte rozhraní ze spojení.
# net failover del vethX interfaces ethXx
- Nakonfigurujte rozhraní pomocí fiktivní IP adresy.
# net config ethXx 1.2.3.4 netmask 255.255.255.0
- Zkuste rychlost změnit ručně.
POZNÁMKA: V závislosti na rozhraní a modelu systému Data Domain nemusí být možné nastavit rychlost.
#net config ethXx duplex full speed 1000
- Po předchozích krocích vymažte fiktivní IP adresu spuštěním následujícího příkazu.
#net config ethXx 0.0.0.0
- Přidejte rozhraní zpět do spojení.
# net failover add vethX interfaces ethXx
- Pokud problém stále přetrvává, doporučujeme vyměnit kabel a znovu zkontrolovat stranu přepínače.
Seznam důvodů, proč může dojít k výpadku fyzického rozhraní v systému:
Fyzické rozhraní v systému může být mimo provoz z různých důvodů, od problémů s hardwarem až po problémy se sítí. Zde je seznam běžných důvodů:
- Fyzické odpojení kabelu: Kabel propojující rozhraní se sítí nebo jiným zařízením může být fyzicky odpojen, což vede k výpadku rozhraní.
- Nesprávné rozhraní: Kabel je připojen k nesprávnému rozhraní na straně systému Data Domain.
- Nesprávné rozhraní: Kabel je připojen k nesprávnému rozhraní na straně propojovacího panelu a přepínače.
- Selhání hardwaru: Vadné hardwarové součásti, jako jsou síťové karty, přepínače, směrovače nebo kabely, mohou vést k výpadkům rozhraní.
- Problém s napájením: Výkyvy napájení, výpadky nebo nedostatečné napájení síťového zařízení mohou způsobit výpadky rozhraní.
- Přehřívání: Nadměrné teplo může poškodit hardwarové komponenty, což vede k selhání rozhraní a vypnutí systému.
- Zahlcení sítě: Vysoká úroveň síťového provozu nebo zahlcení může přetížit rozhraní a způsobit, že přestane reagovat nebo se vypne.
- Chyby softwaru: Problémy, závady nebo problémy s kompatibilitou v rámci ovladačů zařízení, firmwaru nebo operačního systému mohou vést k selhání rozhraní.
- Chyby konfigurace: Nesprávné síťové konfigurace, například konflikty IP adres nebo nesprávné masky podsítě, mohou způsobit nedostupnost rozhraní.
- Bezpečnostní opatření: Zásady zabezpečení, jako je detekce narušení nebo pravidla firewallu, mohou neúmyslně blokovat nebo omezovat přenosy přes rozhraní.
- Fyzické poškození: Fyzické poškození hardwaru, například kvůli vodě, nárazu nebo opotřebení, může vést k selhání rozhraní.
- Faktory prostředí: Extrémní teploty, vlhkost, prach a další faktory prostředí mohou ovlivnit funkčnost hardwaru a způsobit výpadky rozhraní.
- Aktualizace firmwaru nebo softwaru: Nesprávně použité aktualizace firmwaru nebo softwaru mohou způsobit nestabilitu a vést k selhání rozhraní.
- Síťové útoky: Útoky Denial of Service (DoS), Distributed Denial of Service (DDoS) nebo jiné škodlivé aktivity mohou přetížit rozhraní a způsobit jeho selhání.
- Problémy se směrováním: Nesprávné položky směrovací tabulky nebo problémy s protokoly dynamického směrování mohou narušit připojení prostřednictvím rozhraní.
- Konfigurace fyzického rozhraní: Nesprávná rychlost a duplexní nastavení, problémy s automatickým vyjednáváním nebo neshody konfigurací mezi připojenými zařízeními mohou vést k výpadkům rozhraní.
- Kvalita kabelů: Nekvalitní nebo poškozené kabely mohou vést k přerušovanému připojení nebo selhání celého rozhraní.
- Selhání přepínače nebo směrovače: Selhání síťového vybavení, jako jsou přepínače nebo směrovače, které se připojují k rozhraní, může vést k problémům s rozhraním pro příjem dat.
- Problémy poskytovatele sítě: Pokud se systém připojí k externímu poskytovateli sítě, problémy na jejich straně (údržba, výpadky napájení, chyby konfigurace) mohou způsobit výpadky rozhraní.
- Vyčerpání zdrojů: Nedostatečný výkon paměti nebo výpočetního výkonu systému může vést k selhání rozhraní, zejména v případech s vysokým provozem.
- Fyzické zakázání portu: Ruční nebo automatická akce zakázání fyzického portu správcem, systémem správy sítě nebo zásadami zabezpečení.
- Ztráta signálu optického vlákna: V případě optických připojení může dojít k problémům, jako je ztráta signálu v důsledku ohnutí, znečištění nebo poškození vodičů, což může vést k výpadku rozhraní.
Data Domain – Konfigurace fyzických rozhraní pomocí grafického uživatelského rozhraní (UI)
Data Domain – Konfigurace fyzických rozhraní prostřednictvím rozhraní příkazového řádku (CLI)
Additional Information
Podívejte se na toto video:
Odstraňování problémů se síťovými rozhraními Data Domain
Délka: 00:03:07 (hh:mm:ss)
Je-li k dispozici, lze jazyková nastavení titulků (titulků) zvolit pomocí ikony CC v tomto přehrávači videa.
Toto video můžete také zhlédnout na YouTube.