PowerEdge: Sådan identificeres og foretages fejlfinding af nogle almindelige årsager til blæserstøj
Oversigt: Denne artikel præsenterer muligheder for at forstå og fejlfinde nogle almindelige årsager til blæserstøj på en PowerEdge-server. Det er også relevant for 100% blæserhastigheder.
Instruktioner
Hvad er nogle af de almindelige årsager til blæserstøj på en PowerEdge-server?
- Blæserfejl, blæser mangler, blæser beskadiget
- Forældet firmware
- Afbrudt kommunikation med den integrerede Dell Remote Access Controller (iDRAC), Baseboard Management Chip (BMC) eller Chassis Management Controller (CMC, OME-M til MX-kabinet)
- Installeret hardware, der ikke understøttes
- En ufuldstændig anden CPU-opgradering (afhængig af systemtype) eller generel opgradering til maskinen, som kræver en anden type blæsere installeret
- Temperaturen overstiger den normale blæserhastighedsdækning (stor arbejdsbyrde, der fører til højt CPU-forbrug og -temperatur, dårlig luftgennemstrømning)
- Systemdækslet er slukket eller monteret forkert. Indtrængningskontakten udløses muligvis eller fungerer ikke.
- Konfigurationsindstillinger
- Indløbstemperatursensor mislykkedes, falsk aflæsning
Blæserfejl, blæser mangler, blæser beskadiget
I dette scenarie er mindst ét blæser- eller blæsermodul (indeholder to blæsere) enten beskadiget (stik, blæserblad, blæserbladramme), mangler eller er defekt.
Følg disse trin i rækkefølge for at identificere det blæsermodul eller den blæser, der forårsager problemet:
- Se den forreste LCD-skærm eller systemets hændelseslog for at se, hvilken blæser der er rapporteret.
- Når den blæser er kendt som defekt, skal du kontrollere blæsernummerets placering på låget (eller se i serverens brugervejledning) og se, om blæseren kører eller ej.
Advarsel: Vær forsigtig, når du åbner låget på serveren uden at slukke for det for at kontrollere blæserne. Elementer indeni kan være varme eller skarpe eller begge dele.
- Hvis ventilatoren drejer langsommere, slet ikke drejer eller laver uregelmæssige lyde (skrabning, rivning), skal du slukke for maskinen og fjerne blæsermodulet til inspektion.
- Scuffing og skrabning af fans skal efterlade synlige ridser.
- Nogle gange kan snavs eller støv få blæseren til at blive uregelmæssig, en rensning af blæseren kan hjælpe i dette tilfælde.
- Kontroller stikket på bundkortet eller blæserkontrolkortet og stikket på blæseren for at se, om nogen af dem er beskadiget.
- Hvis der ikke er nogen blæserskade eller forbindelsesproblemer, skal du genmontere blæseren, afdække (hvis der er nogen) kabinetsdækslet og tænde maskinen igen.
Hvis blæseren stadig rapporteres som defekt, skal du kontrollere den næste mulighed på denne liste.
Video
Identificer problem med PowerEdge-blæseren.
Varighed: 00:00:00 (hh:02:31)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Sådan udskiftes blæseren på PowerEdge R740.
Varighed: 00:00:53 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Forældet firmware
Forældet firmware kan få fans til at dreje højt (lave støj), når intet andet endda er forkert. Det er almindeligt, når dele af firmwaren blev opdateret, og et element i kæden af sensordataindsamling er blevet udeladt fra at blive opdateret.
Følgende er en liste over firmwareversioner, der skal kontrolleres for opdateringer som næste trin i undersøgelsen:
- iDRAC, CPLD, BIOS
- PERC, BOSS, backplane, NVMe-drev, SAS/SATA-drev
- NIC, ethvert andet PCIe-kort
- Strømforsyninger (PSU)
- Anden hardware
Når du vil bruge iDRAC til at opdatere firmware (brug denne artikel til at få mere at vide, hvordan, PowerEdge: Sådan opdaterer du firmware eksternt ved hjælp af iDRAC-webgrænsefladen), vises opdateringerne i importrækkefølge fra venstre mod højre og fra top til bund.
Hvert listeelement skal bruges som vejledning i, hvilke opdateringer der kan opdateres på én gang (dog ikke de første elementer).
Når firmwaren er opdateret, skal du gå videre til næste punkt på listen.
Video
Sådan opdaterer du firmware ved hjælp af iDRAC9.
Varighed: 00:01:16 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Afbrudt kommunikation med den integrerede Dell Remote Access Controller (iDRAC), Baseboard Management Chip (BMC) eller Chassis Management Controller (CMC, OME-M til MX-kabinet)
Når iDRAC, BMC eller CMC/OME-M mister forbindelsen til sensorpakken, vender blæserne tilbage til den ikke-styrede hastighed (fuld) for at beskytte systemet mod overophedning.
Dette er grunden til, at du kan høre ventilatorerne dreje op, før de kommer ned igen, når de først tændes. Det tager et par minutter for iDRAC, BMC eller CMC/OME-M at starte og begynde at regulere blæserhastigheden.
LCD-skærmen (hvis den findes) forbliver uden tekst. Hvis systemtypen er modulær, kan den muligvis ikke tændes i kabinettet, da den ikke kan kommunikere med CMC'en.
I dette tilfælde skal du kontakte vores supportteam.
Gør følgende for at foretage fejlfinding af dette problem:
- På alle iDRAC-systemer skal du trykke på i-knappen og holde den nede i 16 sek.
- For et system med BMC, eller hvis trin 1 ikke fungerer:
- Sluk for serveren
- Fjern strømkablerne fra den.
- Tryk på tænd / sluk-knappen, og hold den nede i 10 sekunder
- Tilslut strømkablerne igen
- Vent i ca. 2 minutter
- Tænd serveren igen
- For systemer med en CMC eller OME-M:
- Hvis der er installeret to CMC'er eller OME-M'er, skal du følge failoverproceduren for at failover til den anden enhed.
- Hvis kun en enkelt CMC eller OME-M er installeret, skal du fjerne modulet fra kabinettet, vente i 2 minutter, sætte modulet i igen og vente i 20 minutter.
- Hvis genindsættelse af modulet eller failover ikke fungerede, kræves en genstart af kabinettet for en komplet geninitialisering.
- Planlæg nedetid for alle servere og tilsluttede enheder, der er afhængige af, at kabinettet er oppe.
- Sluk serverne, og sluk derefter kabinettet
- Fjern strømkablerne.
- Vent mindst 10 minutter, eller tryk på tænd / sluk-knappen, og hold den nede (hvis nogen).
- Tilslut strømkablerne igen.
- Tænd kabinettet igen, vent i 20-30 minutter.
- Tænd serverne igen.
- Tilslut kabinettet igen fra det ydre, når alt er oppe at køre uden fejl eller blæserstøj.
Hvis du stadig oplever den samme blæserstøj, kan du fortsætte med at udforske listen.
Video
PowerEdge: Blæserproblem forårsaget af mistet forbindelse til sensorpakken
Varighed: 00:02:53 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Installeret hardware, der ikke understøttes
Ikke-understøttet hardware eller hardware fra en tredje leverandør, der ikke er eller endnu ikke er certificeret, kan medføre, at systemet kører blæserne højere end normalt eller endda ved maksimal hastighed.
Gør følgende for at foretage fejlfinding af dette:
- Kontroller, at enheden fungerer.
- Kontrollér, at enheden er korrekt monteret [i den rigtige slottype (hvis relevant)]
- IDRAC spinder potentielt blæserne op til bestemte enheder eller som standard, hvis det er ukendt.
- For at fortsætte skal du fjerne tredjepartsenheden og se, om blæserstøjen vender tilbage til normal.
- Hvis det er tilfældet, skal du kontakte din tredjepartsleverandør for at finde ud af, om de kender til eventuelle afhjælpninger eller har anbefalinger vedrørende brugen af enheden i en Dell PowerEdge-server.
Hvis du har fulgt listen indtil nu og stadig har brug for mere support, skal du fortsætte med at følge den længere nede.
Video
Ikke-understøttet hardware, der forårsager for meget blæserstøj.
Varighed: 00:00:38 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
En ufuldstændig anden CPU-opgradering (afhængig af systemtype) eller generel opgradering til maskinen, som kræver en anden type blæsere installeret
Hvis du har opgraderet systemet eller opgraderer systemet, kræver nogle opgraderinger yderligere dele (blæser, hukommelses-DIMM'er) eller andre blæsertyper (opgradering fra standard til sølv- eller endda Gold-blæsere).
Disse opgraderinger er (ikke-udtømmende liste, kontakt din salgsrepræsentant):
- Anden CPU-opgradering til systemer, der kan købes med en enkelt CPU og kan rumme to CPU'er (systemtypeafhængig)
- Dette kræver sandsynligvis fjernelse af tomme enheder, den ekstra CPU med samme trin, ekstra hukommelse og ofte en ekstra blæser
- Nogle systemer kan endda have brug for, at alle blæsere opgraderes fra standard til sølv eller til guldblæsere (system- og opgraderingsspecifikke krav)
- GPU- eller GPGPU-opgraderinger til systemer, der understøtter dette
- Dette kræver sandsynligvis ekstra udvidelser og understøttende kabler, men også yderligere køling afhængigt af det originale layout og blæsere, der allerede er installeret.
- Yderligere PCIe-kort eller NVMe-drev
- Dette kræver sandsynligvis mere en kontrol af, at alt er i overensstemmelse med køleforventningerne efter installationen af de nye dele, da kølekrav kan diktere yderligere blæsere eller forskellige mere kraftfulde blæsertyper.
Hvis du har fulgt disse og er sikker på, at problemet ikke er angivet indtil videre, skal du fortsætte med at følge listen.
Video
Køling i en opgraderet PowerEdge-server
Varighed: 00:01:49 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Temperaturen overstiger den normale blæserhastighedsdækning (stor arbejdsbyrde, der fører til højt CPU-forbrug og -temperatur, dårlig luftgennemstrømning)
Når systemer kommer under tung belastning, bruger CPU'er, men også andre dele, mere strøm, og det resulterer i et højere end normalt kølebehov.
Det er også muligt, at blæserhastigheden over tid er steget, hvis luftstrømmen er begrænset enten ved at være i et rum, der ikke er godt ventileret, eller ved obstruktion, der typisk ses som støvopbygninger.
Kontroller følgende trin for at se, hvilket problem der er til stede, og hvilke skridt der kan tages for at afhjælpe eller fjerne problemet:
- Kontroller, om CPU-forbruget er under konstant høj belastning (90-100%)
- Hvis det er tilfældet, kan du kontrollere, hvorfor det er, og om det er forventet adfærd (er dette en normal arbejdsbyrde, der forårsager det, eller noget ukendt, for eksempel da det begyndte at ske efter en nylig opdatering eller opgradering af operativsystemet (OS))
- Hvis adfærden ikke betragtes som normal, skal du undersøge belastningen yderligere ved at forstå, hvilket program eller hvilken tjeneste der forårsager den høje belastning.
- Hvis problemet opstår på grund af tilsyneladende normal drift, og der ikke har været nogen nylige opdateringer (eller genstarter, tilsigtede eller utilsigtede) til maskinens software, har din maskine muligvis nået det maksimale af, hvad den er designet til, og din arbejdsbyrde er vokset ud af den hardware, den kører på. Især hvis du har flere systemer med en lignende belastning, der kører lignende workloadtyper og har det samme problem, vil du tale med en salgsrepræsentant og se, hvad der kan gøres ved denne sag med hensyn til skalering eller opgradering.
- Kontroller, om indsugningsåbningerne er blokerede eller begrænsede, eller om ventilatorerne selv er blokeret eller begrænset på nogen måde
- Over tid er ophobning af støv relativt normalt. Et 100% støvfrit miljø er nogle gange svært at opretholde til urealistisk afhængigt af omstændighederne. Som sådan er regelmæssig vedligeholdelse af maskinerne, der frigør maskinen fysisk fra støv og holder luften flydende, et must og bør integreres i alle vedligeholdelsesplaner, der skal udføres hvert år mindst én gang (oftere jo mere maskinen udsættes for støv).
- Hvis du opdager, at dine ventilationsåbninger eller ventilatorer er blokeret, skal du planlægge vedligeholdelse af maskinen og fjerne alt støv og forhindringer. Du kan finde nogle oplysninger i Vejledning til at holde dit Dell Technologies-udstyr rent.
Hvis du har det samme problem efter at have fulgt dette, skal du udforske listen yderligere.
Video
PowerEdge: Temperaturen overstiger den normale blæserhastighedsdækning.
Varighed: 00:02:36 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Systemdækslet er slukket eller monteret forkert. Indtrængningskontakten udløses muligvis eller fungerer ikke.
Nogle systemer kræver, at systemdækslet er lukket, og at indtrængningskontakten er i lukket tilstand (trykket). Hvis dækslet ikke er installeret, og indtrængningskontakten udløses, øges blæserhastigheden til maks. som en sikkerhedsforanstaltning.
Dette kan også ske som et resultat af en defekt indtrængningskontakt til disse systemer, da en ødelagt switch altid er åben, så i dette tilfælde udløses den altid, hvilket indikerer, at systemdækslet er åbent.
Kontroller følgende:
- Fjern systemdækslet, og genmonter det igen, samtidig med at du sikrer, at det passer korrekt.
- Det er nyttigt at teste dette på en testbænk eller arbejdsbænk med strøm til rådighed uden for stativet for at sikre et sparemiljø.
- Dette giver også mulighed for bedre udsyn med hensyn til montering af systemdækslet og eventuelle skader på holderen af indtrængningskontakten eller selve kontakten.
- Kontroller, om kontakten er på plads korrekt, og om den udløses, når den springer tilbage, og deaktiveres, når der trykkes på den.
- Når indtrængningskontakten udløses, genereres der en post i systemets hændelseslog (findes i systemets iDRAC)
- Luk systemdækslet korrekt, undersøg pasformen, og sørg for, at alle dele passer korrekt sammen.
Hvis du stadig har brug for yderligere hjælp efter dette, skal du se listen for et andet emne.
Video
Sådan udskiftes indtrængningskontakten på PowerEdge R750.
Varighed: 00:01:28 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Konfigurationsindstillinger
iDRAC styrer maskinens termiske indstillinger og sørger for, at alle dele afkøles korrekt. Disse indstillinger kan ændres manuelt for at øge eller mindske forskydningen af blæserhastigheden eller for at ændre den termiske standardprofil. Ændring af profilen fra standardprofilen kan også øge blæserhastighederne.
Hvis du ikke ved, hvilke indstillinger der bruges, kan du bruge følgende trin til at nulstille indstillingerne:
- Under POST skal du trykke på F2
- Vælg Systemservices
- Find i nederste højre hjørne Standardindstillinger, og tryk på den
- Vælg Afslut
- Når du bliver bedt om det, skal du vælge Gem og genstart
- Når du er genstartet, skal du trykke på F2 under POST igen
- Vælg iDRAC-indstillinger>Termisk
- Sørg for, at der ikke er angivet eller valgt indstillinger, og at profilen viser standardindstillingerne for den termiske profil (maks. ydeevne).
- Afslut og genstart.
Hvis du har været igennem denne del og ikke har fundet en løsning endnu, kan du overveje at tjekke listen ovenfor. Hvis du har udtømt denne liste, skal du indsamle supportlogfilen [TSR] (teknisk supportrapport) og kontakte vores supportteam.
Video
Nulstil din termiske iDRAC-profil.
Varighed: 00:01:26 (hh:mm:ss)
Når sprogindstillingerne for undertekster er tilgængelige, kan du vælge sprogindstillinger for undertekster ved hjælp af CC-ikonet på denne videoafspiller.
Indløbstemperatursensor mislykkedes, falsk aflæsning
Det er muligt, at du støder på en advarselsmeddelelse i systemhændelsesloggen (SEL) på iDRAC, der informerer om, at indløbstemperaturen svigtede, eller at aflæsningen er højere som forventet (omgivelsestemperaturen, når den måles, stemmer ikke nøje overens med sensorudgangen). Sensoren måler temperaturen foran på maskinen, og iDRAC bruger de leverede data til at beregne kølebehovet ud fra dette. Som følge heraf resulterer en defekt eller forkert målesensor i højere eller maksimerede ventilatorhastigheder.
Gør følgende for at foretage fejlfinding af dette problem:
- Kontroller SEL for advarslen eller fejlmeddelelsen
- Hvis du ikke har udført de handlinger, der er beskrevet i firmwareafsnittet, skal du følge dette afsnit for at udelukke firmware som et problem for uoverensstemmelsesoplysningerne.
- Kontroller SEL'en igen, når alle firmwareopdateringer er udført.
- Kontroller indgangstemperaturen i iDRAC-webgrænsefladen, og se, om den stadig er højere end forventet, eller om den slet ikke udskrives.
- Hvis sagen fortsætter, skal du indsamle en ny TSR og kontakte vores supportteam.
Her kan du gå tilbage til listen.