PowerEdge: jak zidentyfikować i rozwiązać problemy z niektórymi najczęstszymi przyczynami hałasu wentylatora
Podsumowanie: Ten artykuł przedstawia możliwości poznania i rozwiązania niektórych typowych przyczyn hałasu wentylatora w serwerze PowerEdge. Dotyczy to również 100% prędkości wentylatora.
Instrukcje
Jakie są najczęstsze przyczyny hałasu wentylatora w serwerze PowerEdge?
- Awaria wentylatora, brak wentylatora, uszkodzenie wentylatora
- Nieaktualne oprogramowanie wewnętrzne
- Zakłócenia komunikacji ze zintegrowanym kontrolerem Dell Remote Access Controller (iDRAC), układem zarządzania płytą główną (BMC) lub kontrolerem Chassis Management Controller (CMC, OME-M dla obudowy MX)
- Zainstalowany nieobsługiwany sprzęt
- Niekompletna druga aktualizacja procesora (w zależności od typu systemu) lub ogólna aktualizacja komputera, która wymaga innego typu zainstalowanych wentylatorów
- Temperatura przekracza normalną prędkość wentylatora (duże obciążenie robocze prowadzące do wysokiego użycia procesora i wysokiej temperatury, niedostateczny przepływ powietrza)
- Pokrywa systemu jest zdjęta lub zainstalowana nieprawidłowo. Przełącznik czujnika otwarcia obudowy mógł zostać uruchomiony lub nie działa.
- Ustawienia konfiguracji
- Awaria czujnika temperatury wlotowej, fałszywy odczyt
Awaria wentylatora, brak wentylatora, uszkodzenie wentylatora
W takim scenariuszu co najmniej jeden wentylator lub zestaw wentylatorów (zawierający dwa wentylatory) jest uszkodzony (złącze, łopatka wentylatora, rama łopatek), brakuje go lub nie działa.
Aby zidentyfikować zestaw wentylatorów lub wentylator, który jest przyczyną problemu, wykonaj następujące czynności w podanej kolejności:
- Sprawdź przedni wyświetlacz LCD lub rejestr zdarzeń systemowych, aby dowiedzieć się, który wentylator został zgłoszony.
- Po zgłoszeniu usterki wentylatora sprawdź numer wentylatora umieszczony na pokrywie (lub zapoznaj się z instrukcją obsługi serwera) i sprawdź, czy wentylator pracuje.
Przestroga: podczas otwierania pokrywy serwera w celu sprawdzenia wentylatorów bez wyłączania go należy zachować ostrożność. Elementy wewnątrz mogą być gorące lub ostre albo jedno i drugie.
- Jeśli wentylator obraca się wolniej, w ogóle się nie obraca lub wydaje nieregularne dźwięki (ocieranie, zgrzytanie), wyłącz maszynę i wyjmij zespół wentylatora do kontroli.
- Ocieranie i zgrzytanie wentylatorów powinno pozostawiać widoczne rysy.
- Czasami zanieczyszczenia lub kurz mogą spowodować, że wentylator działa nieregularnie. W takim przypadku może pomóc wyczyszczenie wentylatora.
- Sprawdź złącze na płycie głównej lub płycie sterującej wentylatora oraz złącze na wentylatorze, aby zobaczyć, czy nie ma uszkodzeń któregoś z nich.
- Jeśli nie ma uszkodzenia wentylatora ani problemów z podłączeniem, zainstaluj wentylator, osłonę (jeśli jest), pokrywę obudowy i ponownie włącz urządzenie.
Jeśli wentylator nadal jest zgłaszany jako uszkodzony, sprawdź następną możliwość z tej listy.
Wideo
Zidentyfikuj problem z wentylatorem serwera PowerEdge.
Czas trwania: 00:00:00 (gg:02:31)
Jeśli to możliwe, ustawienia języka napisów można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Jak wymienić wentylator w serwerze PowerEdge R740.
Czas trwania: 00:00:53 (gg:mm:ss)
Ustawienia języka napisów kodowanych (napisów) można wybrać za pomocą ikony CC w tym odtwarzaczu wideo, jeśli są dostępne.
Nieaktualne oprogramowanie wewnętrzne
Nieaktualne oprogramowanie wewnętrzne może powodować wysokie obroty wentylatorów (hałas), nawet gdy nie ma innej awarii. Często zdarza się, że części oprogramowania wewnętrznego zostały zaktualizowane, a niektóre elementy w łańcuchu zbierania danych z czujników zostały pominięte w aktualizacji.
Poniżej znajduje się lista wersji oprogramowania wewnętrznego, które należy sprawdzić pod kątem aktualizacji w następnym kroku dochodzenia:
- iDRAC, CPLD, BIOS
- PERC, BOSS, płyta backplane, dyski NVMe, dyski SAS/SATA
- NIC, dowolna inna karta PCIe
- Zasilacze (PSU)
- Jakikolwiek inny sprzęt
Jeśli chcesz użyć kontrolera iDRAC do aktualizacji oprogramowania wewnętrznego (skorzystaj z tego artykułu, aby dowiedzieć się, jak to zrobić, PowerEdge: Zdalne aktualizowanie oprogramowania wewnętrznego za pomocą interfejsu sieciowego kontrolera iDRAC), aktualizacje są wymienione w kolejności importowania od lewej do prawej i od góry do dołu.
Każdy element listy powinien być używany jako przewodnik, które aktualizacje mogą być aktualizowane jednocześnie (niesą to jednak pierwsze elementy).
Gdy oprogramowanie wewnętrzne będzie aktualne, przejdź do następnego elementu z listy.
Wideo
Aktualizacja oprogramowania wewnętrznego za pomocą kontrolera iDRAC9.
Czas trwania: 00:01:16 (gg:mm:ss)
Jeśli są dostępne, ustawienia języka napisów kodowanych można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Zakłócenia komunikacji ze zintegrowanym kontrolerem Dell Remote Access Controller (iDRAC), układem zarządzania płytą główną (BMC) lub kontrolerem Chassis Management Controller (CMC, OME-M dla obudowy MX)
Gdy kontroler iDRAC, BMC lub CMC/OME-M utraci połączenie z pakietem czujników, wentylatory wracają do prędkości niezarządzanej (pełnej), aby chronić system przed przegrzaniem.
Stąd po włączeniu można usłyszeć, jak wentylatory zwiększają obroty, zanim je zmniejszą. Uruchomienie kontrolera iDRAC, BMC lub CMC/OME-M i rozpoczęcie regulacji prędkości wentylatora zajmuje kilka minut.
Na ekranie LCD (jeśli jest) nie ma tekstu. Jeśli typ systemu jest modułowy, może nie włączać się w obudowie, jeśli nie może skomunikować się z kontrolerem CMC.
W takim przypadku skontaktuj się z naszym zespołem pomocy technicznej.
Aby rozwiązać ten problem, wykonaj następujące czynności:
- W przypadku wszystkich systemów iDRAC naciśnij i przytrzymaj przycisk „i” przez 16 sekund.
- W przypadku systemu z BMC lub jeśli krok 1 nie działa:
- Wyłącz serwer
- Odłącz od niego kable zasilające.
- Naciśnij i przytrzymaj przycisk zasilania przez 10 sekund
- Ponownie podłącz kable zasilające
- Poczekaj około 2 min
- Włącz serwer
- W przypadku systemów z kontrolerem CMC lub OME-M:
- Jeśli są zainstalowane dwa kontrolery CMC lub OME-M, postępuj zgodnie z procedurą przełączania awaryjnego, aby przełączyć się na drugą jednostkę.
- Jeśli zainstalowano tylko jeden kontroler CMC lub OME-M, wyjmij moduł z obudowy, odczekaj 2 minuty, a następnie zainstaluj moduł ponownie i odczekaj 20 minut.
- W przypadku, gdy ponowne osadzenie modułu lub przełączenie awaryjne nie zadziałało, wymagane jest ponowne uruchomienie obudowy w celu całkowitej ponownej inicjalizacji.
- Zaplanuj przestoje dla wszystkich serwerów i podłączonych urządzeń, które zależą od działającej obudowy.
- Wyłącz serwery, a następnie obudowę
- Odłącz kable zasilające.
- Odczekaj co najmniej 10 minut lub naciśnij i przytrzymaj przycisk zasilania (jeśli jest).
- Ponownie podłącz kable zasilające.
- Włącz ponownie obudowę i odczekaj 20–30 minut.
- Ponownie włącz serwery.
- Gdy wszystko będzie już gotowe do pracy, podłącz ponownie do obudowy bez błędów i hałasu wentylatora.
Jeśli nadal słychać ten sam hałas wentylatora, kontynuuj przeglądanie listy.
Wideo
PowerEdge: Problem z wentylatorem spowodowany utratą połączenia z pakietem czujników
Czas trwania: 00:02:53 (gg:mm:ss)
Jeśli są dostępne, ustawienia języka napisów kodowanych można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Zainstalowany nieobsługiwany sprzęt
Nieobsługiwany sprzęt lub sprzęt innego producenta, który jeszcze nie uzyskał certyfikatu, może spowodować, że wentylatory będą działać szybciej niż normalnie lub nawet z maksymalną prędkością.
Aby rozwiązać ten problem, wykonaj następujące czynności:
- Sprawdź, czy urządzenie działa.
- Sprawdź, czy urządzenie jest prawidłowo zainstalowane [w odpowiednim typie gniazda (w zależności od okoliczności)]
- Kontroler iDRAC może uruchamiać wentylatory dla określonych urządzeń lub domyślnie, jeśli są nieznane.
- Aby kontynuować, wyjmij urządzenie innej firmy i sprawdź, czy hałas wentylatora wraca do normy.
- Jeśli tak, skontaktuj się z dostawcą zewnętrznym, aby dowiedzieć się, czy znane są jakiekolwiek środki zaradcze lub zalecenia dotyczące użytkowania urządzenia w serwerze Dell PowerEdge.
Jeśli po przejrzeniu listy do tego miejsca nadal potrzebujesz pomocy, kontynuuj jej przeglądanie.
Wideo
Nieobsługiwany sprzęt powoduje nadmierny hałas wentylatora.
Czas trwania: 00:00:38 (gg:mm:ss)
Ustawienia języka napisów kodowanych można wybrać za pomocą ikony CC w tym odtwarzaczu wideo, jeśli są dostępne.
Niekompletna druga aktualizacja procesora (w zależności od typu systemu) lub ogólna aktualizacja komputera, która wymaga innego typu zainstalowanych wentylatorów
W przypadku modernizacji systemu lub jego modernizacji, niektóre modernizacje wymagają dodatkowych części (wentylatory, moduły pamięci DIMM) lub innych typów wentylatorów (zmiana wentylatorów ze standardowych na srebrne lub nawet złote).
Są to następujące aktualizacje (lista niewyczerpująca, należy skonsultować się z przedstawicielem handlowym):
- Drugie uaktualnienie procesora dla systemów, które mogą być kupione z jednym procesorem i mogą pomieścić dwa procesory (w zależności od typu systemu)
- Prawdopodobnie będzie to wymagało zdjęcia elementów zaślepiających, dodatkowego procesora o identycznym taktowaniu, dodatkowej pamięci i często jednego dodatkowego wentylatora
- Niektóre komputery mogą nawet wymagać wymiany wszystkich wentylatorów ze standardowych na srebrne lub złote (wymagania właściwe dla systemu i aktualizacji)
- Uaktualnienia GPU lub GPGPU dla komputerów, które to obsługują
- Prawdopodobnie będzie to wymagało dodatkowych riserów i okablowania pomocniczego, ale także dodatkowego chłodzenia w zależności od oryginalnego układu i już zainstalowanych wentylatorów.
- Dodatkowe karty PCIe lub dyski NVMe
- Prawdopodobnie będzie to wymagało dokładniejszego sprawdzenia, czy wszystko jest zgodne z oczekiwaniami dotyczącymi chłodzenia po zainstalowaniu nowych części, ponieważ wymagania dotyczące chłodzenia mogą wymagać dodatkowych wentylatorów lub różnych typów wentylatorów o większej mocy.
Jeśli powyższe instrukcje zostały wykonane i masz pewność, że problem nie został wyszczególniony do tej pory, kontynuuj przeglądanie listy.
Wideo
Chłodzenie w zmodernizowanym serwerze PowerEdge
Czas trwania: 00:01:49 (gg:mm:ss)
Jeśli to możliwe, ustawienia języka napisów można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Temperatura przekracza normalną prędkość wentylatora (duże obciążenie robocze prowadzące do wysokiego użycia procesora i wysokiej temperatury, niedostateczny przepływ powietrza)
Gdy systemy są mocno obciążone procesory, ale inne części również mogą, zużywają więcej energii, co skutkuje wyższym niż zwykle zapotrzebowaniem na chłodzenie.
Możliwe jest również, że z biegiem czasu prędkość wentylatora wzrośnie, jeśli przepływ powietrza jest ograniczony przez przebywanie w pomieszczeniu, które nie jest dobrze wentylowane lub przez przeszkody zwykle postrzegane jako gromadzenie się kurzu.
Wykonaj następujące czynności, aby sprawdzić, który problem występuje i jakie kroki można podjąć, aby go złagodzić lub wyeliminować:
- Sprawdź, czy procesor znajduje się stale pod dużym obciążeniem (90–100%)
- Jeśli tak, warto sprawdzić, dlaczego tak się dzieje i czy jest to oczekiwane zachowanie (czy powoduje je normalne obciążenie robocze, czy coś nieznanego, na przykład gdy zaczęło się tak dziać po ostatniej aktualizacji lub uaktualnieniu systemu operacyjnego)
- Jeśli zachowanie nie jest uważane za normalne, zbadaj obciążenie dokładniej, znajdując aplikację lub usługę, która powoduje duże obciążenie.
- Jeśli zachowanie to jest spowodowane pozornie normalnym działaniem i nie było żadnych ostatnich aktualizacji (lub ponownych uruchomień, zamierzonych ani niezamierzonych) oprogramowania komputera, urządzenie mogło osiągnąć maksimum tego, do czego jest przeznaczone, a obciążenie przerosło sprzęt, na którym działa. Zwłaszcza jeśli masz wiele komputerów o podobnym obciążeniu, obsługujących podobne typy obciążeń i mających ten sam problem, skontaktuj się z przedstawicielem handlowym i sprawdź, co można zrobić w tej sprawie pod względem skalowania lub modernizacji.
- Sprawdź, czy otwory wentylacyjne nie są zasłonięte lub zablokowane, oraz czy same wentylatory nie są w jakikolwiek sposób zasłonięte lub zablokowane
- Wraz z upływem czasu gromadzenie się kurzu jest względnie normalne. Środowisko w 100% wolne od kurzu jest czasami trudne do utrzymania lub nierealne, w zależności od okoliczności. W związku z tym regularna konserwacja maszyn, która fizycznie usuwa kurz z maszyny i zapewnia przepływ powietrza, jest koniecznością i powinna być elementem wszystkich harmonogramów konserwacji, które należy przeprowadzać co najmniej raz do roku (tym częściej, im bardziej maszyna jest narażona na gromadzenie się kurzu).
- Jeśli okaże się, że otwory wentylacyjne lub wentylatory są zablokowane, zaplanuj konserwację urządzenia i oczyść je z kurzu oraz ciał obcych. Szczegółowe informacje można znaleźć w punkcie Wskazówki dotyczące utrzymywania czystości sprzętu firmy Dell Technologies.
Jeśli po wykonaniu tych czynności nadal masz ten sam problem, kontynuuj przeglądanie listy.
Wideo
PowerEdge: Temperatura przekracza normalną prędkość wentylatora.
Czas trwania: 00:02:36 (gg:mm:ss)
Jeśli to możliwe, ustawienia języka napisów kodowanych można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Pokrywa systemu jest zdjęta lub zainstalowana nieprawidłowo. Przełącznik czujnika otwarcia obudowy mógł zostać uruchomiony lub nie działa.
Niektóre komputery wymagają, aby pokrywa była zamknięta, a przełącznik czujnika otwarcia obudowy był w stanie zamkniętym (wciśniętym). Jeśli pokrywa nie jest zainstalowana, a w rezultacie zadziała przełącznik czujnika naruszenia obudowy, prędkość wentylatora zostanie zwiększona do maksimum jako środek ostrożności.
Może się to również zdarzyć na skutek uszkodzonego przełącznika czujnika naruszenia obudowy w tych systemach, ponieważ uszkodzony przełącznik jest zawsze aktywowany, więc w tym przypadku zawsze wyzwalany, wskazując, że pokrywa systemu jest otwarta.
Określ następujące kwestie:
- Zdejmij pokrywę komputera i zainstaluj ją ponownie, upewniając się, że jest prawidłowo dopasowana.
- Warto przetestować to na stanowisku testowym lub stanowisku roboczym z zasilaniem dostępnym poza szafą serwerową, aby zapewnić bezpieczeństwo.
- Zapewnia to również lepszą widoczność w zakresie dopasowania pokrywy systemu i ewentualnych uszkodzeń uchwytu przełącznika czujnika naruszenia obudowy lub samego przełącznika.
- Sprawdź, czy przełącznik jest na swoim miejscu i czy włącza się po odskoczeniu i wyłącza się po naciśnięciu.
- Wyzwolenie przełącznika czujnika otwarcia obudowy generuje wpis w dzienniku zdarzeń systemowych (znajdujący się w kontrolerze iDRAC systemu)
- Zamknij prawidłowo pokrywę komputera, sprawdź dopasowanie i upewnij się, że wszystkie części są wzajemnie dopasowane.
Jeśli nadal potrzebujesz dalszej pomocy, znajdź inny temat na liście.
Wideo
Jak wymienić przełącznik czujnika naruszenia obudowy w serwerze PowerEdge R750.
Czas trwania: 00:01:28 (gg:mm:ss)
Jeśli są dostępne, ustawienia języka napisów kodowanych można wybrać za pomocą ikony CC w tym odtwarzaczu wideo.
Ustawienia konfiguracji
Kontroler iDRAC steruje ustawieniami termicznymi urządzenia, zapewniając prawidłowe chłodzenie wszystkich części. Ustawienia te można zmienić ręcznie, aby zwiększyć lub zmniejszyć przesunięcie prędkości wentylatora albo zmienić domyślny profil termiczny. Zmiana profilu z profilu domyślnego może również doprowadzić do zwiększenia prędkości wentylatorów.
Jeśli nie masz pewności co do użytych ustawień, możesz wykonać następujące czynności, aby je zresetować:
- Podczas testu POST naciśnij klawisz F2
- Wybierz pozycję System Services
- Znajdź w prawym dolnym rogu opcję Defaults i naciśnij ją
- Wybierz opcję Exit
- Po wyświetleniu monitu wybierz opcję Save and Reboot
- Po ponownym uruchomieniu ponownie naciśnij klawisz F2 podczas testu POST
- Wybierz opcję iDRAC settings > Thermal
- Upewnij się, że nie ustawiono ani nie wybrano żadnych ustawień, a w profilu wyświetlane są domyślne ustawienia profilu termicznego (maksymalna wydajność).
- Zakończ i uruchom ponownie komputer.
Jeśli na tym etapie nie udało Ci się jeszcze znaleźć rozwiązania, rozważ sprawdzenie powyższej listy. Jeśli wyczerpano tę listę, zbierz plik dziennika pomocy technicznej [TSR] (Technical Support Report) i skontaktuj się z naszym zespołem pomocy technicznej.
Wideo
Zresetuj profil termiczny kontrolera iDRAC.
Czas trwania: 00:01:26 (gg:mm:ss)
Ustawienia języka napisów kodowanych (napisów) można wybrać za pomocą ikony CC w tym odtwarzaczu wideo, jeśli są dostępne.
Awaria czujnika temperatury wlotowej, fałszywy odczyt
Możliwe, że w dzienniku zdarzeń systemowych (SEL) kontrolera iDRAC pojawi się komunikat ostrzegawczy informujący o niepowodzeniu obniżenia temperatury wlotowej lub o tym, że odczyt jest wyższy zgodnie z oczekiwaniami (temperatura otoczenia podczas pomiaru nie jest ściśle zgodna z wartością wyjściową czujnika). Czujnik mierzy temperaturę z przodu urządzenia, a kontroler iDRAC wykorzystuje dostarczone dane do obliczenia potrzeb w zakresie chłodzenia na tej podstawie. W rezultacie, wadliwy lub nieprawidłowo mierzący czujnik skutkuje wyższymi lub zmaksymalizowanymi prędkościami wentylatora.
Aby rozwiązać ten problem, wykonaj następujące czynności:
- Sprawdź, czy w dzienniku SEL znajduje się ostrzeżenie lub komunikat o błędzie
- Jeśli nie wykonano czynności opisanych w sekcji oprogramowania wewnętrznego, postępuj zgodnie z treścią tego punktu, aby wykluczyć oprogramowanie wewnętrzne jako problem związany z informacjami o niezgodności.
- Po zakończeniu wszystkich aktualizacji oprogramowania wewnętrznego ponownie sprawdź dziennik SEL.
- Sprawdź temperaturę przy wlocie w interfejsie sieciowym kontrolera iDRAC i zobacz, czy nadal jest wyższa niż oczekiwana lub nie ma odczytu.
- Jeśli problem będzie się powtarzał, zbierz nowy TSR i skontaktuj się z naszym zespołem pomocy technicznej.
Tutaj możesz wrócić do listy.