PowerEdge : Comment identifier et dépanner certaines causes courantes de bruit du ventilateur
Résumé: Cet article présente des opportunités pour comprendre et dépanner certaines causes courantes de bruit des ventilateurs sur un serveur PowerEdge. Elle est également pertinente pour une vitesse de ventilateur de 100 %. ...
Instructions
Quelles sont les causes courantes de bruit du ventilateur sur un serveur PowerEdge ?
- Ventilateur défectueux, ventilateur manquant, ventilateur endommagé
- Firmware obsolète
- Interruption de communication avec l’integrated Dell Remote Access Controller (iDRAC), la puce BMC (Baseboard Management Chip) ou le Chassis Management Controller (CMC, OME-M pour boîtier MX)
- Matériel installé non pris en charge
- Mise à niveau incomplète du second processeur (selon le type de système) ou mise à niveau générale incomplète de la machine qui nécessite l’installation d’un autre type de ventilateur
- La température dépasse les limites normales de vitesse des ventilateurs (travail intensif nécessitant une utilisation et une températre élevées du processeur et une mauvaise circulation de l’air)
- Le capot du système est retiré ou mal installé. Le commutateur d’intrusion est peut-être déclenché ou ne fonctionne pas.
- Paramètres de configuration
- Capteur de température d’entrée défectueux, lecture erronée
Ventilateur défectueux, ventilateur manquant, ventilateur endommagé
Dans ce scénario, au moins un ventilateur ou un module de ventilateur (contenant deux ventilateurs) est endommagé (connecteur, lame de ventilateur, châssis de lame de ventilateur), manquant ou défectueux.
Pour identifier le module de ventilateur ou le ventilateur à l’origine du problème, suivez ces étapes dans l’ordre indiqué :
- Vérifiez l’écran LCD avant ou le journal des événements du système pour voir quel ventilateur a été signalé.
- Une fois que le ventilateur est signalé comme défectueux, vérifiez le positionnement du numéro de ventilateur sur le capot (ou consultez le guide de l’utilisateur de votre serveur) et voyez si le ventilateur fonctionne ou non.
Attention : Ouvrez le capot du serveur avec précaution sans l’éteindre pour vérifier les ventilateurs. Des éléments internes peuvent être chauds ou tranchants, ou les deux.
- Si le ventilateur tourne plus lentement, ne tourne pas du tout ou émet des bruits irréguliers (frottements, raclements), arrêtez la machine et déposez le ventilateur pour l’examiner.
- Les raclements et frottements de ventilateurs doivent laisser des rayures visibles.
- Des débris ou de la poussière peuvent rendre le ventilateur irrégulier. Dans ce cas, un nettoyage du ventilateur peut être utile.
- Examinez le connecteur de la carte mère ou de la carte de contrôle du ventilateur, puis celui du ventilateur, et vérifiez si l’un ou l’autre est endommagé.
- Si le ventilateur n’est pas endommagé ou qu’il n’y a aucun problème de connexion, remettez en place le ventilateur, le carénage (le cas échéant) et le capot du châssis, puis remettez la machine sous tension.
Si le ventilateur est toujours signalé comme défectueux, vérifiez la prochaine possibilité dans cette liste.
Vidéo
Identifiez le problème de ventilateur PowerEdge.
Durée : 00:00:00 (hh :02:31)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Comment remplacer le ventilateur pour PowerEdge R740.
Durée : 00:00:53 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Firmware obsolète
Un firmware obsolète peut conduire les ventilateurs à tourner à plus haut régime (et donc faire du bruit) alors même que tout fonctionne correctement. Il est courant que certaines parties du firmware aient été mises à jour, et qu’un certain nombre d’éléments dans la chaîne de collecte des données des capteurs n’aient pas été mis à jour.
La liste ci-dessous fourni des versions de firmware qui doivent être vérifiées pour les mises à jour lors de l’étape suivante de l’enquête :
- iDRAC, CPLD, BIOS
- PERC, BOSS, fond de panier, disques NVMe, disques SAS/SATA
- NIC, toute autre carte PCIe
- Bloc d’alimentation (PSU)
- Tout autre matériel
Si vous souhaitez utiliser l’iDRAC pour mettre à jour le firmware (consultez cet article pour savoir comment utiliser PowerEdge : Mise à jour du firmware à distance à l’aide de l’interface Web de l’iDRAC), les mises à jour sont répertoriées par ordre d’importation de gauche à droite et de haut en bas.
Chaque élément de la liste doit être utilisé comme guide sur les mises à jour qui peuvent être mises à jour en une seule fois (pas les premiers éléments cependant).
Une fois le firmware à jour, passez à l’élément suivant de la liste.
Vidéo
Mise à jour du firmware à l’aide d’iDRAC9.
Durée : 00:01:16 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Interruption de communication avec l’integrated Dell Remote Access Controller (iDRAC), la puce BMC (Baseboard Management Chip) ou le Chassis Management Controller (CMC, OME-M pour boîtier MX)
Lorsque l’iDRAC, le BMC ou le CMC/OME-M ne peut plus se connecter à la suite de capteurs, les ventilateurs reviennent à une vitesse non contrôlée (pleine vitesse) pour protéger le système contre la surchauffe.
C’est la raison pour laquelle vous pouvez entendre les ventilateurs tourner avant de s’arrêter à nouveau à la première mise sous tension. Il faut quelques minutes aux modules iDRAC, BMC ou CMC/OME-M pour démarrer et commencer à réguler la vitesse du ventilateur.
L’écran LCD (le cas échéant) reste sans texte. Si le système est de type modulaire, il peut arriver qu’il ne se mette pas sous tension dans le châssis, car il ne peut pas communiquer avec le CMC.
Dans ce cas, contactez notre équipe de support.
Procédez comme suit pour résoudre le problème :
- Pour tous les systèmes iDRAC, appuyez et maintenez enfoncé le bouton i pendant 16 s.
- Pour un système avec BMC ou si l’étape 1 ne fonctionne pas :
- Mise hors tension du serveur
- Débranchez les câbles d’alimentation.
- Appuyez sur le bouton d’alimentation et maintenez-le enfoncé pendant 10 s
- Rebranchez les câbles d’alimentation
- Patientez environ 2 minutes
- Mettez de nouveau le serveur sous tension
- Pour les systèmes équipés d’un CMC ou d’OME-M :
- Si deux CMC ou OME-M sont installés, suivez la procédure de basculement pour basculer vers l’autre unité.
- Si un seul CMC ou OME-M est installé, retirez le module du châssis, patientez 2 minutes, réinsérez le module et patientez 20 minutes.
- Si le replacement du module ou le basculement ne fonctionne pas, un redémarrage du châssis est nécessaire pour une réinitialisation complète.
- Programmez des temps d’arrêt pour tous les serveurs et appareils connectés qui dépendent du fonctionnement du châssis.
- Mettez les serveurs hors tension, puis le châssis hors tension
- Débranchez les câbles d’alimentation.
- Attendez au moins 10 minutes ou maintenez enfoncé le bouton de mise sous tension (le cas échéant).
- Reconnectez les câbles d’alimentation.
- Remettez le châssis sous tension et patientez 20 à 30 minutes.
- Mettez de nouveau les serveurs sous tension.
- Reconnectez-vous au châssis à partir d’un externe une fois que tout est opérationnel, sans erreur ni bruit de ventilateur.
Si vous constatez que le même bruit de ventilateur persiste, continuez à explorer la liste.
Vidéo
PowerEdge : Problème de ventilateur causé par une perte de connexion à la suite de capteurs
Durée : 00:02:53 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Matériel installé non pris en charge
L’utilisation d’un matériel non pris en charge ou d’un matériel tiers qui n’a pas été certifié ou n’a pas encore obtenu la certification peut conduire les ventilateurs à tourner à une vitesse supérieure à la normale voire à la vitesse maximale.
Pour résoudre ce problème, procédez comme suit :
- Vérifiez le bon fonctionnement du périphérique.
- Vérifier que le périphérique est correctement installé [dans le bon type de logement (le cas échéant)]
- L’iDRAC peut activer les ventilateurs pour des périphériques spécifiques ou par défaut s’ils sont inconnus.
- Pour continuer, retirez l’appareil tiers et vérifiez si le bruit du ventilateur revient à la normale.
- Dans ce cas, consultez votre fournisseur tiers pour savoir s’il connaît une mesure corrective ou s’il a des recommandations concernant l’utilisation du périphérique dans un serveur Dell PowerEdge.
Si vous avez suivi la liste jusqu’à maintenant et que vous avez encore besoin d’assistance, continuez à la suivre.
Vidéo
Matériel non pris en charge provoquant un bruit excessif du ventilateur.
Durée : 00:00:38 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Mise à niveau incomplète du second processeur (selon le type de système) ou mise à niveau générale incomplète de la machine qui nécessite l’installation d’un autre type de ventilateur
Si vous avez mis à niveau le système ou que vous êtes en train de le mettre à niveau, certaines mises à niveau nécessitent des pièces supplémentaires (ventilateur, modules DIMM de mémoire) ou différents types de ventilateurs (mise à niveau des ventilateurs standard vers les ventilateurs Silver ou même Gold).
Ces mises à niveau sont les suivantes (liste non exhaustive, consultez votre agent commercial) :
- Mise à niveau vers un deuxième processeur pour les systèmes qui peuvent être achetés avec un seul processeur et peuvent héberger deux processeurs (en fonction du type de système)
- Cette mise à niveau peut impliquer un retrait des caches, un processeur supplémentaire avec une révision identique, davantage de mémoire et, souvent, un ventilateur supplémentaire
- Sur certains systèmes, il peut même être nécessaire de mettre à niveau tous les ventilateurs standard vers des ventilateurs Silver ou Gold (ces exigences sont spécifiques au système et à la mise à niveau)
- Mises à niveau GPU ou GPGPU pour les systèmes qui prennent en charge cette fonctionnalité
- Cela nécessite probablement l’ajout de nouvelles cartes de montage, ainsi que de nouveaux câbles de support, et également un système de refroidissement supplémentaire en fonction de la disposition d’origine des ventilateurs déjà installés.
- Cartes PCIe supplémentaires ou disques NVMe
- Dans ce cas, il peut être nécessaire de vérifier, après l’installation des nouvelles pièces, que tout est conforme aux attentes en matière de refroidissement, car les besoins en refroidissement peuvent imposer d’ajouter des ventilateurs supplémentaires ou d’utiliser différents types de ventilateurs plus puissants.
Si vous avez suivi ces étapes et si vous êtes certain que le problème n’est pas répertorié jusqu’à présent, continuez à suivre la liste.
Vidéo
Refroidissement d’un serveur PowerEdge amélioré
Durée : 00:01:49 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
La température dépasse les limites normales de vitesse des ventilateurs (travail intensif nécessitant une utilisation et une températre élevées du processeur et une mauvaise circulation de l’air)
Lorsque les systèmes sont soumis à des processeurs soumis à une charge importante, mais que d’autres pièces peuvent également utiliser plus d’énergie, les besoins en refroidissement sont supérieurs à la normale.
Il est également possible qu’au fil du temps, la vitesse du ventilateur ait augmenté si la circulation d’air est limitée soit par un espace mal ventilé, soit par une obstruction généralement considérée comme une accumulation de poussière.
Vérifiez les étapes suivantes pour déterminer quel problème est présent et quelles mesures peuvent être prises pour l’atténuer ou l’éliminer :
- Vérifiez si l’utilisation du processeur est soumise à une charge élevée constante (90 à 100 %)
- Si tel est le cas, vous pouvez essayer d’en comprendre la cause et vérifier s’il s’agit d’un comportement attendu (si le problème est lié à une charge applicative normale ou à une cause inconnue, par exemple si le problème a commencé à se produire après une mise à jour ou une mise à niveau récente du système d’exploitation)
- Si le comportement n’est pas considéré comme normal, examinez la charge de manière plus approfondie en cherchant à comprendre quelle application ou quel service est à l’origine de la charge élevée.
- Si le comportement observé est lié à des opérations en apparence normales et qu’aucune mise à jour logicielle (de même qu’aucun démarrage, intentionnel ou non) n’a récemment été effectuée, il se peut que votre système ait atteint les limites maximales prévues par sa conception et que votre charge applicative a dépassé la capacité du matériel sous-jacent. Plus particulièrement si vous rencontrez le même problème sur plusieurs systèmes soumis à un niveau de charge semblable qui exécutent des types de charges applicatives similaires, il est judicieux de vous entretenir avec un agent commercial afin d’évaluer ce que vous pouvez faire en termes d’extension ou de mise à niveau.
- Vérifiez si les orifices d’aération sont obstrués ou limités, ou si les ventilateurs eux-mêmes sont obstrués ou limités de quelque manière que ce soit
- Au fil du temps, l’accumulation de poussière est relativement normale. Il est parfois difficile, voire irréaliste selon les circonstances, de maintenir un environnement totalement exempt de poussière. Comme les machines sont exposées à la poussière, il est nécessaire de procéder régulièrement à leur entretien pour les libérer physiquement de la poussière et assurer une bonne circulation de l’air. Il est donc essentiel d’intégrer cette tâche dans tous les planning de maintenance qui doivent être réalisés au moins une fois par an (plus souvent si les machines sont exposées à la poussière).
- Si vous constatez que les orifices d’aération ou les ventilateurs sont obstrués, planifiez la maintenance de la machine et éliminez toute poussière ou obstruction. Vous trouverez des informations détaillées dans la section Conseils de nettoyage pour votre équipement Dell Technologies.
Si vous rencontrez toujours le même problème après avoir suivi cette procédure, continuez à explorer la liste.
Vidéo
PowerEdge : La température dépasse la couverture de vitesse de ventilateur normale.
Durée : 00:02:36 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC sur ce lecteur vidéo.
Le capot du système est retiré ou mal installé. Le commutateur d’intrusion est peut-être déclenché ou ne fonctionne pas.
Certains systèmes nécessitent que le capot du système soit fermé et que le commutateur d’intrusion soit dans un état de fermeture (enfoncé). Si le capot n’est pas installé et que le commutateur d’intrusion est déclenché, la vitesse du ventilateur augmente au maximum par mesure de précaution.
Cela peut également se produire en raison d’un commutateur d’intrusion défectueux pour ces systèmes, car un interrupteur cassé est toujours ouvert, donc dans ce cas, toujours déclenché, indiquant que le capot du système est ouvert.
Vérifiez les points suivants :
- Retirez le capot du système et réinstallez-le en veillant à ce qu’il soit correctement installé.
- Il est utile de tester cette fonctionnalité sur un banc de test ou un banc de travail avec une alimentation disponible en dehors du rack pour garantir un environnement sécurisé.
- Cela permet également une meilleure visibilité en ce qui concerne l’ajustement du capot du système et tout dommage éventuel au support du commutateur d’intrusion ou au commutateur lui-même.
- Vérifiez si le commutateur est correctement en place, et vérifiez s’il se déclenche lorsqu’il est repoussé et qu’il se désactive lorsqu’il est actionné.
- Déclenchez le commutateur d’intrusion génère une entrée dans le journal des événements système (qui se trouve dans l’iDRAC du système)
- Fermez correctement le capot du système, inspectez l’ajustement et assurez-vous que toutes les pièces s’emboîtent correctement.
Si vous avez encore besoin d’aide, consultez la liste pour une autre rubrique.
Vidéo
Remplacement du commutateur d’intrusion pour PowerEdge R750.
Durée : 00:01:28 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC de ce lecteur vidéo.
Paramètres de configuration
L’iDRAC contrôle les paramètres thermiques de la machine en veillant à ce que toutes les pièces soient refroidies correctement. Ces paramètres peuvent être modifiés manuellement pour augmenter ou diminuer le décalage de la vitesse du ventilateur ou modifier le profil thermique par défaut. Modifier le profil par défaut peut également augmenter la vitesse des ventilateurs.
Si vous n’êtes pas certain des paramètres utilisés, vous pouvez procéder comme suit pour réinitialiser les paramètres :
- Au cours du POST, appuyez sur F2
- Sélectionnez System Services
- Dans le coin inférieur droit, recherchez Defaults et cliquez dessus
- Sélectionnez Exit
- À l’invite, sélectionnez Save and Reboot
- Après le redémarrage, appuyez à nouveau sur F2 pendant le POST
- Sélectionnez iDRAC settings > Thermal
- Assurez-vous qu’aucun paramètre n’est défini ou sélectionné et que le profil affiche les paramètres du profil thermique par défaut (performances maximales).
- Terminez et redémarrez.
Si vous avez parcouru cette partie et que vous n’avez pas encore trouvé de solution, consultez la liste ci-dessus. Si vous avez épuisé cette liste, collectez le fichier journal de support [TSR] (rapport de support technique) et contactez notre équipe de support.
Vidéo
Réinitialisez votre profil thermique iDRAC.
Durée : 00:01:26 (hh :mm :ss)
Lorsqu’ils sont disponibles, les paramètres de langue des sous-titres peuvent être choisis à l’aide de l’icône CC sur ce lecteur vidéo.
Capteur de température d’entrée défectueux, lecture erronée
Il est possible que vous rencontriez un message d’avertissement dans le journal des événements système (SEL) de l’iDRAC indiquant que la température d’entrée a échoué ou que la lecture est plus élevée que prévu (la température ambiante mesurée ne correspond pas étroitement à la sortie du capteur). Le capteur mesure la température à l’avant de la machine, et l’iDRAC utilise les données fournies pour calculer les besoins de refroidissement en fonction de cela. Par conséquent, un capteur défectueux ou mal mesuré entraîne des vitesses de ventilateur plus élevées ou plus élevées.
Procédez comme suit pour résoudre le problème :
- Vérifiez si le fichier SEL contient le message d’erreur ou d’avertissement
- Si vous n’avez pas entrepris les mesures décrites dans la section relative au firmware, suivez cette section pour écarter le firmware comme étant la cause du problème de correspondance.
- Vérifiez à nouveau le journal d’événements après avoir effectué toutes les mises à jour du firmware.
- Contrôlez la température d’entrée dans l’interface Web de l’iDRAC et vérifiez si elle est toujours supérieure à la valeur attendue ou si elle n’est pas relevée du tout.
- Si le problème persiste, récupérez un nouveau TSR et contactez notre équipe de support.
Ici, vous pouvez revenir à la liste.