Openshift-tapahtumakoodi: 1030NODE0001
Zusammenfassung: Jatkuva korkea suorittimen käyttö yhdessä ohjaustason solmussa, suurempi suorittimen paine aiheuttaa todennäköisesti vikasietoisuuden; Lisää käytettävissä olevaa suoritinta.
Dieser Artikel gilt für
Dieser Artikel gilt nicht für
Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden.
In diesem Artikel werden nicht alle Produktversionen aufgeführt.
Symptome
Äärimmäinen suorittimen paine voi hidastaa sarjoittamista ja heikentää kube-apiserverin ja etcd: n suorituskykyä. Kun näin tapahtuu, on olemassa riski, että asiakkaat näkevät vastaamattomia API-pyyntöjä, jotka lähetetään uudelleen, mikä aiheuttaa vielä enemmän suorittimen painetta.
Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.
Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.
Ursache
Tämä hälytys laukeaa, kun suorittimen käyttö pysyy korkeana yhdessä ohjaustason solmussa.
Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
- Kriittinen
- kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 1 tunnin ajan.
- Warning
- kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 5 m:n kohdalla.
Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
- Warning
- kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua, se voi kestää yli 10 metriä.
Lösung
Diagnoosi:
Suorita seuraavat PromQL-kyselyt OCP-verkkokonsolissa vianmäärityksen helpottamiseksi (Tarkkaile → Mittarit → Suorita kyselyt).Top 5 säilöä, joissa on eniten suorittimen käyttöä tietyssä solmussa:
Hälytyksen voi aiheuttaa esimerkiksi seuraavissa olosuhteissa:
- Uusi kuormitus tuottaa enemmän puheluita apiserveriin ja aiheuttaa suurta suorittimen käyttöä. Lisää tässä tapauksessa ohjaustason solmujen suoritinta ja muistia.
- hälytys laukeaa solmun tietojen perusteella, joten on mahdollista, että jokin solmun komponentti aiheuttaa suuren suorittimen käytön.
- Apiserver/etcd käsittelee enemmän pyyntöjä taustalla olevasta tilasta johtuvien asiakkaan uudelleenyritysten vuoksi.
- pyyntöjen epätasainen jakautuminen apiserver-instansseihin HTTP2:n vuoksi (se multipleksoi pyynnöt yhden TCP-yhteyden kautta). Kuormituksen tasaajat eivät ole sovelluskerroksessa, joten ne eivät ymmärrä http2: ta.
Lieventäminen:
- Jos apiserveriin aiheutuu kuormitusta kuormitusta suuren suoritinmäärän vuoksi, lisää ohjaustason solmujen suoritinta ja muistia.
- Jos suurina pysyvä suorittimen käyttö johtuu klusterin heikkenemisestä:
- Selvitä hajoamisen perimmäinen syy ja määritä sitten seuraavat vaiheet vastaavasti.
Tuki:
Jos ongelma ei ratkea mitkään yllä olevista toimista, ota yhteyttä Dell EMC:n tekniseen tukeen lisätutkimuksia varten.
Weitere Informationen
Jos lokipaketti kerätään, Prometheus-tiedot voidaan myös dumpata täydentävinä materiaaleina.
Kuinka ottaa dumppi klusterin prometheus-tiedoista:

Betroffene Produkte
APEX Cloud Platform for Red Hat OpenShiftArtikeleigenschaften
Artikelnummer: 000217405
Artikeltyp: Solution
Zuletzt geändert: 13 Feb. 2026
Version: 3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.