Openshift-tapahtumakoodi: 1030NODE0001

Zusammenfassung: Jatkuva korkea suorittimen käyttö yhdessä ohjaustason solmussa, suurempi suorittimen paine aiheuttaa todennäköisesti vikasietoisuuden; Lisää käytettävissä olevaa suoritinta.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Äärimmäinen suorittimen paine voi hidastaa sarjoittamista ja heikentää kube-apiserverin ja etcd: n suorituskykyä. Kun näin tapahtuu, on olemassa riski, että asiakkaat näkevät vastaamattomia API-pyyntöjä, jotka lähetetään uudelleen, mikä aiheuttaa vielä enemmän suorittimen painetta.

Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.

Ursache

Tämä hälytys laukeaa, kun suorittimen käyttö pysyy korkeana yhdessä ohjaustason solmussa.

Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
  • Kriittinen
    • kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 1 tunnin ajan.
  • Warning
    • kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 5 m:n kohdalla.
Tämä hälytys laukeaa, kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua voi ylläpitää; yhden ohjaustason solmun katkos voi aiheuttaa kaskadivian; Lisää käytettävissä olevaa suoritinta.

Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
  • Warning
    • kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua, se voi kestää yli 10 metriä.

Lösung

Diagnoosi:

Suorita seuraavat PromQL-kyselyt OCP-verkkokonsolissa vianmäärityksen helpottamiseksi (Tarkkaile → Mittarit → Suorita kyselyt).
Top 5 säilöä, joissa on eniten suorittimen käyttöä tietyssä solmussa:image.png

Hälytyksen voi aiheuttaa esimerkiksi seuraavissa olosuhteissa:

  • Uusi kuormitus tuottaa enemmän puheluita apiserveriin ja aiheuttaa suurta suorittimen käyttöä. Lisää tässä tapauksessa ohjaustason solmujen suoritinta ja muistia.
  • hälytys laukeaa solmun tietojen perusteella, joten on mahdollista, että jokin solmun komponentti aiheuttaa suuren suorittimen käytön.
  • Apiserver/etcd käsittelee enemmän pyyntöjä taustalla olevasta tilasta johtuvien asiakkaan uudelleenyritysten vuoksi.
  • pyyntöjen epätasainen jakautuminen apiserver-instansseihin HTTP2:n vuoksi (se multipleksoi pyynnöt yhden TCP-yhteyden kautta). Kuormituksen tasaajat eivät ole sovelluskerroksessa, joten ne eivät ymmärrä http2: ta.

Lieventäminen:

  • Jos apiserveriin aiheutuu kuormitusta kuormitusta suuren suoritinmäärän vuoksi, lisää ohjaustason solmujen suoritinta ja muistia.
  • Jos suurina pysyvä suorittimen käyttö johtuu klusterin heikkenemisestä:
    • Selvitä hajoamisen perimmäinen syy ja määritä sitten seuraavat vaiheet vastaavasti.

Tuki:

Jos ongelma ei ratkea mitkään yllä olevista toimista, ota yhteyttä Dell EMC:n tekniseen tukeen lisätutkimuksia varten.

 

Weitere Informationen

Jos lokipaketti kerätään, Prometheus-tiedot voidaan myös dumpata täydentävinä materiaaleina.
Kuinka ottaa dumppi klusterin prometheus-tiedoista:

image.png

Betroffene Produkte

APEX Cloud Platform for Red Hat OpenShift
Artikeleigenschaften
Artikelnummer: 000217405
Artikeltyp: Solution
Zuletzt geändert: 13 Feb. 2026
Version:  3
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.