Openshift-tapahtumakoodi: 1030NODE0001

Summary: Jatkuva korkea suorittimen käyttö yhdessä ohjaustason solmussa, suurempi suorittimen paine aiheuttaa todennäköisesti vikasietoisuuden; Lisää käytettävissä olevaa suoritinta.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Äärimmäinen suorittimen paine voi hidastaa sarjoittamista ja heikentää kube-apiserverin ja etcd: n suorituskykyä. Kun näin tapahtuu, on olemassa riski, että asiakkaat näkevät vastaamattomia API-pyyntöjä, jotka lähetetään uudelleen, mikä aiheuttaa vielä enemmän suorittimen painetta.

Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.

Cause

Tämä hälytys laukeaa, kun suorittimen käyttö pysyy korkeana yhdessä ohjaustason solmussa.

Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
  • Kriittinen
    • kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 1 tunnin ajan.
  • Warning
    • kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 5 m:n kohdalla.
Tämä hälytys laukeaa, kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua voi ylläpitää; yhden ohjaustason solmun katkos voi aiheuttaa kaskadivian; Lisää käytettävissä olevaa suoritinta.

Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
  • Warning
    • kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua, se voi kestää yli 10 metriä.

Resolution

Diagnoosi:

Suorita seuraavat PromQL-kyselyt OCP-verkkokonsolissa vianmäärityksen helpottamiseksi (Tarkkaile → Mittarit → Suorita kyselyt).
Top 5 säilöä, joissa on eniten suorittimen käyttöä tietyssä solmussa:image.png

Hälytyksen voi aiheuttaa esimerkiksi seuraavissa olosuhteissa:

  • Uusi kuormitus tuottaa enemmän puheluita apiserveriin ja aiheuttaa suurta suorittimen käyttöä. Lisää tässä tapauksessa ohjaustason solmujen suoritinta ja muistia.
  • hälytys laukeaa solmun tietojen perusteella, joten on mahdollista, että jokin solmun komponentti aiheuttaa suuren suorittimen käytön.
  • Apiserver/etcd käsittelee enemmän pyyntöjä taustalla olevasta tilasta johtuvien asiakkaan uudelleenyritysten vuoksi.
  • pyyntöjen epätasainen jakautuminen apiserver-instansseihin HTTP2:n vuoksi (se multipleksoi pyynnöt yhden TCP-yhteyden kautta). Kuormituksen tasaajat eivät ole sovelluskerroksessa, joten ne eivät ymmärrä http2: ta.

Lieventäminen:

  • Jos apiserveriin aiheutuu kuormitusta kuormitusta suuren suoritinmäärän vuoksi, lisää ohjaustason solmujen suoritinta ja muistia.
  • Jos suurina pysyvä suorittimen käyttö johtuu klusterin heikkenemisestä:
    • Selvitä hajoamisen perimmäinen syy ja määritä sitten seuraavat vaiheet vastaavasti.

Tuki:

Jos ongelma ei ratkea mitkään yllä olevista toimista, ota yhteyttä Dell EMC:n tekniseen tukeen lisätutkimuksia varten.

 

Additional Information

Jos lokipaketti kerätään, Prometheus-tiedot voidaan myös dumpata täydentävinä materiaaleina.
Kuinka ottaa dumppi klusterin prometheus-tiedoista:

image.png

Affected Products

APEX Cloud Platform for Red Hat OpenShift
Article Properties
Article Number: 000217405
Article Type: Solution
Last Modified: 13 Feb 2026
Version:  3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.