Openshift-tapahtumakoodi: 1030NODE0001
Summary: Jatkuva korkea suorittimen käyttö yhdessä ohjaustason solmussa, suurempi suorittimen paine aiheuttaa todennäköisesti vikasietoisuuden; Lisää käytettävissä olevaa suoritinta.
This article applies to
This article does not apply to
This article is not tied to any specific product.
Not all product versions are identified in this article.
Symptoms
Äärimmäinen suorittimen paine voi hidastaa sarjoittamista ja heikentää kube-apiserverin ja etcd: n suorituskykyä. Kun näin tapahtuu, on olemassa riski, että asiakkaat näkevät vastaamattomia API-pyyntöjä, jotka lähetetään uudelleen, mikä aiheuttaa vielä enemmän suorittimen painetta.
Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.
Se voi myös aiheuttaa epäonnistuneita elävyysantureita, jotka johtuvat hitaasta etcd-reagoinnista taustalla. Jos yksi kube-apiserver epäonnistuu tässä tilassa, on todennäköistä, että koet kaskadin, koska myös jäljellä olevat kube-api-palvelimet ovat alivarattuja.
Cause
Tämä hälytys laukeaa, kun suorittimen käyttö pysyy korkeana yhdessä ohjaustason solmussa.
Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
Hälytyksen voimakkuus määräytyy sen mukaan, kuinka kauan solmu käyttää paljon suoritinta:
- Kriittinen
- kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 1 tunnin ajan.
- Warning
- kun suorittimen käyttö yksittäisessä ohjaustason solmussa on yli 90 % yli 5 m:n kohdalla.
Hälytyksen kiireellisyys määräytyy sen mukaan, kuinka kauan suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua kestää.
- Warning
- kun suorittimen käyttö kaikissa kolmessa ohjaustason solmussa on suurempi kuin kaksi ohjaustason solmua, se voi kestää yli 10 metriä.
Resolution
Diagnoosi:
Suorita seuraavat PromQL-kyselyt OCP-verkkokonsolissa vianmäärityksen helpottamiseksi (Tarkkaile → Mittarit → Suorita kyselyt).Top 5 säilöä, joissa on eniten suorittimen käyttöä tietyssä solmussa:
Hälytyksen voi aiheuttaa esimerkiksi seuraavissa olosuhteissa:
- Uusi kuormitus tuottaa enemmän puheluita apiserveriin ja aiheuttaa suurta suorittimen käyttöä. Lisää tässä tapauksessa ohjaustason solmujen suoritinta ja muistia.
- hälytys laukeaa solmun tietojen perusteella, joten on mahdollista, että jokin solmun komponentti aiheuttaa suuren suorittimen käytön.
- Apiserver/etcd käsittelee enemmän pyyntöjä taustalla olevasta tilasta johtuvien asiakkaan uudelleenyritysten vuoksi.
- pyyntöjen epätasainen jakautuminen apiserver-instansseihin HTTP2:n vuoksi (se multipleksoi pyynnöt yhden TCP-yhteyden kautta). Kuormituksen tasaajat eivät ole sovelluskerroksessa, joten ne eivät ymmärrä http2: ta.
Lieventäminen:
- Jos apiserveriin aiheutuu kuormitusta kuormitusta suuren suoritinmäärän vuoksi, lisää ohjaustason solmujen suoritinta ja muistia.
- Jos suurina pysyvä suorittimen käyttö johtuu klusterin heikkenemisestä:
- Selvitä hajoamisen perimmäinen syy ja määritä sitten seuraavat vaiheet vastaavasti.
Tuki:
Jos ongelma ei ratkea mitkään yllä olevista toimista, ota yhteyttä Dell EMC:n tekniseen tukeen lisätutkimuksia varten.
Additional Information
Jos lokipaketti kerätään, Prometheus-tiedot voidaan myös dumpata täydentävinä materiaaleina.
Kuinka ottaa dumppi klusterin prometheus-tiedoista:

Affected Products
APEX Cloud Platform for Red Hat OpenShiftArticle Properties
Article Number: 000217405
Article Type: Solution
Last Modified: 13 Feb 2026
Version: 3
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.