PowerFlex: MDM:n toistuvat katkokset
Summary: PowerFlex-komponentit, kuten MDM, irtoavat ja kytkeytyvät uudelleen nopeasti ja usein. Yhteys katkesi ja sen jälkeen yhteys löytyi MDM-tapahtumista Yhdistetään 80–190 ms:n jälkeen
Instructions
Oireet
MDM-tapahtumalokit, joissa näkyy MDM-komponentin toistuva irrottaminen ja uudelleenkytkeminen:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, <MDM_Name> (ID <MDM_ID>), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, <MDM_Name> (ID <MDM_ID>), connected after 110ms
Sar-lähtö MDM-palvelimen yhteys katkeamassa, TCP-uudelleenlähetysten määrä on suuri:
sar -n ETCP 1 -t -f sar.0
atmptf/s estres/s retrans/s isegerr/s orsts/s
00:00:27 AM 0.00 0.00 62.00 0.00 0.00
00:00:28 AM 0.00 0.00 88.12 0.00 0.00
00:00:29 AM 0.00 3.00 100.00 0.00 0.00
00:00:30 AM 0.00 0.00 71.29 0.00 0.00
00:00:31 AM 0.00 0.00 71.00 0.00 0.00
...
00:01:02 AM 0.00 0.00 48.51 0.00 0.00
00:01:03 AM 0.00 0.00 15.00 0.00 0.00
00:01:04 AM 0.00 0.00 207.00 0.00 0.00
00:01:05 AM 0.00 0.00 36.00 0.00 0.00
00:01:06 AM 0.00 0.99 105.94 0.00 0.00
Vaikutus
Lyhyet MDM-klusterin heikentyneet tapahtumat
Suorituskyvyn heikkeneminen
Pääsyy
MDM-palvelin korjattiin ja Linux-ydin päivitettiin 3.x:stä 5.x:ään. Tämä ytimen päivitys muuttaa monet käyttöjärjestelmän oletusparametrit eri arvoiksi. Tässä tapauksessa TCP-parametri "net.ipv4tcp_fack" oli poistettu käytöstä, muun muassa, mutta tämä näytti aiheuttaneen korkeat TCP-uudelleenlähetykset.
SDS RPM sisältää emc.conf-nimisen määritystiedoston hakemistossa /opt/emc/scaleio/sds/cfg/. Tämä tiedosto sisältää useita Dellin suosittelemia käyttöjärjestelmäparametreja.
Jos kyseessä on PowerFlex-kehikko-/laiteympäristö, PowerFlex Manager kopioi emc.conf-tiedoston automaattisesti kansiosta /opt/emc/scaleio/sds/cfg kunkin palvelimen systcl.conf-tiedostoon ja ottaa sen käyttöön. Tämä tapahtuu vain solmun ensimmäisessä käyttöönotossa. On mahdollista, että sysctl.conf-tiedostoa ei päivitetty oikein. Jos sysctl.conf-tiedostoa ei ole oikeilla arvoilla, ytimen päivityksen jälkeen 5.x: ään on mahdollista, että jotkin tärkeät parametrit muuttuvat.
Kiertotapa
Jos PowerFlex Rack/Appliance -ympäristössä sysctl.conf ei sisällä kaikkia emc.conf-tiedoston parametreja, emc.conf-tiedosto kannattaa kopioida kuhunkin palvelintiedostoon /etc/sysctl.conf. Ota muutokset käyttöön palvelimessa. Palvelin voidaan joko käynnistää uudelleen tai komennolla sysctl -p voidaan ottaa käyttöön muutokset tiedostosta /etc/sysctl.conf. Varmista, että kunnossapidon parhaat käytännöt tehdään näitä muutoksia tehtäessä.
Dell Technologies suosittelee, että vain ohjelmistolla varustettuja Linux-parametreja käytetään kaikissa palvelimissa, mutta viime kädessä asia on yrityksen päätettävissä. Kysy käyttöjärjestelmän valmistajalta parhaat käytännöt tai jos sinulla on kysyttävää.
Versiot, joita ongelma koskee
Kaikki PowerFlex-versiot