PowerFlexin kirjoitustehoongelmat
Summary: Verkon ylläpidon jälkeen tiettyjen SDS:ien kirjoitusteho on nyt heikko.
Symptoms
Skenaario
- Ongelma ilmenee sen jälkeen, kun verkon ylläpito TOR-kytkimissä (Top of Rack) -kytkimissä on suoritettu, yleensä kytkimien uudelleenkäynnistyksen jälkeen.
- SDS-solmut käyttävät LACP-sidosta tietoverkoissa.
- Tämä vaikuttaa vain SDS-solmuihin, jotka käyttävät kytkimiä, joissa huolto suoritettiin.
- Kirjoitussuorituskyky voi olla jopa satoja millisekunteja tietylle tallennusvarannolle / PD: lle.
- Saman käyttöturvallisuustiedotteen lukusuorituskyky on normaali.
- diag_counters.txt "NET_LONG_RCV_GRP_PROCESS" osoittaa, että arvot nousevat nopeasti, kun taas viimeinen kerta kasvaa pysyy alhaisena.
Esimerkki:
Comp :: Counter :: Value :: ExtData :: Last Counted(Ms) NET :: NET_LONG_RCV_GRP_PROCESS :: 3756453 :: 0xffffffff :: 3120 NET :: NET_LONG_RCV_GRP_PROCESS :: 3825395 :: 0xffffffff :: 960 NET :: NET_LONG_RCV_GRP_PROCESS :: 3705906 :: 0xffffffff :: 1320 NET :: NET_LONG_RCV_GRP_PROCESS :: 4094919 :: 0xffffffff :: 1230 NET :: NET_LONG_RCV_GRP_PROCESS :: 3954725 :: 0xffffffff :: 1390 NET :: NET_LONG_RCV_GRP_PROCESS :: 3594178 :: 0xffffffff :: 420 NET :: NET_LONG_RCV_GRP_PROCESS :: 3702403 :: 0xffffffff :: 680 NET :: NET_LONG_RCV_GRP_PROCESS :: 3830299 :: 0xffffffff :: 510 NET :: NET_LONG_RCV_GRP_PROCESS :: 3491713 :: 0xffffffff :: 330 NET :: NET_LONG_RCV_GRP_PROCESS :: 4155343 :: 0xffffffff :: 690
Tässä esimerkissä kolmannen sarakkeen arvo on suuri (ja kasvaa, jos katsot suorana). Viides sarake näyttää viimeisen kerran, kun se kohdattiin, mikä on alle sekunti suurelle osalle käyttöturvallisuustiedotteita.
Hyvässä kunnossa olevassa PowerFlex-järjestelmässä kolmatta saraketta ei lasketa ylös ja viidettä saraketta lasketaan, koska edellinen kerta kasvaa ajan myötä.
Voit katsella laskureita suorana suorittamalla seuraavat komennot:
#Set kyseisen suojaustoimialueen käyttöturvallisuustiedotteiden muuttuja. Kirjoita tähän oikea PD-nimi.
pd=<PD_NAME>
#Set suojaustoimialueen käyttöturvallisuustiedotteiden määrän muuttuja. Suorita tämä sellaisenaan.
num=`scli --query_protection_domain --protection_domain_name $pd |grep Protection |awk '{print $16}'`
#login, jotta viimeinen komento toimii.
scli --login --username admin
#Watch oikea laskuri kunkin SDS:n query_diag_counters"-komennosta.
watch -d -n 1 "for x in \$(scli --query_all_sds | grep -A $num $pd | grep ID | awk '{print \$5}'); do echo \$x; scli --query_diag_counters | grep -A30 \$x | grep -Em1 '\$x|NET_LONG_RCV_GRP_PROCESS'; done"
Terveessä järjestelmässä voidaan odottaa, että viides sarake laskee säännöllisesti ajan myötä ja kolmas sarake on staattinen. Jos viidennen sarakkeen aika pysyy alhaisena ja kolmas sarake laskee, tämä on oire ongelmasta.
Vaikutus
Kirjoittamisen suorituskyky on heikko asiakkaille.
Cause
Edellä seurattava NET_LONG_RCV_GRP_PROCESS osoittaa, että TCP-tietojen lähettäminen etä-SDS:ään kesti kauemmin kuin 1 s.
Tämä viive voi johtua pienestä TCP-ruuhkaikkunasta verkon ylläpidon jälkeen eikä OOO (Out of Order) -pakettiparametria ole määritetty asianmukaisesti käyttöjärjestelmässä. Tämä aiheuttaa sen, että SDS-liitännät SDS-liitäntöihin eivät pysty kommunikoimaan tehokkaasti, mikä johtaa useisiin TCP-uudelleenlähetyksiin ja segmentin koon pienenemiseen. Tämä suurentaa kirjoitusviivettä, koska tämä vaikuttaa vain SDS–SDS-pistokkeisiin.
Tämä ei vaikuta lukuviiveeseen, koska SDC:t (asiakkaat) kommunikoivat yhdellä SDS:llä luettua IO-lukua kohden eivätkä ole riippuvaisia SDS:n ja SDS TCP:n välisestä viestinnästä.
Resolution
Voit kiertää ongelman välittömästi käynnistämällä SDS-palvelun uudelleen jokaisessa solmussa, jota ongelma koskee. Käytä huoltotilaa, kun käynnistät SDS-prosessin uudelleen. "Pkill sds" riittää, kun solmu on huollossa.
Voit estää ongelman toistumisen jatkossa seuraavasti:
- Käytä tässä julkisessa tietämyskannan artikkelissa käsiteltyjä sysctl-asetuksia:
Tallennusdatapalvelinsolmut eivät välttämättä sisällä oikeita järjestelmän hienosäätöparametreja, mikä voi aiheuttaa suorituskykyongelmia
- Jos käytössä on RHEL/CentOS 7, päivitä SDS-solmujen käyttöjärjestelmän ytimen versio versioon 3.10.0-1160.66.1 tai uudempaan
Versio, jota ongelma koskee
PowerFlex 3.x
Korjattu versiossa
RCM-versio 3.6.3.2 tai uudempi
IC-versio 38.363.02 tai uudempi