ScaleIO Ready Node: Opakované opětovné vytvoření v clusteru ScaleIO Ready Node
Summary: Cluster ScaleIO Dell Ready Node může při nesprávné konfiguraci cache DAS aktivovat opakované přebudování.
Symptoms
Když je mezipaměť DAS/SSD plná, mezipaměť DAS začne vyprazdňovat data z SSD na pevný disk. Dělá to tak, že na malou část disku posílá velké množství vstupně-výstupních operací, čímž minimalizuje vyhledávání a maximalizuje propustnost pevného disku. Pokud jsou na stejném pevném disku další vstupně-výstupní operace, např. některá velká čtení, která obešla mezipaměť, jsou vydána pro jiné umístění na disku, řadič RAID a disk upřednostní vstupně-výstupní operace s malými výstupy ve snaze dosáhnout maximální propustnosti a někdy způsobí, že ostatní vstupně-výstupní operace budou mít vysokou latenci.
Cause
Resolution
Použijte níže uvedená nastavení konfigurace a postupně povolte mezipaměť DAS (na uzel Dell s přípravou na ScaleIO):
1. V režimu údržby (Maintenance Mode) zadejte příslušný SDS.
2. Změna konfigurace cache DAS:
a. Nastavení parametrů cache DAS:
fscli --set-param AggressiveCachePopulation=0 fscli --set-param BypassLengthKB=128 fscli --set-param RcMaxLengthKB=32 fscli --set-param LowSpaceBypassKb=0
b. Upravte konfigurační soubor mezipaměti DAS ("/etc/fio/config"):
FlusherCmdsNormalToBeStarted = 1 FlusherMaxCmdsToBeStarted = 2
C. Resetujte uzel a znovu načtěte ovladač mezipaměti DAS, aby se použila nastavení (je potřeba pouze pro krok "b") 2. Změna nastavení mezipaměti pro zápis do pole RAID serveru na průchozí (s okamžitou platností):
/opt/MegaRAID/perccli/perccli64 /c0/vall set wrcache=wt
3. Upravte výkonnostní parametry ScaleIO následujícím způsobem (pouze správa – s okamžitou platností):
scli --set_performance_parameters --sdc_max_inflight_requests 200 --all_sdc --tech scli --set_performance_parameters --sdc_max_inflight_data 20 --all_sdc --tech
4. Ukončete příslušný SDS z režimu údržby. Doporučujeme použít výše uvedená nastavení na začátku pouze u jednoho bezpečnostního listu, několik dní kontrolovat, zda vše funguje správně, než přejdete k dalšímu bezpečnostnímu listu, atd.