Live Optics | Optická primární | Hloubka fronty: Hlubší pohled
Summary: Článek pojednává o tom, jak technologie Live Optics hlásí hloubku fronty.
Instructions
Fronta disků je často považována za první indikátor špatného výkonu aplikace, ale často je obviňována příliš brzy. Následující vysvětlení je rychlým a špinavým průvodcem, jak porozumět některým základním přístupům k demystifikaci Disk Que.
Rozdělme si to na dvě části. Základní příručka pro přežití "udeř a uteč" pro ty z vás, kteří nemají čas číst dál a hlouběji porozumět tomu, proč se Disková fronta stala ústředním bodem.
Průvodce pro přežití:
Projekt Optical Prime ukazuje počet nevyřízených IO z pohledu operačního systému pro každý vzorek během období záznamu. Pokud je problémem fronta disku, měla by být úzce spojena s latencí ve stejném období. Takže, od dobrého k horšímu:
- Nízká fronta disku a nízká latence = Pravděpodobně spokojená aplikace a uživatelská zkušenost
- Vysoká fronta disku a nízká latence = Pokud latence zůstane žádoucí, mělo by to být v pořádku.
- Nízká fronta disku a vysoká latence = Vyžaduje pozornost, ale pravděpodobně se nebude jednat o vaše úložiště.
- Vysoký disk a vysoká latence = Měli byste se dívat na vaše úložiště jako na potenciální kritické místo.
Tento poslední by měl být prozkoumán a zde je důležitá hodnota Optical Prime představující výkon v průběhu času. Pokud latenci způsobuje fronta disku, měli byste vidět úzce korelované vzory mezi těmito dvěma hodnotami.
Zde je položka, která ukazuje příklad dobré korelace mezi latencí a frontou disků.
Chcete-li pochopit základy délky fronty na disky, představte si frontu u pokladny v místním "Food-Martu". Každý ví, jak to chodí... Vyberete si své položky, postavíte se do fronty na pokladnu, když na vás přijde řada, zaplatíte a nakonec položku vlastníte.
Všichni tam také byli na dovolené nebo pozdě v noci, kdy je fronta dlouhá a chudák pokladní má frontu naštvaných lidí, kteří říkají: "Proč vedení prostě neotevře více pokladních pruhů!"
Na základní úrovni definice je fronta disků počet nevyřízených diskových operací, které "čekají ve frontě", a tedy důvod, proč se na ni často pohlíží jako na indikaci potíží s úložištěm.
Všichni víme, že přidání dalších pokladních ve Food-Martu by frontu roztáhlo a zrychlilo, a to proto, že jsme zvýšili míru naší paralelní práce. Stejné základní principy lze aplikovat i na vstupně-výstupní požadavky. Kdybych měl na serveru jen jeden disk, který by se snažil dělat všechnu tu práci, nebo dokonce, řekněme, malé pole RAID 5, které by se o to pokoušelo. Pak bychom si mohli představit, že by aplikace vygenerovala poptávku po úlohách, kde by se zálohoval řádek rezervace pro vstupně-výstupní operace. Tento vysoký jev fronty disků se nazývá "Spindle Bound". Jednoduše řečeno, disky nemohou držet krok s poptávkou, takže se vytvoří linka, která se projeví jako latence operačního systému.
Základním pravidlem je, že fronta disků s více než 2-4 je špatná.
Snadné, že? No, bohužel se to komplikuje.
Pravidlem je, že disková fronta více než 2-4 na disk je špatná... důvodem, proč je to těžké, je to, že Optical Prime vám neřekne, kolik disků tvoří "F: Jezděte."
Zdá se to dost triviální, proč nevezmeme počet disků a nezavoláme tomu den? To se nám ne vždy podaří. Některé jednotky jsou ve skutečnosti oddíly a jednotky E: a F: mohou být na stejném disku. Lepší maskování pravdy pochází ze samotných diskových polí.
Jakékoli externí diskové pole, které může představovat svazek nebo jednotku LUN pro operační systém, může maskovat libovolný počet jednotek z operačního systému. Pole může mít například skupinu RAID 4 nebo 9 disků tvořících logickou jednotku, která je v operačním systému Windows reprezentována jako "F: Řídit"... takže pokud máme frontu disků 15, je to špatné ... nebo je to v pořádku?
Interference
aplikaceNěkteré aplikace mohou frontu disků spravovat nebo na ni reagovat. Aplikace techniky správy, jako je SQL Server, může omezit vstupně-výstupní operace, aby se nevytvářelo příliš mnoho nevyřízených vstupně-výstupních operací. Pokud vidí, že fronta disků stoupá, může problém zamaskovat tím, že nedovolí, aby se vymkla kontrole.
Datové vzory
Zpátky u pokladny ve Food-Martu... Když se manažer konečně probudí a otevře tři nové pokladny, lidé se mohou rozprostřít a projít fronty, protože jejich nákupy spolu nesouvisí. Jsou jako náhodné I/O. Každý člověk prochází linkou nezávisle na komkoli jiném. Náhodné vstupně-výstupní operace jsou stejné. Každá operace chce skončit co nejrychleji a o nikoho jiného se moc nestará.
Sekvenční data jsou opakem a lze si je představit spíše jako film. Film je série fotografií se statickými snímky, které se přehrávají "postupně", aby vám poskytly efekt filmu. Aby film dával smysl, musí být tyto snímky přehrávány v pořadí a jsou závislé na tomto pořadí, aby film dával smysl. (samozřejmě bez filmů Quentina Tarantina)
Sekvenční vstupně-výstupní operace často nelze rozdělit na paralelní činnost. V závislosti na povaze programu, na kterém běží sekvenční úloha, se může nebo nemusí zobrazit zvýšená fronta disku a latence, ale může se zobrazit podobná korelace, která se rozšiřuje na velikost vstupně-výstupního přenosu. Chcete-li se o tom dozvědět více, přečtěte si příspěvek o tom, jak může velikost přenosu I/O ovlivnit latenci.
Shrnutí
Dnes, s disky SSD a virtualizovanými úložišti, není šance, že budou disky kritickým hrdlem, stejná jako v době, kdy byly disky s 15 000 otáčkami za minutu nejvyšší úrovní. Nicméně je to něco, co stojí za to prozkoumat pokaždé, když hledáte problém s latencí.
Je téměř snazší vyloučit, že latenci způsobuje disk, než najít příčinu latence. Ale alespoň můžete mít o jedno místo méně, kde se můžete podívat :).
Additional Information
V případě jakýchkoli dotazů se obraťte na podporu Live Optics na adrese liveoptics.support@dell.com.