Live Optics |光學定焦 |佇列深度:深入瞭解
Summary: 本文探討 Live Optics 如何報告佇列深度。
Instructions
磁碟佇列通常被認為是應用程式性能不佳的第一個指標,但它經常被指責得太早。以下解釋是一個快速而骯髒的指南,用於瞭解揭開磁碟闕神秘面紗的一些基本方法。
讓我們把它分成兩部分。對於那些沒有時間繼續閱讀的人,基本的肇事逃逸生存指南,並更深入地了解為什麼磁碟佇列首先成為焦點。
生存指南:
AN 光學 Prime 專案從操作系統的角度顯示整個錄製期間每個樣本的未完成 IO 數量。如果磁碟佇列是問題所在,則應與同一時間段的延遲緊密關聯。所以,從好到壞:
- 低磁碟佇列和低延遲 = 可能令人滿意的應用程式和用戶體驗
- 高磁碟佇列和低延遲 = 如果延遲保持理想狀態,這應該沒問題。
- 低磁碟佇列和高延遲 = 需要注意,但它不太可能是您的存儲。
- 高磁碟和高延遲 = 應將您的存儲視為潛在的瓶頸。
最後一個應該進行調查,以下是表示隨時間變化的性能的光學Prime值很重要的地方。如果磁碟佇列導致延遲,則應會看到這兩個值之間緊密相關的模式。
以下項目顯示了延遲與磁碟佇列之間良好關聯的範例。
要瞭解磁碟佇列長度的基礎知識,請考慮您當地的“食品市場”的結帳行。每個人都知道演習...您選擇您的物品,排隊簽出,輪到您付款時,最後您擁有該物品。
每個人在假期或深夜也去過那裡,當隊伍很長時,可憐的收銀員有一排不高興的人說:“為什麼管理層不開放更多的結帳通道!
在基本的定義級別中,磁碟佇列是“排隊等候”的未完成磁碟操作的數量,因此經常將其視為指示存儲問題的原因。
我們都知道,在 Food-Mart 增加更多的結帳員會使線路呈扇形散開並運行得更快,這樣做是因為我們提高了並行工作的程度。相同的基本原則可套用至 IO 要求。如果我的伺服器中只有一個磁碟在嘗試執行所有這些工作,甚至是一個小型 RAID 5 在嘗試執行該工作。然後,我們可以設想應用程式將生成工作負載需求,其中 I/O 的簽出行將得到備份。這種高磁碟佇列現象稱為「心軸綁定」。簡單地說,磁碟無法跟上需求,因此形成了一條線,這表現為操作系統的延遲。
基本準則是磁碟佇列超過 2-4 個是不好的。
很簡單,對吧?好吧,不幸的是,它變得更加複雜。
規則是每個磁碟超過 2-4 個的磁碟佇列是不好的...它變得困難的原因是Optical Prime沒有告訴您「F:開車。
似乎已經足夠微不足道了,我們為什麼不抓住磁碟的數量並稱之為一天呢?好吧,我們不能總是這樣做。有些磁碟機實際上是分割區,E: 和 F: 磁碟機可能位於同一個磁碟上。更好的事實掩碼來自存儲陣列本身。
任何可能代表作業系統的磁碟區或 LUN 的外部磁碟陣列都可能遮罩作業系統中任意數量的驅動器。例如,陣列可能有一個由 4 或 9 個磁碟組成的 RAID 組,組成 LUN,在 Windows 作業系統中顯示為「F:驅動“...因此,如果我們的磁碟佇列為 15,這很糟糕......還是可以嗎?
應用程式干擾
某些應用程式可以管理磁碟佇列或回應它。SQL Server 等管理技術應用程式可降低 I/O 節流,以避免建立太多未完成的 IO。如果他們看到磁碟佇列正在攀升,它可以通過不允許它失控來掩蓋問題。
資料模式
回到食品超市的收銀台...當經理最終醒來並打開三條新的結帳通道時,人們可以扇出並排隊,因為他們的購買無關。它們就像隨機 I/O。每個人都獨立於其他人通過這條線。隨機 IO 是相同的。每個操作都希望儘快完成,並不真正關心其他人。
順序數據則相反,可以認為更像是電影。影片是一系列「依次」播放的靜止幀照片,可為您提供電影的效果。為了使電影有意義,這些幀必須按順序播放,並且依賴於該順序才能使電影有意義。(當然不包括昆汀·塔倫蒂諾的任何電影)
通常,順序 I/O 不能中斷為並行活動。根據運行順序工作負載的程序的性質,您可能會也可能不會看到磁碟佇列和延遲量增加,但可能會看到類似的關聯擴展到 I/O 傳輸大小。要瞭解有關此內容的更多資訊,請閱讀有關 I/O 傳輸大小如何影響延遲的文章。
總結
現今有了固態硬碟和虛擬化儲存裝置,磁碟成為瓶頸的機率已不同於最高層級的 15K RPM 磁碟機。儘管如此,每次尋找延遲問題時都值得研究。
排除磁碟造成延遲,幾乎比找出延遲的原因更容易。但至少你可以少看一個地方:)。
Additional Information
如有任何問題,請聯絡 Live Optics 支援:liveoptics.support@dell.com。