Live Optics | 옵티컬 프라임 | 대기열 크기: 자세히 살펴보기
Summary: 이 문서에서는 Live Optics가 대기열 길이를 보고하는 방법에 대해 설명합니다.
Instructions
디스크 대기열은 종종 응용 프로그램 성능 저하의 첫 번째 지표로 생각되지만 너무 일찍 비난받는 경우가 많습니다. 다음 설명은 Disk Que를 이해하기 위한 몇 가지 기본 접근 방식을 이해하기 위한 빠르고 더러운 가이드입니다.
이것을 두 부분으로 나눠 보겠습니다. 읽을 시간이 없는 분들을 위한 기본 뺑소니 생존 가이드와 Disk Queue가 처음에 초점이 되어야 하는 이유에 대한 보다 심층적인 이해.
생존 가이드:
AN Optical Prime 프로젝트는 기록 기간 동안 각 샘플에 대해 OS의 관점에서 미해결 IO 수를 보여줍니다. 디스크 대기열이 문제인 경우 동일한 기간의 레이턴시와 밀접하게 연관되어야 합니다. 그래서, 좋은 것에서 나쁜 것 :
- 낮은 디스크 대기열 및 짧은 대기 시간 = 만족스러운 애플리케이션 및 사용자 경험 가능성
- 높은 디스크 대기열 및 짧은 대기 시간 = 대기 시간이 바람직하다면 정상이어야 합니다.
- 디스크 대기열 부족 및 긴 대기 시간 = 주의가 필요하지만 스토리지가 아닐 가능성은 낮습니다.
- 높은 디스크 및 긴 대기 시간 = 스토리지를 잠재적인 병목 현상으로 간주해야 합니다.
이 마지막 것을 조사해야 하며 여기에서 시간 경과에 따른 성능을 나타내는 Optical Prime의 값이 중요합니다. 디스크 대기열이 레이턴시의 원인이라면 두 값 간에 밀접한 상관 관계가 있는 패턴을 확인해야 합니다.
다음은 레이턴시와 디스크 대기열 간의 양호한 상관 관계의 예를 보여 주는 항목입니다.
디스크 대기열 길이의 기본 사항을 이해하려면 지역 "Food-Mart"의 계산대를 생각해 보십시오. 모두가 드릴을 알고 있습니다 ... 당신은 당신의 항목을 선택하고, 체크 아웃을 위해 줄을 서고, 당신의 차례가되면 지불하고, 마침내 당신은 항목을 소유합니다.
모두가 휴일이나 늦은 밤에 줄이 길고 가난한 계산대 점원이 "왜 경영진이 더 많은 계산대를 열지 않느냐"고 말하는 화가 난 사람들이 줄을 서고 있습니다.
기본적인 수준의 정의에서 디스크 대기열은 "대기 중"인 미해결 디스크 작업 수이므로 스토리지 문제를 나타내기 위해 자주 고려됩니다.
우리 모두는 Food-Mart에 더 많은 계산대 점원을 추가하면 줄이 팬아웃되고 더 빨리 갈 수 있다는 것을 알고 있으며 병행 작업의 정도를 늘렸기 때문에 그렇게 하고 있습니다. IO 요청에도 동일한 기본 원칙을 적용할 수 있습니다. 서버에 디스크가 하나만 있어도 이 모든 작업을 수행하거나 작은 RAID 5가 이 작업을 수행한다고 가정해 보겠습니다. 그런 다음 애플리케이션이 I/O에 대한 체크아웃 라인이 백업될 워크로드 수요를 생성한다고 상상할 수 있습니다. 이 높은 디스크 대기열 현상을 "스핀들 바운드"라고 합니다. 평범하고 간단히 말해서 디스크가 수요를 따라갈 수 없으므로 줄이 형성되고 운영 체제에 대한 대기 시간으로 나타납니다.
기본 지침은 2-4개 이상의 디스크 대기열이 불량이라는 것입니다.
쉽죠? 글쎄, 불행히도 더 복잡해집니다.
규칙은 디스크 당 2-4 개 이상의 디스크 대기열이 나쁘다는 것입니다. 어려워지는 이유는 Optical Prime이 "F: 운전하세요."
충분히 사소해 보이지만 디스크 수를 잡고 하루라고 부르지 않는 이유는 무엇입니까? 글쎄요, 우리가 항상 그렇게 할 수는 없습니다. 일부 드라이브는 실제로 파티션이며 E: 및 F: 드라이브는 동일한 디스크에 있을 수 있습니다. 더 나은 진실 마스크는 스토리지 어레이 자체에서 나옵니다.
운영 체제의 볼륨 또는 LUN을 나타낼 수 있는 모든 외부 디스크 어레이는 OS에서 원하는 수의 드라이브를 마스킹할 수 있습니다. 예를 들어, 어레이에는 LUN을 구성하는 4개 또는 9개의 디스크로 구성된 RAID 그룹이 있을 수 있으며, 이 그룹은 Windows OS에 "F: 드라이브"... 따라서 디스크 대기열이 15이면 나쁜가요? 아니면 괜찮습니까?
애플리케이션 간섭
일부 애플리케이션은 디스크 대기열을 관리하거나 디스크 대기열에 응답할 수 있습니다. SQL Server와 같은 관리 기술 애플리케이션은 처리되지 않은 I/O를 너무 많이 생성하지 않도록 I/O를 제한할 수 있습니다. 디스크 대기열이 올라가는 것을 확인하면 문제가 통제 불능 상태가 되지 않도록 하여 문제를 숨길 수 있습니다.
데이터 패턴
푸드 마트 (Food-Mart)의 체크 아웃 카운터로 돌아 가십시오. . . 매니저가 마침내 잠에서 깨어나 세 개의 새로운 체크아웃 레인을 열었을 때, 사람들은 구매가 관련이 없기 때문에 팬 아웃하고 줄을 통과할 수 있습니다. 랜덤 I/O와 같습니다. 각 사람은 다른 사람과 독립적으로 라인을 통과합니다. 랜덤 IO도 동일합니다. 각 작업은 가능한 한 빨리 완료되기를 원하며 다른 사람에 대해서는 실제로 신경 쓰지 않습니다.
순차 데이터는 그 반대이며 영화처럼 생각할 수 있습니다. 동영상은 동영상의 효과를 주기 위해 "순서대로" 재생되는 일련의 스틸 프레임 사진입니다. 영화가 의미가 있으려면 해당 프레임이 순서대로 재생되어야 하며 영화가 의미가 있으려면 해당 순서에 따라 달라집니다. (물론 쿠엔틴 타란티노 영화는 제외)
순차적 I/O를 병렬 작업으로 분할할 수 없는 경우가 많습니다. 순차 워크로드를 실행하는 프로그램의 특성에 따라 디스크 대기열 및 대기 시간이 증가할 수도 있고 그렇지 않을 수도 있지만 I/O 전송 크기까지 확장되는 유사한 상관 관계는 볼 수 있습니다. 이에 대한 자세한 내용은 I/O 전송 크기가 지연 시간에 미치는 영향에 대한 게시물을 참조하세요.
요약
오늘날 SSD와 가상화된 스토리지를 사용하면 디스크에 병목 현상이 발생할 가능성이 15K RPM 드라이브가 가장 높은 계층이었을 때와 같지 않습니다. 그럼에도 불구하고 대기 시간 문제를 찾을 때마다 살펴볼 가치가 있습니다.
지연 시간의 원인을 찾는 것보다 디스크가 지연 시간의 원인임을 배제하는 것이 거의 쉽습니다. 그러나 적어도 볼 곳이 하나 줄어들 수 :).
Additional Information
질문이 있으면 Live Optics Support(liveoptics.support@dell.com)로 연락하여 도움을 요청하십시오.