Skala PowerScale | Zrozumienie strategii pamięci podręcznej L3 i metadanych
Summary: PowerScale oferuje elastyczność w zakresie korzystania z dysków półprzewodnikowych (SSD) w puli węzłów w celu zwiększenia wydajności. Dwie podstawowe strategie to pamięć podręczna L3 i akceleracja metadanych. Pamięć podręczna L3 jest przeznaczona do buforowania często używanych danych i metadanych w celu poprawy wydajności odczytu. Akceleracja metadanych dedykuje dyski SSD do przechowywania i przyspieszania operacji na metadanych, co może być korzystne w przypadku obciążeń roboczych intensywnie korzystających z metadanych. ...
Instructions
Opis pamięci podręcznej L3:
Pamięć podręczna L3: Pamięć podręczna L3 to dodatkowy poziom pamięci podręcznej na dyskach SSD, który uzupełnia podstawową pamięć podręczną (L1 i L2). Działa jako pamięć podręczna eksmisji, przechowując często używane dane i metadane w celu zmniejszenia opóźnień odczytu. Pamięć podręczna L3 jest najbardziej korzystna w przypadku przepływów pracy obejmujących losowy dostęp do plików. Może działać tylko w trybie metadanych dla węzłów pamięci masowej serii archiwów. Włączenie pamięci podręcznej L3 w puli węzłów z danymi istniejącymi na dyskach SSD wymaga opróżnienia tych danych na dyski twarde, zanim dyski SSD będą mogły zostać użyte do buforowania. Wyłączenie pamięci podręcznej L3 jest zazwyczaj szybszą operacją.
Przepływy pracy korzystające z pamięci podręcznej L3:
-
- Pamięć podręczna L3 jest korzystna w przypadku przepływów pracy o następujących cechach:
- Losowy dostęp do plików: Obciążenia robocze wymagające częstego odczytu różnych, niesekwencyjnych części plików mogą spowodować znaczne zmniejszenie opóźnień dzięki pamięci podręcznej L3.
- Wysoki współczynnik odczytu do zapisu: Ponieważ pamięć podręczna L3 przede wszystkim przyspiesza odczyt, najbardziej korzystny jest przepływ pracy z dominującym komponentem odczytu.
- Buforowanie często używanych "gorących" danych: Pamięć podręczna L3 automatycznie identyfikuje i przechowuje często używane dane, zwiększając wydajność w przypadku wielokrotnego dostępu.
- Streaming i równoczesny dostęp do plików (do pewnego stopnia): Podczas gdy dostęp losowy przynosi największe korzyści, przepływy pracy z przesyłaniem strumieniowym i równoczesnym dostępem mogą również ulec pewnej poprawie wydajności dzięki pamięci podręcznej L3.
Kiedy wybrać pamięć podręczną L3:
-
- Gdy podstawowym wąskim gardłem wydajności są opóźnienia odczytu losowego danych i metadanych.
- Zwiększenie efektywnej pojemności pamięci węzłów bez ponoszenia kosztów większej ilości pamięci RAM.
- W przypadku obciążeń roboczych, które wykazują znaczny odczyt danych i metadanych, które zostały niedawno wykluczone z L2.
- W przypadku węzłów klasy archiwum, w których wydajność metadanych dla przechodzenia przez system plików ma kluczowe znaczenie.
- Gdy wymagane jest prostsze zwiększenie wydajności odczytu typu "ustaw i zapomnij" bez znacznego obciążenia konfiguracyjnego.
Kiedy wybrać akcelerację metadanych: - Gdy operacje na metadanych (wyszukiwania, dostęp, modyfikacje) są głównym wąskim gardłem wydajności.
- W przypadku obciążeń z dużą liczbą odczytów metadanych (przyspieszanie odczytu metadanych) lub zarówno odczytów, jak i zapisów (przyspieszanie odczytu/zapisu metadanych).
- W scenariuszach, takich jak interpretacja sejsmiczna, w których szybki dostęp do metadanych ma kluczowe znaczenie, nawet jeśli dane bazowe znajdują się w wolniejszej pamięci masowej.
- Gdy wymagana jest szczegółowa kontrola nad miejscem przechowywania metadanych.
- Gdy konieczne jest rozszerzenie korzyści z odczytu metadanych na węzły bez lokalnych dysków SSD (użycie GNA z przyspieszeniem odczytu metadanych w innych węzłach).
- Obciążenia, takie jak katalogi domowe, przepływy pracy z dużym wyliczaniem plików i działania wymagające wielu porównań, często wykazują wysoką aktywność odczytu metadanych. W takich przypadkach przyspieszenie bezpośredniego dostępu do metadanych może prowadzić do znacznego wzrostu wydajności
Zrozumienie strategii metadanych:
Strategia metadanych: Zamiast buforować dane, dyski SSD można skonfigurować przede wszystkim do przechowywania i przyspieszania operacji na metadanych. Ta strategia może być korzystna w przypadku obciążeń z dużą ilością dostępu do metadanych, takich jak wiele małych plików, częste wyszukiwania katalogów i zadania aparatu zadań intensywnie korzystające z metadanych. OneFS obsługuje różne strategie dysków SSD metadanych, w tym odczyt metadanych i zapis metadanych.
Metadane-odczyt: Dyski SSD służą przede wszystkim do przyspieszania operacji odczytu metadanych.
Zapis metadanych: Dyski SSD służą do przyspieszania operacji zapisu metadanych.
- Zalety strategii metadanych w porównaniu z pamięcią podręczną L3:
- Akceleracja metadanych zapewnia bardziej ukierunkowaną i szczegółową kontrolę nad sposobem wykorzystania dysków SSD w celu zwiększenia wydajności metadanych dla określonych zestawów danych i przepływów pracy. Z drugiej strony pamięć podręczna L3 to bardziej ogólna warstwa buforowania, która przynosi korzyści szerszemu zakresowi obciążeń, szczególnie tym z wielokrotnym dostępem do odczytu losowego zarówno danych, jak i metadanych. Pamięć podręczna L3 doskonale poprawia wydajność odczytu często używanych danych, jednak dedykowana strategia metadanych może przynieść określone korzyści:
- Zwiększona wydajność metadanych: W przypadku obciążeń, w których operacje na metadanych stanowią wąskie gardło (np. otwieranie, zamykanie, zmiana nazwy, wyświetlanie dużej liczby plików), dedykowanie dysków SSD do metadanych może znacznie zmniejszyć opóźnienia i poprawić ogólną przepustowość.
- Zwiększona wydajność mechanizmu zadań: Niektóre zadania aparatu zadań OneFS intensywnie korzystają z metadanych. Przyspieszenie dostępu do metadanych może skrócić czas realizacji tych zadań.
- Przewidywalna wydajność w przypadku obciążeń roboczych z dużą ilością metadanych: W środowiskach o spójnym wzorcu wysokiej aktywności metadanych dedykowana strategia metadanych może zapewnić bardziej przewidywalną i trwałą poprawę wydajności w porównaniu z pamięcią podręczną opartą na eksmisji.
- Niektóre aplikacje i przepływy pracy generują nieproporcjonalnie dużą liczbę operacji na metadanych w porównaniu z rzeczywistymi odczytami i zapisami danych. Przykłady obejmują archiwizację plików, zarządzanie zasobami multimedialnymi, automatyzację projektowania elektronicznego (EDA), środowiska programistyczne z częstymi kompilacjami oraz potoki genomiki, które obejmują wiele dostępu do małych plików i analiz. W takich przypadkach opóźnienia związane z uzyskiwaniem dostępu do metadanych i manipulowaniem nimi mogą stać się znaczącym wąskim gardłem wydajności
- Operacje, które obejmują nawigowanie po złożonych strukturach katalogów lub wyświetlanie zawartości wielu katalogów, są w dużym stopniu zależne od wydajności metadanych. Akceleracja metadanych zapewnia, że system może szybko uzyskać dostęp do informacji o i-węzłach i wpisach katalogów, co znacznie przyspiesza te operacje w porównaniu z poleganiem nawet na pamięci podręcznej L3, która mogła usunąć te informacje z powodu ograniczeń pojemności lub rzadszego dostępu
- Kopia zapasowa, replikacja i migracja: Te zadania zarządzania danymi często obejmują rozległe skanowanie i przetwarzanie metadanych. Szybszy dostęp do metadanych dzięki akceleracji może znacznie skrócić czas potrzebny na wykonanie tych zadań, minimalizując zakłócenia w podstawowych obciążeniach roboczych i poprawiając wydajność operacyjną.
- Wyszukiwanie i indeksowanie: Gdy użytkownicy lub zautomatyzowane procesy muszą wyszukiwać określone pliki na podstawie ich atrybutów metadanych (np. nazwy, rozmiaru, daty modyfikacji), przyspieszony dostęp do metadanych pozwala na szybsze wykonywanie zapytań. Jest to istotne w przypadku rozwiązań takich jak MetadataIQ, które indeksują metadane systemu plików w celu wydajnego wykonywania zapytań i odnajdywania danych w wielu klastrach
- Kiedy wybrać Metadane:
- Zaawansowane przeglądanie katalogów, wyszukiwanie plików lub danych, indeksowanie.
- Operacje na plikach, takie jak otwieranie, zamykanie, usuwanie, tworzenie katalogów (mkdir).
- Operacje wyszukiwania, getattr i dostępu.
- Katalogi domowe, zwłaszcza te z wieloma obiektami.
- Przepływy pracy obejmujące intensywne wyliczanie lub porównania.
- Interpretacja danych sejsmicznych, w której aktualność metadanych ma kluczowe znaczenie.
- Akceleracja metadanych może przynieść znaczną poprawę wydajności dla tego typu działań, zwiększając przepustowość i zmniejszając opóźnienia
Podsumowanie: Kiedy wybrać
-
- Wybierz strategię przyspieszania metadanych (odczyt metadanych lub odczyt/zapis metadanych), jeśli obciążenie jest silnie stronnicze w stosunku do operacji, które uzyskują dostęp do metadanych pliku lub modyfikują je (przeglądanie, wyszukiwanie, indeksowanie, tworzenie, usuwanie, modyfikowanie atrybutów).
- Wybierz opcję Akceleracja odczytu metadanych , jeśli obciążenie robocze wymaga głównie intensywnego odczytu metadanych i chcesz używać mniej pojemności dysku SSD.
- Wybierz przyspieszenie odczytu/zapisu metadanych , jeśli obciążenie robocze obejmuje znaczną liczbę zapisów metadanych, wymaga szybszego usuwania migawek lub jest obciążeniem HPC małych plików, takim jak EDA, korzystającym z wbudowanych małych plików w pamięci flash. Upewnij się, że dysk SSD ma wystarczającą pojemność.
- GNA należy rozważyć , jeśli masz klaster mieszany (węzły z dyskami SSD i bez nich) i musisz przyspieszyć odczyt metadanych dla danych znajdujących się w węzłach innych niż SSD w klastrze. Jest to istotne w przypadku obciążeń intensywnie korzystających z metadanych, które są rozproszone.
- Akceleracja globalnej przestrzeni nazw (GNA): GNA to starszy mechanizm (przeznaczony do zastąpienia przez pamięć podręczną L3, gdy wszystkie węzły mają dyski SSD), który umożliwia pulom węzłów bez dysków SSD korzystanie z dysków SSD w innym miejscu klastra poprzez przechowywanie dodatkowych metadanych lustrzanych na tych dyskach SSD. Przyspiesza to operacje odczytu metadanych przechowywanych w pulach składających się wyłącznie z dysków twardych. Pamięć podręczna L3 i GNA mogą współistnieć w tym samym klastrze, ale zazwyczaj działają w różnych pulach węzłów.
- Pamięć podręczną L3 należy rozważyć , jeśli obciążenie robocze obejmuje znaczne odczyty losowe, korzysta z rozszerzonego buforowania dla dużego zestawu roboczego lub wymaga zwiększonej wydajności aparatu zadań, pod warunkiem, że węzły są wyposażone w dyski SSD.
Narzędzia i polecenia:
- Monitorowanie wydajności: Narzędzia takie jak InsightIQ, CloudIQ i MetadataIQ umożliwiają monitorowanie kondycji klastra, wskaźników wydajności i prognozowanie użycia. InsightIQ może śledzić trendy wydajności, identyfikować wzorce i przeprowadzać analizę plików. Może to również pomóc w oszacowaniu, kiedy klaster osiągnie maksymalną pojemność. CloudIQ zapewnia wgląd w wydajność klastra. MetadataIQ ułatwia indeksowanie danych i wykonywanie zapytań w klastrach i może być używany do zarządzania cyklem życia danych i zrozumienia dystrybucji danych.
- Narzędzie isi_cache_stats może pomóc w określeniu rozmiaru roboczego zestawu danych, który jest istotny w przypadku określania rozmiaru dysków SSD dla pamięci podręcznej L2 i L3. Ogólna zasada sugeruje, że pojemność L2 + pojemność L3 powinna wynosić >= 150% rozmiaru zestawu roboczego.
- MetadataIQ (OneFS 9.10+): Wdróż i skonfiguruj MetadataIQ w celu indeksowania i tworzenia globalnego katalogu metadanych w klastrach. Użyj pulpitu nawigacyjnego Kibana, aby zwizualizować rozkład danych, liczbę plików i atrybuty metadanych. Pomaga to zrozumieć skład danych i sposób powiększania się metadanych. Okresowe synchronizacje zapewniają aktualność bazy danych metadanych
- InsightIQ udostępnia raporty na temat pojemności klastra, w tym pojemności całkowitej, przydzielonej i wykorzystanej, umożliwiając prognozowanie potrzeb w zakresie pamięci masowej na podstawie trendów historycznych. Może monitorować wydajność obciążeń roboczych, opóźnienia, IOPs i przepływność, umożliwiając wykrywanie potencjalnych wąskich gardeł w miarę wzrostu ilości danych. Raporty analizy systemu plików InsightIQ mogą pokazywać liczbę plików i rozkład rozmiarów, dając wgląd w skalę i skład danych, co bezpośrednio wiąże się ze wzrostem liczby LIN.