PowerScale OneFS: Odstraňování problémů s výkonem

Summary: Odstraňujte problémy s nízkým výkonem systému PowerScale OneFS pomocí komplexního průvodce konfigurací sítě, zatížením zpracování a monitorováním pomocí softwaru InsightIQ pro zvýšení efektivity clusteru. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Klientské počítače jsou pomalé. Určité úlohy, zejména ty, které běží v clusteru, selžou nebo trvají déle, než se čekalo.

Cause

Problémy s výkonem jsou obvykle způsobeny síťovým provozem, problémy s konfigurací sítě, zatížením zpracování klienta nebo clusteru nebo kombinací těchto faktorů. Tento článek popisuje několik efektivních způsobů odstraňování problémů s výkonem.

Resolution

Odstraňování problémů se softwarem InsightIQ

Obsah:

  • Použití softwaru Isilon InsightIQ
  • Odstraňování problémů bez softwaru InsightIQ
  • Propustnost sítě
  • Distribuce připojení klientů
  • Propustnost clusteru
  • Zpracování clusteru
  • Operace ve frontě
  • Procesor

Použití softwaru Isilon InsightIQ

Použití softwaru Isilon InsightIQ je nejlepší způsob, jak monitorovat výkon a odstraňovat problémy s ním spojené.

Virtuální zařízení Isilon InsightIQ umožňuje monitorovat a analyzovat aktivity clusteru Isilon prostřednictvím flexibilních, přizpůsobitelných zobrazení grafů ve webové aplikaci InsightIQ. Tyto grafy obsahují podrobné informace o hardwaru, softwaru a operacích systému souborů a protokolů. Software InsightIQ transformuje data do vizuálních informací, které zdůrazňují veškeré problémy s výkonem, což umožňuje rychlou diagnostiku problematických míst nebo optimalizaci pracovních postupů.

Podrobnosti o používání softwaru InsightIQ naleznete v informačním centru PowerScale InsightIQ

Odstraňování problémů bez softwaru InsightIQ

Pokud software InsightIQ nepoužíváte, můžete spustit různé příkazy a prozkoumat problémy s výkonem. Nejdříve odstraňte problémy s výkonem kontrolou propustnosti sítě a clusteru, poté kontrolou zpracování clusteru a nakonec kontrolou frekvence procesoru jednotlivých uzlů.

Propustnost sítě

Použijte nástroj pro síťové testování, například Iperf nebo Iperf3 , abyste zjistili možnosti propustnosti počítačů clusteru a klienta v síti.

Pomocí Iperfspusťte v clusteru a klientovi následující příkazy. Tyto příkazy definují velikost okna, která je dostatečně velká, aby bylo možné zjistit, zda je síťové připojení potenciální příčinou problémů s latencí.

  • Clusteru: iperf -s -w 262144
  • Klient: iperf -c <cluster IP> -w 262144

Použití Iperf3spusťte v clusteru a klientovi následující příkazy. Tyto příkazy definují velikost okna, která je dostatečně velká, aby bylo možné zjistit, zda je síťové připojení potenciální příčinou problémů s latencí.

  • Clusteru: iperf3 -s -w 262144
  • Klient: iperf3 -c <cluster IP> -w 262144


Distribuce připojení klientů

Zkontrolujte, kolik klientů systému souborů NFS (Network File System) a SMB (Server Message Block) je připojeno ke clusteru, abyste se ujistili, že neupřednostňují jeden uzel.

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí příkazu root Účet.
  2. Spusťte isi statistics query current list --nodes=all --keys=node.clientstats.connected.nfs,node.clientstats.active.nfs -d příkaz pro kontrolu klientů NFS. 
    Výstup zobrazí počet klientů připojených k uzlu a počet těchto klientů je aktivních na každém uzlu.
  3. Spusťte isi statistics query current list --keys=node.clientstats.connected.smb,node.clientstats.active.smb1,node.clientstats.active.smb2 -n all -d příkaz pro kontrolu klientů SMB.
    Výstup zobrazí počet klientů připojených k uzlu a počet těchto klientů je aktivních na každém uzlu.

Propustnost clusteru

Vyhodnoťte propustnost clusteru prováděním testů zápisu a čtení, které měří dobu potřebnou ke čtení ze souboru a zápisu do souboru. Proveďte alespoň jeden test zápisu a jeden test čtení následujícím způsobem.

Napište test.

  1. Navažte připojeníSSH s libovolným uzlem v clusteru a přihlaste se pomocí příkazu root Účet.
  2. Změňte na /ifs Adresář: cd /ifs
  3. Z rozhraní příkazového řádku (CLI) v clusteru nebo z klientského počítače se systémem UNIX nebo Linux použijte příkaz dd k zápisu nového souboru do clusteru.
    Zadejte následující příkaz: dd if=/dev/zero of=1GBfile bs=1024k count=1024
    Tento příkaz vytvoří ukázkový soubor o velikosti 1 GB a oznámí dobu potřebnou k jeho zápisu na disk.
  4. Z výstupu tohoto příkazu extrapolujte, kolik MB za sekundu lze zapsat na disk v pracovních postupech s jedním datovým proudem.
  5. Pokud máte MAC klienta a chcete provést další analýzu,
    1. Spusťte nástroj Monitor aktivity.
    2. Spusťte cat /dev/zero > /pathToFile příkaz, kde pathToFile je cesta k cílovému souboru.
      Tento příkaz pomáhá měřit propustnost operací zápisu v clusteru Isilon. (Ačkoli je možné spustit příkaz dd z klienta MAC, mohou být výsledky nekonzistentní.)
    3. Sledujte výsledky příkazu v nástroji Monitor Aktivity na kartě Síť .

Přečtěte si test.
Při měření propustnosti operací čtení neprovádějte testy čtení v souboru, který jste vytvořili během testu zápisu. Protože soubor byl uložen do cache, výsledky testů čtení by byly nepřesné. Místo toho otestujte operaci čtení souboru, který nebyl uložen do cache. Vyhledejte soubor v clusteru, který je větší než 1 GB, a odkažte na tento soubor v testu čtení.

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí příkazu root Účet.
  2. Z příkazového řádku v clusteru nebo z klientského počítače se systémem UNIX nebo Linux použijte příkaz dd ke čtení souboru v clusteru.
    Spusťte dd if=/pathToLargeFile of=/dev/null bs=1024k příkaz, kde pathToFile je cesta k cílovému souboru.
    Tento příkaz přečte cílový soubor a nahlásí dobu potřebnou k jeho přečtení.
  3. Pokud máte MAC klienta a chcete provést další analýzu,
    1. Spusťte nástroj Monitor aktivity.
    2. Spusťte time cp /pathToLargeFile > /dev/null příkaz, kde pathToFile je cesta k cílovému souboru.
      Tento příkaz pomáhá měřit propustnost operací čtení v clusteru Isilon. (Ačkoli je možné spustit příkaz dd z klienta MAC, mohou být výsledky nekonzistentní.)
    3. Sledujte výsledky příkazu v nástroji Monitor Aktivity na kartě Síť .

Zpracování clusteru

Úlohy opětovného prokládání.
Před kontrolou vstupně-výstupních operací (IOPS) clusteru:

  • Určete, které úlohy jsou v clusteru spuštěny. Pokud jsou spuštěny úlohy opětovného prokládání, jako je Auto-Balance, Collect nebo MultiScan, zvažte, proč tomu tak je a zda by měly být spuštěné i nadále.
  • Zvažte typ zpracovávaných dat. Pokud klientské počítače pracují s velkými videosoubory nebo virtuálními počítači (VM), vyžaduje znovu prokládaná úloha větší množství operací IOPS disku, než je obvyklé.
  • Zvažte dočasné pozastavení úlohy opětovného prokládání. To může zlepšit výkon a může jít o krátkodobé řešení problému s výkonem.

Disk I/O
Kontrola operací I/O disku může pomoci určit, zda jsou určité disky nadměrně využívány.

Ze strany clusteru

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí účtu „root“.
  2. Spusťte isi statistics pstat příkaz ke zjištění I/O disku.
  3. Z výstupu tohoto příkazu vydělte počet operací IOPS disku celkovým počtem disků v clusteru. Například u clusteru s 8 uzly Isilon IQ 12000x, který na každém uzlu hostuje 12 disků, vydělíte počet operací IOPS disku číslem 96.
    U uzlů řady X a NL byste měli očekávat, že se zobrazí maximálně 70 operací IOPS disku pro 100% náhodné pracovní postupy nebo maximálně 140 operací IOPS disku pro 100% sekvenční pracovní postupy. Protože uzly řady NL mají méně paměti RAM a nižší rychlost procesoru než uzly řady X, mohou uzly řady X zvládnout vyšší počet operací IOPS disku.

Ze strany uzlu a disku

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí účtu „root“.
  2. Spusťte isi statistics query current --nodes=all --stats=node.disk.xfers.rate.sum --format=top příkaz ke zjištění operací IOPS disku podle uzlu, což může pomoci zjistit disky, které jsou nadměrně využívány.
  3. Spusťte isi_stats_tool -a get_key_info|grep node.disk.xfer určete, jak se dotazovat na statistiku na jednotlivých discích.

Operace ve frontě

Dalším způsobem, jak zjistit, zda jsou disky nadměrně využívány, je určit, kolik operací je zařazeno do fronty pro každý disk v clusteru. U pracovních postupů na bázi SMB s jedním datovým proudem může fronta čtyř položek signalizovat problém, zatímco u operací oboru názvů NFS s vysokou souběžností je fronta větší.

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí příkazu root Účet.
  2. Spusťte isi statistics drive list --nodes=all --sort=queued -d určete, kolik operací je zařazeno do fronty pro každý disk v clusteru.
  3. Určete, jak dlouho byla operace ve frontě: isi statistics drive list --nodes=all --sort=queued -d 

Procesor

Problémy s procesorem lze často vysledovat k operacím, které klienti provádějí v clusteru. Pomocí příkazu isi statistics můžete určit operace prováděné v clusteru, katalogizované pomocí síťového protokolu nebo klientského počítače.

  1. Navažte připojení SSH s libovolným uzlem v clusteru a přihlaste se pomocí příkazu root Účet.
  2. Spusťte isi statistics protocol list --long --totalby Op,proto -d --sort TimeAvg --format top určete, které operace se provádějí v celé síti, a vyhodnoťte, která z těchto operací trvá nejdéle.
    Tento výstup příkazu poskytuje podrobné statistiky pro všechny síťové protokoly uspořádané podle toho, jak dlouho clusteru trvá, než odpoví klientům. Ačkoli výsledky tohoto příkazu nemusí určit, která operace je nejpomalejší, může vás navést správným směrem.
  3. Spusťte isi statistics system --nodes all --format top příkaz k získání dalších informací o zpracování CPU, například které procesory uzlů jsou nejvíce využívány.
  4. Spusťte isi_for_array -sX 'top -u -n |grep PID -A4' příkaz k získání čtyř procesů na každém uzlu, které spotřebovávají nejvíce zdrojů procesoru.

Additional Information

Související zdroje
Zde jsou doporučené zdroje související s tímto tématem, které by vás mohly zajímat:

Affected Products

PowerScale, PowerScale OneFS

Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000015384
Article Type: Solution
Last Modified: 02 ذو الحجة 1447
Version:  15
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.