Isilon: Öka drive stall timeout-värdena i OneFS

Summary: Många OneFS-versioner har föråldrade timeoutvärden konfigurerade för drive stall timer. Genom att öka de här värdena kan du förhindra onödiga enhetsstopphändelser.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

I OneFS anses en enhet vara stannad om något av följande tillstånd upptäcks:
  • En viss enhetstransaktion tar längre tid än en viss tid att slutföra.
  • 50 av de senaste 1 300 indata/utdata-åtgärderna (I/O) tog längre tid än en viss tid att slutföra.
I OneFS-versioner tidigare än 8.0 var dessa värden inställda på 1,5 respektive 150 ms. EMC Isilon Engineering har fastställt att 1,5-tumsvärdet inte längre är lämpligt för nyare maskinvara som kör någon version av OneFS, och bör ändras till 3,5 s. Genom att göra den här ändringen kan du förhindra att systemet genererar onödiga enhetsfördåddmeddelanden.

När en enhetsspärr inträffar försöker systemet förhindra att åtgärder skickas till den enheten, och föredrar andra enheter i systemet. Detta försöker förbättra prestanda genom att undvika åtgärder på enheter som redan är överbelastade, men som kan ha en negativ effekt om enheten markerades stannat i onödan. Latenskänsliga arbetsflöden kan påverkas av enhetsspärrar. Vanligtvis orsakar drivenhetsfördådningar även gruppändringar, vilket i sin tur kan leda till att omstådade jobb initieras i onödan.

Cause

De tidigare angivna gränserna var lämpliga för de äldre generationerna av Isilon-maskinvara som hade olika prestanda- och dataflödesegenskaper från modern maskinvara. Eftersom både nod- och hårddisktekniken ändrades över tid fastställdes dessa värden vara överdrivet strikta för nyare nodtyper, vilket ledde till att fördröjningshändelser utlöstes i onödan.

Resolution

Obs! OneFS 8.0 har redan rätt värden konfigurerade som standard, så den här proceduren är inte nödvändig i OneFS-versionerna 8.0.0.0 och senare.
  • Logga in på nodens kommandoradsgränssnitt med en SSH-klient eller upprätta en seriell anslutning till noden.
  • Kör följande kommando för att säkerhetskopiera filen /etc/mcp/override/sysctl.conf:
# pekskärm /etc/mcp/override/sysctl.conf && cp /etc/mcp/override/sysctl.conf /etc/mcp/override/sysctl.conf.bku1
  • Kör följande kommando för att ändra timeoutvärdet för drivenhetens fördröjning:
# isi_sysctl_cluster hw.disk_event.threb.slowacc_usec=3500000
  • Kör följande kommando för att kontrollera att värdet nu är korrekt inställt:
# isi_for_array -s sysctl hw.disk_event.threb.slowacc_usec

Utdata som liknar följande bör visas:
 
clustername-1: hw.disk_event.threb.slowacc_usec: 3500000
clustername-2: hw.disk_event.thrcci.slowacc_usec: 3500000
clustername-3: hw.disk_event.thrcci.slowacc_usec: 3500000

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000052229
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.