Isilon. Увеличение значений тайм-аута приолонности накопителей в OneFS

Summary: Во многих версиях OneFS устарели значения тайм-аута, настроенные для таймера stall timer накопителя. Увеличение этих значений может помочь предотвратить ненужные события приолонности накопителей. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

В OneFS накопитель считается приостановленным при обнаружении любого из следующих условий:
  • Транзакция конкретного диска занимает больше времени, чем определенное время.
  • Выполнение 50 последних 1300 операций ввода-вывода занимало больше времени, чем определенное время.
В версиях OneFS до 8.0 эти значения были задано 1,5 с и 150 мс соответственно. Специалисты инженерного отдела EMC Isilon определили, что значение 1.5s больше не подходит для нового оборудования под управлением любой версии OneFS и должно быть изменено на 3,5 с. Внесение этого изменения помогает предотвратить создание системой ненужных сообщений о зависающих накопителях.

Когда происходит зависение накопителя, система пытается предотвратить отправку операций на этот накопитель, предпочитая другие накопители в системе. Это попытка повысить производительность за счет предотвращения операций на накопителях, которые уже перегружены, но может оказать отрицательное воздействие, если накопитель был помечен как нежелательный. Рабочие процессы, чувствительные к задержке, могут влиять на зависанные накопители. Как правило, приостановка работы накопителей также вызывает изменения группы, что, в свою очередь, может привести к без необходимости запуска заданий по перераспределению.

Cause

Ранее установленные ограничения были соответствующи для более старых поколений оборудования Isilon, которые отличаются по характеристикам производительности и пропускной способности от современного оборудования. По мере изменения технологии узлов и жестких дисков эти значения были определены как чрезмерно строгие для новых типов узлов, что приводит к чрезмерному инициации событий stall.

Resolution

ПРИМЕЧАНИЕ. OneFS 8.0 уже имеет правильные значения, настроенные по умолчанию, поэтому эта процедура не требуется в OneFS версии 8.0.0.0 и более поздних версий.
  • Войдите в интерфейс командной строки узла с помощью клиента SSH или установите последовательное подключение к узлу.
  • Выполните следующую команду, чтобы выполнить резервное копирование файла /etc/mcp/override/sysctl.conf:
# touch /etc/mcp/override/sysctl.conf > cp /etc/mcp/override/sysctl.conf /etc/mcp/override/sysctl.conf.bku1
  • Выполните следующую команду, чтобы изменить значение тайм-аута stall накопителя:
# isi_sysctl_cluster hw.disk_event.thresh.slowacc_usec=3500000
  • Выполните следующую команду, чтобы убедиться, что значение задано правильно:
# isi_for_array -s sysctl hw.disk_event.thresh.slowacc_usec

Должны появиться выходные данные, аналогичные следующим:
 
clustername-1: hw.disk_event.thresh.slowacc_usec: 3500000 clustername-2
: hw.disk_event.thresh.slowacc_usec: 3500000
clustername-3: hw.disk_event.thresh.slowacc_usec: 3500000

Affected Products

Isilon, PowerScale OneFS
Article Properties
Article Number: 000052229
Article Type: Solution
Last Modified: 28 Jun 2023
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.