PowerScale. Проблемы расширения раздела var
Summary: Расширение раздела /var может привести к появлению предупреждающих сообщений в инструменте Isilon On-Cluster Analysis Tool (IOCA). Проблемы связаны с критической ошибкой узла, которая может возникнуть при извлечении салазок для накопителей для обслуживания. ...
Acest articol se aplică pentru
Acest articol nu se aplică pentru
Acest articol nu este legat de un produs specific.
Acest articol nu acoperă toate versiunile de produs existente.
Symptoms
Текущий сценарий Isilon On-Cluster Analysis Tool (IOCA) генерирует следующие предупреждения, связанные с
Когда узел включается, проверка
/var Разделов:
System Partition Free Space FAIL CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please reference KB 000213248 (https://www.dell.com/support/kbdoc/000213248) for further information. INFO: For more information refer to KB article 000041465 found at https://www.dell.com/support/kbdoc/000041465.Или
Mirror Status FAIL CRITICAL: The mirror pair for var1 appear to be in the same fault domain on nodes: 1-10. CRITICAL: The following nodes have /var mirrors of different sizes: 1-10 INFO: Please open a Technical Support Service Request and reference this failure within the description. INFO: Please refer to KB 000213248 (https://www.dell.com/support/kbdoc/en-us/000213248) for further information.Если игнорировать этот параметр, может возникнуть критическая ошибка на узле MLK 6-го поколения или MLK 6-го поколения во время процедуры замены накопителя или модуля.
Когда узел включается, проверка
/var/log/messages В файле для узла отображаются сообщения об ошибках и критической ошибке, аналогичные следующие:
(da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543174480, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 5 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 5 (da21:pmspcbsd0:0:22:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): CAM status: CCB request aborted by the host (da22:pmspcbsd0:0:23:0): WRITE(10). CDB: 2a 00 00 04 dd 44 00 00 04 00 (da21:pmspcbsd0:0:22:0): Retrying command, 3 more tries remain (da22:pmspcbsd0:0:23:0): CAM status: CCB request aborted by the host (da21:pmspcbsd0:0:22:0): pccb 0xfffffe8543151fe0, ccb 0xfffff80e31347000: ccbStatus 3, scsiStatus 2 (da22:pmspcbsd0:0:23:0): Retrying command, 3 more tries remain (da21:pmspcbsd0:0:22:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff80e31347000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): pccb 0xfffffe8543151fe0, ccb 0xfffff807c4753000: ccbStatus 3, scsiStatus 2 (da21:pmspcbsd0:0:22:0): Invalidating pack (da22:pmspcbsd0:0:23:0): cam_periph_error: SSQ_LOST removing device ccb 0xfffff807c4753000 status 0x8 flags 0x2 (da22:pmspcbsd0:0:23:0): Invalidating pack (da21:pmspcbsd0:0:22:0): removing device entry (da21:pmspcbsd0:0:22:0): Periph destroyed panic @ time 1681142660.493, thread 0xfffffe874ee12000: mirror/var1: all devices failed (read, offset 1304707072, length 0) time = 1681142660 cpuid = 3, TSC = 0x5e76342b8e8e59 Panic occurred in module kernel loaded at 0xffffffff80200000: Stack: -------------------------------------------------- kernel:g_mirror_worker+0x251f kernel:fork_exit+0x82 -------------------------------------------------- Disabling swatchdog Dumping stacks (40960 bytes)
Cause
В версиях 9.2.1.16 и более поздних, 9.4.0.6 и более поздних версиях, 9.5.0.0 и более поздних OneFS расширяет размер раздела /var до 2 Гбайт во время модернизации. Процесс расширения может привести к появлению этих сообщений или событий.
Сообщение, связанное с нахождением зеркальной пары в одном домене сбоя, относится только к узлам MLK 6-го и 6-го поколений (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 и F810). Расширение может неправильно проверять домены сбоя разделов, помещая оба раздела либо для одного из них.
Каждый
Truncated
Различные размеры разделов var могут повлиять на любой тип узла Isilon или PowerScale, работающий под управлением OneFS 9.x. Расширение для
Чтобы определить, влияет ли эта проблема на раздел LKG в кластере, используйте следующую команду:
В приведенном выше примере
Сообщение, связанное с нахождением зеркальной пары в одном домене сбоя, относится только к узлам MLK 6-го и 6-го поколений (A200, A2000, A300, A3000, H400, H500, H600, H5600, H700, H7000, F800 и F810). Расширение может неправильно проверять домены сбоя разделов, помещая оба раздела либо для одного из них.
/var Зеркалирование на накопителях в том же салазках. Это приводит к критической ошибке узла при извлечении модуля, если оба зеркала для установленного /var находятся в салазках.
Каждый
mirror/var0 или mirror/var1 выступает в качестве активного /var Зеркалирование разделов в любое время. Из сообщения о панике в примере мы видим, что /mirror/var1 было активным зеркалом. Глядя на gmirror status и isi devices drive list выходные данные команды для node:
Truncated
status Выходные данные команды:
gmirror status mirror/var1 COMPLETE da14p3 (ACTIVE) <<<< da13p3 (ACTIVE) <<<<Задание
drive list Выходные данные команды:
isi devices drive list Lnn Location Device Lnum State Serial Sled --------------------------------------------------------- 21 Bay 1 /dev/da1 15 L3 xxxxxxxxxxxx N/A 21 Bay 2 /dev/da2 16 L3 xxxxxxxxxxxx N/A 21 Bay A0 /dev/da5 12 HEALTHY xxxxxxxx A 21 Bay A1 /dev/da4 13 HEALTHY xxxxxxxx A 21 Bay A2 /dev/da3 14 HEALTHY xxxxxxxx A 21 Bay B0 /dev/da8 9 HEALTHY xxxxxxxx B 21 Bay B1 /dev/da7 10 HEALTHY xxxxxxxx B 21 Bay B2 /dev/da6 11 HEALTHY xxxxxxxx B 21 Bay C0 /dev/da11 6 HEALTHY xxxxxxxx C 21 Bay C1 /dev/da10 7 HEALTHY xxxxxxxx C 21 Bay C2 /dev/da9 8 HEALTHY xxxxxxxx C 21 Bay D0 /dev/da14 3 HEALTHY xxxxxxxx D <<<< 21 Bay D1 /dev/da13 4 HEALTHY xxxxxxxx D <<<< 21 Bay D2 /dev/da12 5 HEALTHY xxxxxxxx D 21 Bay E0 /dev/da17 0 HEALTHY xxxxxxxx E 21 Bay E1 /dev/da16 1 HEALTHY xxxxxxxx E 21 Bay E2 /dev/da15 2 HEALTHY xxxxxxxx E ---------------------------------------------------------В этом примере
/mirror/var1 построен на дисках D0 и D1. При удалении салазок D из кластера на узле возникает критическая ошибка из-за невозможности доступа к /var файловая система.
Различные размеры разделов var могут повлиять на любой тип узла Isilon или PowerScale, работающий под управлением OneFS 9.x. Расширение для
/var Расширяет только активный /var Раздел в системе. Размер последнего известного работоспособного раздела (LKG) сохраняется. Если активный /var Раздел расширен и заполнен более чем на 50%, это может привести к проблемам, если раздел необходимо поворачивать для обслуживания.
Чтобы определить, влияет ли эта проблема на раздел LKG в кластере, используйте следующую команду:
# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media"Пример.
lab-1# isi_for_array -sX 'gmirror list var0 var1' | grep -A20 mirror | egrep "var|Media" lab-1: 1. Name: mirror/var0 lab-1: Mediasize: 2147479552 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-1: Mediasize: 2147483648 (2.0G) lab-2: 1. Name: mirror/var0 lab-2: Mediasize: 2147479552 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-2: Mediasize: 2147483648 (1.0G) <<<< lab-3: 1. Name: mirror/var0 lab-3: Mediasize: 2147479552 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-3: Mediasize: 2147483648 (2.0G) lab-4: 1. Name: mirror/var0 lab-4: Mediasize: 2147479552 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) lab-4: Mediasize: 2147483648 (2.0G) ....Если какое-либо из устройств возвращается с размером (1,0 Гбайт), это влияет на него.
В приведенном выше примере
var0 Разделы затронуты и должны быть исправлены. Повторно выполните команду для var1 в кластере, чтобы определить, подвержен ли он этой проблеме.Resolution
Окончательное решение проблемы ТОЛЬКО ДЛЯ ДОМЕНА СБОЯ доступно в следующих выпусках кода:
Чтобы использовать сценарий, выполните следующие действия.
- OneFS 9.5.0.6
- 9.4.0.16
- 9.2.1.25
Примечание. Эту проблему невозможно решить вручную или с помощью приведенного ниже сценария в кластерах, работающих в режиме комплаенса. Если кластер находится в режиме комплаенса SmartLock, эту проблему можно устранить, выполнив модернизацию до перечисленных выше версий OneFS. Если модернизацию для устранения проблемы не удается выполнить, обратитесь в службу поддержки Dell и запросите исправление DA. Для решения этой проблемы существует сценарий. Обратитесь в службу поддержки Dell , чтобы получить файлы, затем следуйте инструкциям ниже.
Чтобы использовать сценарий, выполните следующие действия.
- Скачайте сценарий и файл md5 в кластер. Скопируйте файлы в /ifs/data/Isilon_Support кластера и убедитесь, что хэш md5 совпадает с хэшем в файле md5:
Lab-1# mv var_mirror_repair.sh /ifs/data/Isilon_Support/ Lab-1# mv var_mirror_repair.md5 /ifs/data/Isilon_Support/ Lab-1# md5 /ifs/data/Isilon_Support/var_mirror_repair.sh MD5 (/ifs/data/Isilon_Support/var_mirror_repair.sh) = 0881afeeb39fdaf02e2a90d784e4ed21 Lab-1# # cat /ifs/data/Isilon_Support/var_mirror_repair.md5 0881afeeb39fdaf02e2a90d784e4ed21
- Если хэш не совпадает, скачайте скрипт с FTP-сайта и скопируйте его в кластер еще раз. Если хэш совпадает, выполните следующую команду от имени root:
lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh
- Выполнение сценария обычно занимает 5–10 минут. Это может занять больше времени в больших (30+ узлов) или загруженных кластерах. После завершения сценария он сообщает, был ли он выполнен успешно или возникли проблемы.
При запуске сценария вы увидите следующие выходные данные:
Lab-1# sh /ifs/data/Isilon_Support/var_mirror_repair.sh Full output can be found at: /ifs/data/Isilon_Support/var_mirror_repair.FULL_CLUSTER.2023-10-19T092522.csv Status: 0/4 Nodes checked, 0/4 var0 partitions, 0/4 var1 partitions
По мере выполнения сценария строка состояния обновляется:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions
После успешного завершения сценария вы увидите следующее:
Status: 4/4 Nodes checked, 4/4 var0 partitions, 4/4 var1 partitions No issues were identified. Moving files to: var_mirror_repair.2023-10-19T092522.d Bundle Location: var_mirror_repair.2023-10-19T092522.tgz
Это означает, что все затронутые узлы были восстановлены и в сценарии не было проблем. Если полученные выходные данные отличаются от этого примера, обратитесь в службу поддержки Dell и предоставьте выходные данные и файлы журнала из расположения пакета.
Produse afectate
Isilon F800, Isilon F810, Isilon Gen6, Isilon H400, Isilon H500, Isilon H5600, Isilon H600, PowerScale Archive A300, PowerScale Archive A3000, PowerScale Hybrid H700, PowerScale Hybrid H7000Produse
PowerScale F200, PowerScale F600, PowerScale F900Proprietăți articol
Article Number: 000213248
Article Type: Solution
Ultima modificare: 06 Jan 2026
Version: 21
Găsiți răspunsuri la întrebările dvs. de la alți utilizatori Dell
Servicii de asistență
Verificați dacă dispozitivul dvs. este acoperit de serviciile de asistență.