PowerFlex: добавление устройства «Превышена ошибка в журналах трассировки Превышен бюджет времени» и IO_HARD_ERROR
Summary: Проблема с добавлением новых устройств в VxFlex OS (ScaleIO). Ошибка в журналах трассировки говорит о «Time budget exceeded» и IO_HARD_ERROR
Symptoms
Попытка добавить новое устройство на SDS в ОС VxFlex OS
Заказчик пытается добавить новое устройство в SDS и получает сообщение об ошибке
Ниже приведены ошибки в журналах трассировки MDM при добавлении устройства.
04/02 07:44:39.847673 0x7fe714c7deb0:mosEventLog_PostInternal:00590: New event added. Message: "Command add_sds_device received, User: 'USERNAME'. [464880250]". Additional info: "SDS: Name: SDSNAME, SDS Device: name N/A path /dev/sdab, Storage Pool: sas_10k_4, Test Mode: 'Test and activate' Test Time: 0 force_device_takeover flag: Specified" Severity: Info
04/02 07:44:44.435265 0x7fe714c7deb0:mosEventLog_PostInternal:00590: New event added. Message: "Command add_sds_device was not successful. Error code: Add SDS device IO error [464880250]". Additional info: "ID: 0000000000000000" Severity: Warning
В журналах трассировки SDS отображаются следующие ошибки:
04/02 07:44:43.589785 0x7f6b739aaeb0:AddDevProgress_Trace:00255: AddDevProgress: osThreadId=11cd, devId=3fefb6ae00110006, Start=25f2ee8825 [usec], end=25f2ee9888 [usec], interval= 4195 [usec], Desc=Write PhyDevCombArr
04/02 07:44:44.380440 0x7f6b739aaeb0:file_DoIOSyncEx:02237: Time budget exceeded on reading from /dev/sdab
04/02 07:44:44.380569 0x7f6b739aaeb0:file_ReadIntern:01169: Read error from disk 1548199195, 8 IO_HARD_ERROR
04/02 07:44:44.380653 0x7f6b739aaeb0:file_DoIOSyncEx:02237: Time budget exceeded on reading from /dev/sdab
04/02 07:44:44.380697 0x7f6b739aaeb0:file_ReadIntern:01169: Read error from disk 1548199195, 8 IO_HARD_ERROR
04/02 07:44:44.380777 0x7f6b739aaeb0:contDev_SendDeviceError:01761: Sending device error to MDM: DevId:3fefb6ae00110006 deviceName: /dev/sdab readError: TRUE WriteError: FALSE
04/02 07:44:44.415846 0x7f6b739aaeb0:file_WriteIntern:00937: Write error to disk 64, 2 IO_HARD_ERROR
04/02 07:44:44.415978 0x7f6b739aaeb0:file_WriteIntern:00937: Write error to disk 64, 2 IO_HARD_ERROR
04/02 07:44:44.416061 0x7f6b739aaeb0:contDev_SendDeviceError:01761: Sending device error to MDM: DevId:3fefb6ae00110006 deviceName: /dev/sdab readError: TRUE WriteError: TRUE
04/02 07:44:44.426672 0x7f6b739aaeb0:phyDev_InitWithBuf:02279: Io error
04/02 07:44:44.426839 0x7f6b739aaeb0:mosAsyncIO_CloseFileIntern:00503: Closing device path:/dev/sdab
Cause
При рассмотрении событий «Time budget exceeded» окажется, что это устройство либо добавляется слишком медленно, либо возникли проблемы с оборудованием, которые могут быть либо проблемой контроллера, либо поврежденным блоком на указанном выше диске.
На этапе тестирования при добавлении нового устройства SIO должен иметь возможность записывать ~200 МБ данных за ~4,5 секунды. Это может быть из-за проблем с контроллером или плохих блокировок устройства, или проблема выглядит слишком медленно, когда мы видим ошибку «Time budget exceeded» и IO_HARD_ERROR
Resolution
Эта проблема не связана с VxFlex OS. Это скорее аппаратная проблема.
Для исследования необходимо привлечь поставщика оборудования.
1. Проверьте наличие проблем с RAID-контроллером.
2. Проверьте, нет ли проблем с диском или он работает медленно.
3. Если возможно, попробуйте достать другой диск и добавить его. Если новый диск успешно добавлен, это означает, что на более раннем диске возникли проблемы.
4. Если при добавлении в SDS возникает одна и та же проблема с несколькими новыми дисками, проверьте наличие проблем в RAID-контроллере. Также убедитесь, что версия драйвера/микропрограммы RAID-контроллера поддерживается.