PowerEdge. Почему происходит сбой жестких дисков
Summary: В этой статье подробно описываются различные причины, по которым могут произойти сбои жестких дисков.
Instructions
Содержание
- Повреждение микропрограммы и зоны микропрограммы
- Электрический сбой
- Механический сбой
- Логический сбой
- Ошибки носителей
- Среда SCSI/SAS
Повреждение микропрограммы и зоны микропрограммы
Если микропрограмма жесткого диска повреждена или недоступна для чтения, компьютер часто не может правильно взаимодействовать с жестким диском
Электрический сбой
Электрический сбой обычно связан с проблемами на плате контроллера жесткого диска. На сервере может произойти перепад или скачок напряжения, из-за чего BIOS контроллера не сможет обнаружить плату контроллера на жестком диске.
Механический сбой
Во многих случаях механический сбой (особенно если он не был своевременно устранен) может привести к частичной, а иногда и полной потере данных. Существуют различные виды механических сбоев, например сбой головок чтения/записи, проблемы с двигателем. К наиболее распространенным механическим сбоям относится повреждение головок. Повреждения головок различаются по степени серьезности и возникают, когда головки чтения/записи жесткого диска на короткое или длительное время вступают в контакт с «блинами» жесткого диска.
Повреждения головок могут возникать по ряду причин, к которым относятся механический удар (например, при падении диска на пол), перемещение компьютера, электростатический разряд, скачки напряжения и механический сбой головок чтения/записи.
Логический сбой
Логические ошибки, которые во многих случаях представляют собой наиболее простые или наиболее сложные неполадки, варьируются от простых ошибок, таких как недопустимая запись в таблице размещения файлов, до по-настоящему ужасных проблем, таких как повреждение и потеря файловой системы на сильно фрагментированном диске.
Логические ошибки отличаются от описанных выше электрических и механических сбоев, так как при наличии такой ошибки имеющиеся «физические» проблемы обычно касаются не самого диска, а присутствующих на нем битов информации.
Ошибки носителей
Дефектные секторы — это области жесткого диска, которые становятся недоступными для чтения. В конечном счете дефектные секторы формируются на всех жестких дисках. Жесткий диск отмечает дефектные секторы и больше не использует их, но если в секторах, которые становятся дефектными, хранятся данные, вы не сможете получить доступ к этим данным или файлам корректным образом. Суровые условия эксплуатации (например, высокие температуры, вибрация и т.д.) могут привести к быстрому образованию многих плохих секторов на жестких дисках. Жесткие диски всех типов подвержены «естественному» формированию дефектных секторов, но это происходит не всегда.
Среда SCSI/SAS
Жесткие диски SCSI часто считаются высокопроизводительными дисками. Они вращаются быстрее, чем их аналоги IDE/SATA, поэтому скорость передачи данных часто выше. Из-за этого накопители SCSI часто встречаются на серверах, которые должны обеспечивать большую пропускную способность данных. Однако такая производительность имеет свою цену, поскольку на таких накопителях чаще возникают механические сбои.
Наиболее распространенной причиной сбоя нескольких накопителей в этой среде является низкое качество сигнала на шине SCSI. Низкое качество сигнала приводит к увеличению затрат ресурсов, связанных с протоколом SCSI, при попытках восстановления после этих проблем (событий истечения времени ожидания и сбросов шины). По мере роста нагрузки на систему и повышения потребности в данных число корректирующих действий протокола SCSI увеличивается и шина SCSI приближается к насыщению. Эти затраты ресурсов в конечном счете ограничивают нормальную пропускную способность каналов связи устройств, и, если оставить эту проблему без решения, одно или несколько устройств SCSI могут не отвечать RAID-контроллеру своевременно, в результате чего RAID-контроллер отметит жесткий диск как отключенный. Проблемы с сигналом этих типов могут возникать из-за неправильной установки RAID-контроллера в разъем PCI, плохого подсоединения кабелей, плохого размещения дисков на распределительной плате SCSI, неправильной установки или размещения дочерних плат распределительной платы, а также неправильной заделки шины SCSI.
Также возможны сочетания этих типов сбоев.
Все технические специалисты и заказчики должны ознакомиться с передовыми подходами к обслуживанию, чтобы максимально увеличить время безотказной работы и предотвратить потерю данных в результате сбоя жесткого диска.