Тема для этой заметки родилась благодаря вопросам наших заказчиков, относительно причин выхода из строя их жестких дисков.
Точнее вопрос нам задают всегда примерно один и тот-же, с одним смыслом, который можно разделить на два ключевых момента:
1. Почему диск сдох?
2. Как избежать поломки в дальнейшем?
Забегая вперед скажу, что в 99,99% случаев вина за выход диска из строя лежит на пользователе. Да-да, в основе лежит несоблюдение пользователями правил эксплуатации дисков.
Например, на крышке каждого диска имеются предостеригающие надписи, порой снабжённые картинками для наглядности. Но, как показывает практика, мало кто обращает на это внимание...
Давайте заглянем в тему чуть глубже, и в качестве примера я продемонстрирую работу с одним из кейсов.
Пациент:
Seagate Rosewood_A5 ST1000LM035-1RK172, ёмкостью 1Tb
Анамнез:
Двигатель диска стартует, после чего из гермоблока доносятся щелчки. Через какое-то время двигатель останавливается. Диск при этом не определяется.
Для специалиста понятно, что проблема кроется в неисправном блоке магнитных голов (БМГ) и для восстановления данных данных необходима его замена на донорский.
Вскрываем гермоблок диска и осматриваем головы на предмет повреждений.
С пьезиками всё в порядке. Слайдеры тоже чистые и подвесы не деформированы.
Однако этот комплект голов не видит даже серворазметку и не может спозиционироваться, не говоря о том, чтобы прочитать с поверхности хоть что-нибудь.
После замены родного блока голов на исправный донорский, диск отдал весь необходимый заказчику объём данных. Потери оказались незначительные, в виде нескольких не важных файлов. Видео с фрагментом работы над этой задачей под названием "Читаем Rosewood" доступно по ссылке.
Но давайте пойдем дальше и попытаемся выяснить причину гибели диска. А поможет нам в этом анализ состояния S.M.A.R.T. и просмотр лога событий. Давайте сразу поставим точки над "и" и внесём ясность.
S.M.A.R.T. попросту - это система мониторинга. Бытует ошибочное мнение, что S.M.A.R.T. предсказывает время выхода накопителя из строя. Это как раз было-бы великолепно, но к сожалению это не соответствует действительности. S.M.A.R.T. отображает только ТЕКУЩЕЕ состояние диска, т.е. показатели в данный момент времени и ничего больше. Что это за система мониторинга рассказано здесь https://en.wikipedia.org/wiki/S.M.A.R.T.
Ни каких прогнозов, опираясь на показания S.M.A.R.T., увы сделать не возможно. Можно только оценить состояние накопителя на ТЕКУЩИЙ момент.
В данном случае мы видим, что накопитель пребывает в плачевном состоянии. Критичные параметры отмечены красным цветом.
По количеству переназначенных секторов видно, что пользовательский дефект-лист забит, что называется "по самый не балуй", а также в очереди огромное количество кандидатов на переназначение, с которым штатный механизм обработки дефектов диска уже никогда не справится.
Наличествует еще один критичный параметр, который имеет ненулевое значение. Это датчик ударных нагрузок (параметр 191). Судя по его состоянию можно смело утверждать, что при жизни с диском обращались не очень аккуратно.
Но есть еще и логи событий, проанализировав которые можно проследить динамику состояния накопителя. Эти логи являются частью микрокода накопителя и доступны для просмотра только через специальный диагностический порт. Нам наиболее интересны первая и последняя колонки (время работы и зарегистрированное событие)
Как видно из логов, диск начали "бить" уже с первых часов эксплуатации ноутбука, в котором он стоял. Думаю многим будет любопытно узнать, что происходит внутри гермоблока при ударных нагрузках. В конце заметки находится официальное видео от производителя дисков и ссылка на его источник (эпизод про удары и их последствия начинается примерно с 3 мин.) Настоятельно рекомендую это видео посмотреть от начала и до конца.
Закончил он свой земной путь, пытаясь обработать то огромное количество сбойных секторов, которые возникли в результате ударов, тряски и вибраций. Микропрограмма диска до последнего занималась самолечением, что наглядно отражено в конце лога, пока головы не сдохли окончательно.
Пожалуй на этом можно закругляться...
Про причины я вам рассказал, а выводы пусть каждый пользователь сделает сам, и решит как избежать плачевных последствий.
Любое копирование, цитирование и публикация материалов (или их части) допускается только с разрешения администрации сайта и с обязательной ссылкой на источник.
Официальные источники:
- Обращаться с осторожностью: https://www.seagate.com/ru/ru/support/downloads/handle-with-care/