Объяснение технологий

Что такое плохие сектора и как их исправить? [Часть 2]

Что такое плохие сектора и как их исправить? [Часть 2]

Часть 1 этой статьи читали об оборудовании накопителя и о том, как контроллер работает за кулисами для обнаружения и устранения проблем с неисправными секторами, которые он обнаруживает при нормальной работе.

В этом заключении к этому обсуждению мы рассмотрим инструменты, доступные в операционной системе, производителях накопителей и других сторонних организациях, которые вы можете использовать для управления и мониторинга накопителей, чтобы поддерживать их как можно более здоровыми.

Отказ от ответственности : Перед выполнением любой из команд, представленных в этой статье, убедитесь, что у вас есть хорошая резервная копия диска. поскольку попытки исправить поврежденные сектора могут привести к повреждению файловой системы. Это означает, что можно потерять части файлов данных или метаданных, которые используются для поиска файлов и каталогов на томе. Инструменты производителя и сторонних производителей могут быть столь же катастрофическими, как и утилиты операционной системы. Это особенно важно для тех утилит, которые обходят защиту операционной системы и имеют прямой доступ к диску, что и делают многие из этих инструментов.

Сканирование диска на наличие поврежденных секторов

Каждая операционная система имеет инструменты для сканирования диска на наличие поврежденных секторов. Некоторые из них автоматически запускаются во время запуска, если компьютер обнаруживает неправильное завершение работы. Например, Windows поддерживает «грязный бит» в основной таблице файлов (MFT) на томах NTFS или в таблице размещения файлов (FAT) на дисках FAT16 / 32.

Во время загрузки программа autochk ищет это значение и, если оно задано, запускает сокращенную версию действий, выполняемых chkdsk на всех помеченных томах. Аналогичный процесс используется другими современными операционными системами.

Windows

Для тех, кто не боится командной строки Windows, / r или chkdsk / b могут быть запущены в любое время для поиска поврежденных секторов. Сначала он выполнит другие тесты, чтобы проверить согласованность метаданных накопителя перед необязательной передачей сбойного сектора. В зависимости от размера рассматриваемого тома и количества каталогов и файлов, это может занять некоторое время. Разница между этими двумя командами заключается в том, что вторая будет переоценивать сектора, которые уже помечены операционной системой как плохие.

В Windows также есть инструмент с графическим интерфейсом, который можно использовать для выполнения тех же проверок. Доступ к нему можно получить, открыв Проводник Windows> правой кнопкой мыши на диске, чтобы проверить> Свойства> вкладка Инструменты> Проверить сейчас … > проверить « Поиск и попытка восстановления поврежденных секторов»> Пуск .

окна диска проверка

Независимо от того, какой из них вы выберете, если вы сканируете системный или загрузочный диск, он потребует эксклюзивного доступа к тому и спросит вас, хотите ли вы запланировать сканирование на следующий перезапуск. Если это не системный диск, сканирование должно начаться немедленно, если другой процесс уже не заблокировал его для монопольного доступа.

Этот инструмент не помечает отдельные сектора как плохие; он помечает весь кластер как неисправный в MFT или FAT и перемещает весь кластер в другой неиспользуемый кластер на диске. Это может произойти, если аппаратное обеспечение диска не может переназначить поврежденный сектор по любой причине, например, из-за того, что его резервный сектор исчерпан.

Linux

Хотя программу badblocks можно использовать для поиска поврежденных блоков (секторов) в разделе диска в системах Linux, я рекомендую вместо этого использовать e2fsck -c или соответствующий вариант fsck для используемой файловой системы. Это гарантирует, что правильные параметры передаются в программу badblocks.

Неправильные параметры могут нанести непоправимый ущерб файловой системе. Параметр -c выполняет проверку тома только для чтения. Если вы хотите использовать неразрушающий тест чтения-записи, вам нужно вместо этого указать параметр -cc .

e2fsck-полной

При использовании -c или -cc весь список поврежденных блоков перестраивается. Если вы хотите сохранить существующие записи в списке и просто добавить новые блоки в список, добавьте опцию -k (keep). Если вы подозреваете, что был поврежден сам диск и / или файловая система, вы также можете добавить опцию -p (preen), которая попытается автоматически исправить любое повреждение. Он уведомит вас, если не сможет исправить найденные ошибки.

Инструменты производителя

Производители приводов имеют свое собственное диагностическое программное обеспечение, которое можно использовать для анализа поверхности и управления функциями, характерными для их приводов. Western Digital имеет Data Lifeguard для Windows для своих дисков, в то время как Seagate имеет SeaTools для Windows, который можно использовать для тестирования дисков Seagate, Maxtor и Samsung.

Оба предлагают варианты для тестирования и ремонта связанных дисков, но вы должны быть осторожны с тем, какие тесты являются разрушительными, а какие — неразрушающими. В любом случае у вас должна быть текущая резервная копия. прежде чем продолжить.

данные спасатель

Сторонние инструменты

Существуют также сторонние инструменты, такие как SpinRite от Gibson Research Corporation, которые обращаются к диску ниже уровня операционной системы, чтобы выполнить свою магию. Он обходит BIOS и напрямую взаимодействует с контроллером жесткого диска. Он предназначен главным образом для восстановления данных, но также может использоваться для анализа поверхности и проверки перед вводом в эксплуатацию нового диска.

SpinRite имеет свои ограничения. Поскольку он работает в операционной системе FreeDOS и использует CHS для доступа к диску, он может получить доступ только к первым 2 28 (268 435 456) секторам. Таким образом, диск, который использует 512-байтовые сектора, будет ограничен 128 ГБ, а диск, использующий 4K-сектора, будет ограничен 1 ТБ.

Установив его на загрузочный диск с помощью интерпретатора команд Windows 98 DOS 7, SpinRite 6 может теоретически протестировать весь диск.

Исправлены ли плохие сектора?

Физические дефекты производства, поломки головок и большинство других неисправностей, обнаруженных контроллером жесткого диска, как правило, не могут быть устранены. Те, которые были изолированы операционной системой, — другая история.

жесткий диск-ремонт

Инструменты операционной системы

Иногда возможно восстановить блоки или кластеры, которые были помечены как плохие операционной системой. Поскольку кластер обычно состоит из нескольких секторов, и один плохой сектор будет помечать весь кластер как плохой, иногда можно восстановить эти кластеры.

Это связано с тем, что контроллер жесткого диска, возможно, не имел дело с неисправным сектором до того, как с ним столкнулась операционная система. Помните, что накопитель, как правило, не знает, что что-то не так, пока не может прочитать сектор, и он не пытается переназначить сектор, если не было многочисленных неудачных операций чтения или попытки записи в этот сектор после неудачного чтения.

Если контроллер жесткого диска перераспределил поврежденный сектор после того, как операционная система пометила содержащий кластер как плохой, повторно запустите соответствующую команду для повторной оценки поврежденных блоков ( chkdsk / b для Windows, e2fsck -cc для Linux — вы не должны используйте здесь опцию -k, поскольку она будет хранить текущий список поврежденных блоков), следует удалить его из списка.

SpinRite

SpinRite — один из инструментов, который утверждает, что способен восстанавливать слабые сектора. Даже после трех десятилетий работы с технологиями я не хочу доверять этому. Сектор изначально был помечен как неисправный контроллером накопителя (или содержащий кластер был помечен операционной системой), поскольку данные не могли быть надежно прочитаны с него. Даже если его способность хранить данные может быть улучшена, это, вероятно, будет временным, что должно напомнить пару вопросов.

  1. Насколько временен этот ремонт?
  2. Готовы ли вы доверить свои данные этому сектору?

Лично это одна из областей, где я не хочу идти. Большая часть моих данных слишком важна.

Мониторинг статуса привода

Один из двух лучших способов защитить данные, которые вы сохранили на своих дисках, — если вы не обнаружили их в предыдущих комментариях, — это обеспечить надежный план резервного копирования.

Другой использует программное обеспечение для мониторинга состояния ваших дисков. Современные жесткие диски включают в себя технологию самоконтроля, анализа и составления отчетов ( SMART) чтобы определить работоспособность накопителя и прогнозировать сбои.

Ubuntu, RedHat и их производные имеют утилиту Disks как часть их установки по умолчанию. Это позволяет получить доступ к наиболее важным счетчикам SMART, а также запустить как короткие, так и расширенные тесты SMART. Есть также инструменты командной строки, такие как smartctl. сбоев сбоев которые можно использовать для автоматизации проверки и создания отчетов о состоянии диска.

Windows не предоставляет эту возможность, поэтому нам нужны сторонние инструменты, такие как CrystalDiskInfo и информация о жестком диске Sentinel чтобы справиться с работой.

СМАРТ Счетчики

Не волнуйтесь, когда увидите значения, о которых сообщают эти инструменты. Пороговое значение устанавливается производителем, чтобы указать, когда оно будет считаться проблемой. Текущее нормализованное значение, вероятно, будет выше, чем наихудшее зарегистрированное значение, и для большинства счетчиков это ожидается. Нормализованные значения в диапазоне от 1 до 253, хотя некоторые производители выбирают начальную точку 100 или 200 для некоторых атрибутов, уменьшаются с более высокой начальной точки с течением времени, и это не обязательно проблема, пока она не опустится ниже порогового значения.

HDD-сторожевой-неудача привод

Независимо от того, какой инструмент вы выберете для мониторинга своих устройств хранения данных, существует краткий список счетчиков, которые вам следует учитывать, если ваш накопитель поддерживает их:

  • Счетчик 5 ( Количество перераспределенных секторов ) — это общее количество секторов, которые были перераспределены и помещены в G-LIST с момента его ввода в эксплуатацию. Это не включает сектора, которые были отмечены на заводе. Необработанные данные — это истинный счет, поэтому чем ниже, тем лучше.
  • Счетчик 10 (счетчик повторных попыток) показывает, сколько раз накопитель должен был попытаться раскрутить накопитель, пока он не достиг рабочей скорости, если первая попытка не удалась. Увеличение этого атрибута указывает на механические проблемы с приводом или возможные проблемы с питанием.
  • Счетчик 187 (Зарегистрированные неисправимые ошибки) — это количество ошибок ECC, которые не удалось исправить контроллером привода. Чем ниже, тем лучше, если смотреть на необработанное значение.
  • Счетчик 188 (время ожидания команды) — это число прерванных операций на устройстве. Обычно это происходит из-за проблем с питанием или проблемами с кабелем передачи данных. Опять же, значение необработанных данных должно быть низким.
  • Счетчик 195 (аппаратный ECC восстановлен) является реализацией, зависящей от поставщика, поэтому значения могут не всегда представлять идентичные условия. Обычно это количество попыток исправления ECC для возврата правильных данных с накопителя.
  • Счетчик 196 (Счетчик событий перераспределения) представляет количество раз, когда сектора инициировали событие переотображения контроллером. Он учитывает как успешные, так и неудачные попытки переназначения секторов. Это поддерживается не всеми производителями.
  • Счетчик 197 (счетчик текущих ожидающих секторов) — это число секторов, которые в настоящее время помечены как нестабильные и будут переназначены, если следующая попытка чтения будет успешной или когда будет записана следующая запись. Этот счетчик уменьшается, как только сектор был успешно переназначен.
  • Счетчик 198 (Offline Unc корректируемое количество секторов) — это общее количество ошибок при чтении или записи секторов. Если это начинает расти, возникает проблема с поверхностью диска или механической подсистемой.

Сами по себе многие из доступных счетчиков не дают большого представления об общем состоянии ваших дисков. Но когда они собраны вместе, уделяя особое внимание перечисленным выше, вы, скорее всего, заметите негативные тенденции, чтобы подготовиться к неизбежной кончине привода.

Вывод

Несмотря на то, что есть инструменты, помогающие предсказать, сколько времени может остаться на ваших устройствах хранения данных, это не устраняет необходимость в надежном, проверенном плане резервного копирования. Существует доказательство того, что большое количество дисков выйдет из строя без единой ошибки SMART, появляющейся во всей его истории. В том же отчете также показана высокая корреляция между некоторыми из ошибок SMART, перечисленных выше, и чрезвычайно сокращенным сроком службы устройства.

Например, поврежденные сектора, указанные на рисунке выше, принадлежат жесткому диску Sentinal Pro с оставшимся 21-дневным сроком службы. Два месяца назад он сообщал о 30 днях, и я все еще жду, чтобы узнать, как долго он продлится, прежде чем попадет в рай для данных. Таким образом, он показывает, что прогнозный анализ, хотя и указывает на то, что данные находятся под угрозой, все еще не может точно дать надежное представление о том, сколько времени у них осталось.

Несмотря на то, что количество поврежденных секторов не увеличивалось в течение нескольких месяцев, и использование регенератора жесткого диска на диске, чтобы увидеть, сможет ли он восстановить эти 77 поврежденных секторов, не помогло, общее состояние здоровья все еще несколько снизилось. Будет интересно посмотреть, как долго он выживет.

Мне интересно услышать, был ли у кого-то еще подобный опыт использования инструментов мониторинга SMART? Удалось ли вам сохранить ваши данные от катастрофы, используя их? Разве они не работают на вас вообще? Как насчет инструментов для восстановления поврежденных секторов, таких как SpinRite или HDD Regenerator? Позвольте мне знать в комментариях ниже!

Похожие посты
Объяснение технологий

Как работает жесткий диск? [Технология объяснила]

Объяснение технологий

Что такое программное обеспечение с открытым исходным кодом? [MakeUseOf Объясняет]

Объяснение технологий

Разрешения графического дисплея - что означают цифры? [MakeUseOf Объясняет]

Объяснение технологий

Как переформатировать внешний жесткий диск, не теряя на нем все