Сервер запищал, сообщив о переходе в аварийный режим, о работе RAID режиме Degraded, без одного диска. Юрий проверил. Всё работает. Юрий знал, что в один момент времени может ломаться только 1
Тут Юрик разозлился и вытащил третий диск (!??)
Система сказала “ГАВ” и упала.
Дальше Юрий вставил все диски обратно, но сервер не завёлся. Илья обесточил его и включил снова. Не работает!
И тогда Юрий сделал гениальное действие — он поменял все диски местами. Включил. Не помогло!
И тогда он позвонил нам. Я был в отпуске, поэтому меня решили не беспокоить, и на Космонавтов, 13 поехал Андрей Ржавый. Приехал, спросил: — Что тут было?
Юрий ответил, что вообще ничего не было: — Работал, работал и вдруг выключился. Теперь диски не видит.
Андрей вспомнил чему его учили и предположил, что диски перешли в режим “Отключено” НЗ почему. В принципе, один может выпасть. Как правило это происходит из-за старения диска, когда он ещё “живой”, но уже в состоянии деменции.
Диск при этом не отвечает контроллеру в отведённый промежуток времени, и контроллер считает, что он уже таво.
Будь там я, я бы осмотрел диски, допросил бы Юрия с пристрастием. Я на всякий случай маркирую диски в RAID-массивах маркером. Одна чёрная точка — первый, — второй, … — третий, и так далее:…………. Так что я БЫ понял, что там у них произошло на самом деле. Некоторые Заказчики, кстати, не любят меня именно за то, что я им задаю уточнящие вопросы, будто бы зная, что у них на самом деле было. И этот Юра меня тоже за это не любил. Он чей-то там сыночек, попал на должность исключительно по родству и был о себе ооочень большого мнения. Но, увы, там был не я, а Андрей, и он поверил представителю Заказчика, повёлся на его речи, зашёл в BIOS RAID-контроллера, включил диски, вышел из меню и перезагрузил сервер. Дальше RAID-контроллер увидел в себе новые диски (если переставить исправный диск из гнезда в гнездо, то для контроллера он уже идёт как новый), и после этого сам, автоматически запустил процедуру Rebuild, создав идеально правильный, девственно чистый массив заново. Получилось, что сервер есть, но данных на нём нет. Совершенно.
В итоге Юрий Ильин полетел не в Анапу, в отпуск, а в Москву, в сервис восстановления данных с повреждённых RAID-массивов, оставил там 2300 вечнозелёных, но нужные базы ему всё же восстановили. Ибо диски были исправные.
На всякий случай: знайте, что на исправных носителях информация практически на 95 % восстановима. Даже после форматирования, удаления разделов, очистки SSD, флешки. Главное туда ничего больше не писать и не истерить. А ещё следует помнить, что производители серверов не отвечают за сохранность данных на них. И уж тем более, если виноват в потере данных сам же Пользователь, нарушивший Инструкцию.
Кстати, если верить Сноудену, то возвращаемые Производителю по гарантии диски вначале ремонтируются, после чего с них АНБ сливает себе всю инфу. Она ими собирается отовсюду. Так в 90-х 63 % валовых разведданных У НИХ получалось тупо с перехвата пейджерных сообщений
Юрик тогда настаивал на нашей вине, вроде как сервер должен иметь щиток, чтобы в него нельзя было залезть и диски вытащить. Ага! Щаз. И помещён в бронированную камеру.
Пока писал, вспомнил как у одного Заказчика в сервере Kraftway EL20 жёсткие диски SATA регулярно "летели", и мы их меняли по гарантии. В конце-концов я скатался и посмотрел на условия эксплуатации. Оказалось, что сервер этот эксплуатировался в тумбочке (!!!), отчего диски были всегда в перегретом состоянии, существенно выше +50 °C, но если процессор Intel Pentium-4 сам себя спасал, снижая частоту по 100MHz, ступенчато, а вместе с тем и напряжение, и термопакет, то диски стабильно перегревались. И дохли. А ещё один сервер Kraftway EL20 упал. Там его эксплуатировали не В, а НА тумбочке, а у неё после прокатывания через порог, колёсико отвалилось. И её поставили к стенке тем местом, где колеса нет. Затем повернули тумбочку. Однако, поскольку дифферент у сервера был на корму, то тумбочка с сервером стояла на трёх колесах и не падала. Несколько месяцев стояла. Пока внутрь не положили пачки с бумагой. Тогда бумага победила железо, сервер сделал оверкиль и, в прямом смысле слова, упал, на пол.