Ничего не предвещало рабочих выходных, но все неприятности любят появляться вечером пятницы. В 17.00 прилетел алерт: массив развален, диск отказал. Вроде бы не страшно. Инженер вытащил диск, вставил диск — массив пошел в ребилд.
В субботу утром новый алерт: у вас больше нет массива, диск-источник погиб. Инженер хватает второй диск, тащит в ЦОД, втыкает в сервер, собирает массив, запускает восстановление из ближайшего бэкапа. Смотрит на скорость и пишет, что к понедельнику должно подняться.
И да, поднимается, но только к вечеру понедельника, потому что скорость падает, и один из новых дисков ругается на повышенную температуру.
Слава богу, есть рабочее правило: если достал диск из зип — купи и положи новый, поэтому всегда есть запас. Мы скрестили пальцы и надеемся на лучшее. Но нет, избыток тепла был неспроста: диск снова отправился в Валгаллу. Окей, притащили новый, вставили и снова перестраиваем массив...
И что вы думаете? Диск-источник тоже вылетает при пересборке, да еще и портит первый бэкап/ Тоже не страшно, есть второй — но дохлых дисков на полке уже 4. Возможно, проблема в контроллере, корзинах или бэкплейне? Нет, диски не заводятся локально, и другие диски в этих же дырках сервера работают.
Мораль: выбирайте SSD, в итоге я на них и перешел. Почему я не сделал это сразу? Все просто: давила жаба. Диск стоит условные 18К, SSD — 70К. И вот итог: время на восстановление работоспособности сопоставимо с разницей в цене, не считая простоя виртуалок. Хорошо еще, что на дисках не было ничего критичного, поэтому в пылу битвы за восстановление работы никто не пострадал. Теперь, с SSD, такие проблемы будут решаться намного быстрее и проще — если вообще возникнут.
Подробнее о качествах SSD накопителей расскажу в следующем посте.
Больше интересного в телеграм-канале https://t.me/+a8sjeXybRkIwNWQy
Обратитесь к нам прямо сейчас и мы подберем для вас лучшие решения на самых выгодных условиях!