Решил поделиться с Вами своим опытом толькочтошным.
2 месяца назад приказал долго жить винчестер. Почти сутки не был доступен сервер. Хорошо, что на выходных. Слава Богу, винт запортился только на секторах, не содержащих бэкапы. Поэтому с бэкапы слили на новый винт и все восстановилось. Подумал о том, что нужно как-то обезопасить себя от таких нередких случаев гибели винчестеров. Поставил еще один винт. На одном - все, на другом - чисто бэкапы. Вчера и позавчера винчестер дергало в предсмертных конвульсиях. Видимо, ему понравилась досовская нагрузка на сервер. Посреди дня пришлось менять на новый винт. Опять недоступно пол дня.
Вот мне админ и предложил светлую тему: рейд (RAID).
Это стоит рейдовская плата и два винчестера зеркально пишутся. Вылетает один винт - второй продолжает жить.
Песня.
угу, конечно хорошая тема...
Но один раз у нас слетел контролер...
Даун: 2 суток , он даже умудрился запороть 5 SCSI винтов.
Эпос был счастлив.
Слетает в компах все - от блока питания до райд-контроллера.
Только, что-то чаще, что-то реже.
В данном случае пара вещей.
1) Райд-контроллер должен быть внешним. Всякие там ICH6R на асусах - это несерьезно. Может ICH7R будет получше. Но я с ними не работал.
2) Райд-контроллер должен мониториться. У хороших брендов ПО мониторит оффлайны и прочее, логирует и отсылает смски.
3) Даже при райде должен быть бекап. Если винт уходит в оффлайн, райд продолжает работать, прежде чем что-то мудрить, сделайте свежий бекап!
4) Если винт в массиве уходит в офф или что-то иное, что не входит в наши планы. Не надо дергаться, вытаскивать, вставлять винты беспорядочно. У контроллеров райда есть свое время между опросами винтов. Если время опроса будет больше, чем время вытаскивания винта, Райд с большой вероятностью посыпится.
5) Нельзя менять местами на degraded или failed массиве винты. Контроллер умеет запоминать места и винты, в которых были эти винты. В данном случае можно просто забыть, где какой винт, и можно убить информацию.
6) Что обычно я делал, когда у меня сыпался райд :
a) Делаем бекап. Очень редко, я не знаю ни одного случая, когда сыпался именно райд-контроллер так, чтобы райд совсем не работал. Обычно в райде уходит в даун один или очень редко более винтов.
Вытаскиваем из сервера отказавший винт, вставляем его на другой контроллер и тестим программами от производителя.
с) Если винт исправен, подключаем его обратно и делаем rebuild. Если не исправен, понятно что.
d) Check Consistency/Verify - делаем это в самом конце.
Руслан Иванов(Мастерская виртуальных и физических серверов)
www.vps.com.ua
пипец у вас тежелая жизнь у хостеров...постоянно что горит и слетает...
а кто делает дос атаки если не секрет?
Дос атака это как я понимаю что когда атакуют систему ставив не нужную информацию .От нагрузки начинает всё ломаться ?я прав ?
Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)