FastNetMon

Показаны сообщения с ярлыком Linux Soft-Raid. Показать все сообщения
Показаны сообщения с ярлыком Linux Soft-Raid. Показать все сообщения

пятница, 23 октября 2009 г.

Посылка email уведомлений в случае отказа soft raid в Centos/Debian 5

Чинить Рейд массив уже постфактум, когда "все сломалось", занятие не особо приятно, поэтому проблему нужно предупреждать!

Этим мы сейчас и займемся, будем учить Soft Raid высылать уведомление по почте при отказе одного из дисков.

Для начала настроим адрес администратора сервера: http://phpsuxx.blogspot.com/2009/06/root-email.html

Теперь открываем файл: /etc/mdadm.conf (на Debian: /etc/mdadm/mdadm.conf) там должно быть примерно следующее:

DEVICES /dev/sda* /dev/sdb*
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=a3a769a2:d63d791e:6fac0352:e67bc837
ARRAY /dev/md1 level=raid1 num-devices=2 UUID=d923ab87:d19bc8a4:76f52a39:cd3e1a1b



Добавляем туда две строки:

MAILADDR support@domain.ru
MAILFROM server1@domain.ru


Перезапускаем монитор на Centos:

/etc/init.d/mdmonitor restart


Перезапускаем монитор на Debian:

/etc/init.d/mdadm restart


Убеждаемся, что монитор добавился в автозагрузку:

chkconfig --list | grep mdmonitor
mdmonitor 0:off 1:off 2:on 3:on 4:on 5:on 6:off


На Debian:

update-rc.d mdadm defaults


Теперь в случае, если рейд рассыпится, будет выслано уведомление на support@domain.ru (только проверьте пожалуйста, что у вас точно работает почта)

Кстати, вот очень интересный способ мониторинга Заббиксом: http://www.zabbix.com/forum/archive/index.php/t-3135.html

Мониторинг software raid linux

Какие средства кто знает для мониторинга soft raid на linux ? Кроме /proc/mdstat ничего в голову не приходит.

Вот ещё способ:

mdadm --detail /dev/md2
/dev/md2:
Version : 00.90.03
Creation Time : Tue Jun 16 18:41:35 2009
Raid Level : raid1
Array Size : 293684160 (280.08 GiB 300.73 GB)
Used Dev Size : 293684160 (280.08 GiB 300.73 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 2
Persistence : Superblock is persistent

Update Time : Fri Oct 23 18:39:55 2009
State : clean
Active Devices : 2
Working Devices : 2
Failed Devices : 0
Spare Devices : 0

UUID : 5345cce2:1e5da02a:776c2c25:004bd7b2
Events : 0.8

Number Major Minor RaidDevice State
0 8 3 0 active sync /dev/sda3
1 8 19 1 active sync /dev/sdb3



А вот так смотреть статус в виде, удобном для скриптов:
mdadm --detail /dev/md0 | grep 'State :' | awk '{print $3}'


Для массива в "нормальном состоянии" выдача скрипт будет "clean"