want2know Posted May 17, 2014 Здравствуйте! Возникла следующая проблема . На сервере Hp с двухголовой гигабитной сетевой картой установлена Freebsd 8.4 + Abills. Один порт сервера подключен к медиаконверту(аплинк), другой к свичу(локальная сеть). Ситуация в следующем : за последнюю неделю пропадал доступ в интернет каждый день(бывало и по 2 раза).С локальной сети сервер доступен. С сервера в интернет не пингуется ничего, кроме самого интерфейса. Сервер по top не загружен(до 10%).У аплинка все хорошо. Временно помогает сделать на сервере ifconfig int_inet down/up. Медиаконвертер заменили, но падения продолжились. Прошу совета, что можно посмотреть. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Ну поменяйте сетевухи, может виснет что-то в контроллере. Какие сетевухи? Что в dmesg? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
alibek Posted May 17, 2014 Временно помогает сделать на сервере ifconfig int_inet down/up. Логи нужно посмотреть. Там наверняка будет написано про ошибки. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Ну поменяйте сетевухи, может виснет что-то в контроллере. Какие сетевухи? Что в dmesg? Сетевая INTEL82801 . Да не на что сегодня поменять к сожалению. Только с понедельника.Уже голова седая за эту неделю. Dmesg Limiting icmp unreach response from 528 to 200 packets/sec Limiting icmp unreach response from 549 to 200 packets/sec Limiting icmp unreach response from 530 to 200 packets/sec Limiting icmp unreach response from 489 to 200 packets/sec Limiting icmp unreach response from 492 to 200 packets/sec Limiting icmp unreach response from 493 to 200 packets/sec Limiting icmp unreach response from 545 to 200 packets/sec Limiting icmp unreach response from 468 to 200 packets/sec Limiting icmp unreach response from 489 to 200 packets/sec Limiting icmp unreach response from 528 to 200 packets/sec Limiting icmp unreach response from 476 to 200 packets/sec Limiting icmp unreach response from 540 to 200 packets/sec Limiting icmp unreach response from 540 to 200 packets/sec Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Сколько тысяч лет серверу? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Вообще надо смотреть в такие моменты еще тцпдамп на порту, но скорее всего железо. Можно сетевухи местами поменять (переназначить ипы, линки переткнуть), если будет пропадать внутренний линк, значит всяко железо. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 (edited) Серверу 2 года Спасибо!Сетевые карты местами попробую поменять, добавил следующие команды в конфиг: net.inet.tcp.blackhole=2 net.inet.udp.blackhole=1 net.inet.icmp.drop_redirect=1 В Dmesg стало все спокойно. Если Вам не тяжело, прошу пишите еще возможные варианты что и где посмотреть. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Последние логи из dmesg Limiting icmp ping response from 4913 to 200 packets/sec Limiting icmp ping response from 882 to 200 packets/sec Limiting icmp ping response from 4746 to 200 packets/sec Limiting icmp ping response from 5053 to 200 packets/sec Limiting icmp ping response from 4051 to 200 packets/sec Limiting icmp ping response from 4946 to 200 packets/sec Limiting icmp ping response from 1205 to 200 packets/sec Limiting icmp ping response from 5230 to 200 packets/sec Limiting icmp ping response from 4685 to 200 packets/sec Limiting icmp ping response from 4433 to 200 packets/sec Limiting icmp ping response from 4765 to 200 packets/sec Limiting icmp ping response from 888 to 200 packets/sec igb0: link state changed to DOWN igb0: link state changed to UP igb0: link state changed to DOWN igb0: link state changed to UP igb0: link state changed to DOWN igb0: link state changed to UP Limiting closed port RST response from 208 to 200 packets/sec Edited May 17, 2014 by want2know Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Limiting icmp unreach response from 545 to 200 В вашем случае ничего не значит, это левый мусор. В ipfw еще в такие моменты гляньте, мож там абилс чего неприятного вписывает. ПС. 82801 - это же вроде не сетевухи, а мосты ICH2? Древняя какая-то штука, очень не молодая. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Ну да, удп от души. Может торрент, а может кто ботнет словил. тцпдамп в помощь, тут только руками... Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Вот еще vmstat , может будут полезны: vmstat -z ITEM SIZE LIMIT USED FREE REQUESTS FAILURES 64 Bucket: 536, 0, 303, 5, 303, 39 128 Bucket: 1048, 0, 1807, 14, 53223, 446 mbuf_packet: 256, 0, 16414, 994, 504362980, 4091 mbuf: 256, 0, 2, 2165, 312200807, 0 mbuf_cluster: 2048, 25600, 17408, 8192, 5020288, 8182 Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Limiting icmp unreach response from 545 to 200 В вашем случае ничего не значит, это левый мусор. В ipfw еще в такие моменты гляньте, мож там абилс чего неприятного вписывает. ПС. 82801 - это же вроде не сетевухи, а мосты ICH2? Древняя какая-то штука, очень не молодая. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Ну да, удп от души. Может торрент, а может кто ботнет словил. тцпдамп в помощь, тут только руками... Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? На отказавшей сетевухе ловить что летит вообще, есть ли входящий трафик. При зависании контроллера будет видно или ничего или только исх. трафик. Если вообще оно включится, может не дать включить promisc-mode. Ловить же флуд со своей сетки если решите, то делаете образно говоря tcpdump -nn -iigbX -c 1000 udp и смотрите что там за тыщу пакетов из удп прилетает. Главное установить "кто". Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? На отказавшей сетевухе ловить что летит вообще, есть ли входящий трафик. При зависании контроллера будет видно или ничего или только исх. трафик. Если вообще оно включится, может не дать включить promisc-mode. Ловить же флуд со своей сетки если решите, то делаете образно говоря tcpdump -nn -iigbX -c 1000 udp и смотрите что там за тыщу пакетов из удп прилетает. Главное установить "кто". Так , сделаю. А если при пропадании Интернета,все ip которые висят проблемном интерфейсе пингуются нормально(как из локалки так и с сервера) это не может говорить о том, что с железкой все хорошо? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Пинг локальных ипов не показатель. Если интерфейс завис, но в системе значится как рабочий, то система будет продолжать отвечать на пинги идущие к его ипам. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Понял, а если найти пока временную затычку которая будет передергивать интерфейс(если нет пинга на шлюз). Может у кого-нибудь есть(видел уже) пример? Еще в логах вот такое нашел при падении : ifa_add_loopback_route: insertion failed Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 Короче надо смотреть все. Что-то может создавать/убивать динамически интерфейсы/роуты? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 В том то и дело,что ничего 2 года не менялось, не перенастраивалось. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 (edited) Магия. Может жарко в помещении и емкости на сетевухе сдохли :) Edited May 17, 2014 by DVM-Avgoor Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Вот такой скрипт накопал, как думаете будет работать? #!/bin/sh target="195.214.195.105"; # цель тестирования ukr.net fping_path="/usr/local/sbin/fping" datenow="$(date +%Y%m%d%H%M%S)" flags_path="/tmp/fping-$datenow.log" res=`$fping_path $target|grep -o 'alive' > $flags_path && grep 'alive' $flags_path | wc -l && rm $flags_path`; # собственно сама проверка канала ans=0; if [ $res>$ans ]; then echo "Link is UP $datenow" >> /tmp/reserver.log else echo "Link is DOWN $datenow" >> /tmp/reserver.log /sbin/ifconfig int down /sbin/ifconfig int up Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
DVM-Avgoor Posted May 17, 2014 написано странно, вместо $res > $ans надо поставить бы [ $res -gt $ans ], обилие ненужных ';' в принципе не страшно. Да fi еще не хватает) Что-то там все как-то мудрёно-мудрёно устроено, не могу такое читать, сразу глазки болять :( Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 (edited) Да попроще не нашел, а сам я в скриптах полный ноль. Поменял местами локалку и аплинк(только что упало опять) . Наблюдаю. Скрипт не работает :( Edited May 17, 2014 by want2know Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 (edited) Магия. Может жарко в помещении и емкости на сетевухе сдохли :) Температура держится 22 градуса в помещении. Edited May 17, 2014 by want2know Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted May 17, 2014 Надеюсь кабель пробовали менять от сетевой карты к медиаконвертеру? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 Надеюсь кабель пробовали менять от сетевой карты к медиаконвертеру? Кабель менял(заводской патчкорд) - ничего не изменилось. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
roma33rus Posted May 17, 2014 А у Вас BGP? Если да, то что в логах? Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...
want2know Posted May 17, 2014 А у Вас BGP? Если да, то что в логах? Нет, BGP нет. Вставить ник Quote Ответить с цитированием Share this post Link to post Share on other sites More sharing options...