want2know Опубликовано 17 мая, 2014 · Жалоба Здравствуйте! Возникла следующая проблема . На сервере Hp с двухголовой гигабитной сетевой картой установлена Freebsd 8.4 + Abills. Один порт сервера подключен к медиаконверту(аплинк), другой к свичу(локальная сеть). Ситуация в следующем : за последнюю неделю пропадал доступ в интернет каждый день(бывало и по 2 раза).С локальной сети сервер доступен. С сервера в интернет не пингуется ничего, кроме самого интерфейса. Сервер по top не загружен(до 10%).У аплинка все хорошо. Временно помогает сделать на сервере ifconfig int_inet down/up. Медиаконвертер заменили, но падения продолжились. Прошу совета, что можно посмотреть. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Ну поменяйте сетевухи, может виснет что-то в контроллере. Какие сетевухи? Что в dmesg? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
alibek Опубликовано 17 мая, 2014 · Жалоба Временно помогает сделать на сервере ifconfig int_inet down/up. Логи нужно посмотреть. Там наверняка будет написано про ошибки. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Ну поменяйте сетевухи, может виснет что-то в контроллере. Какие сетевухи? Что в dmesg? Сетевая INTEL82801 . Да не на что сегодня поменять к сожалению. Только с понедельника.Уже голова седая за эту неделю. Dmesg Limiting icmp unreach response from 528 to 200 packets/sec Limiting icmp unreach response from 549 to 200 packets/sec Limiting icmp unreach response from 530 to 200 packets/sec Limiting icmp unreach response from 489 to 200 packets/sec Limiting icmp unreach response from 492 to 200 packets/sec Limiting icmp unreach response from 493 to 200 packets/sec Limiting icmp unreach response from 545 to 200 packets/sec Limiting icmp unreach response from 468 to 200 packets/sec Limiting icmp unreach response from 489 to 200 packets/sec Limiting icmp unreach response from 528 to 200 packets/sec Limiting icmp unreach response from 476 to 200 packets/sec Limiting icmp unreach response from 540 to 200 packets/sec Limiting icmp unreach response from 540 to 200 packets/sec Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Сколько тысяч лет серверу? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Вообще надо смотреть в такие моменты еще тцпдамп на порту, но скорее всего железо. Можно сетевухи местами поменять (переназначить ипы, линки переткнуть), если будет пропадать внутренний линк, значит всяко железо. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 (изменено) · Жалоба Серверу 2 года Спасибо!Сетевые карты местами попробую поменять, добавил следующие команды в конфиг: net.inet.tcp.blackhole=2 net.inet.udp.blackhole=1 net.inet.icmp.drop_redirect=1 В Dmesg стало все спокойно. Если Вам не тяжело, прошу пишите еще возможные варианты что и где посмотреть. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Последние логи из dmesg Limiting icmp ping response from 4913 to 200 packets/sec Limiting icmp ping response from 882 to 200 packets/sec Limiting icmp ping response from 4746 to 200 packets/sec Limiting icmp ping response from 5053 to 200 packets/sec Limiting icmp ping response from 4051 to 200 packets/sec Limiting icmp ping response from 4946 to 200 packets/sec Limiting icmp ping response from 1205 to 200 packets/sec Limiting icmp ping response from 5230 to 200 packets/sec Limiting icmp ping response from 4685 to 200 packets/sec Limiting icmp ping response from 4433 to 200 packets/sec Limiting icmp ping response from 4765 to 200 packets/sec Limiting icmp ping response from 888 to 200 packets/sec igb0: link state changed to DOWN igb0: link state changed to UP igb0: link state changed to DOWN igb0: link state changed to UP igb0: link state changed to DOWN igb0: link state changed to UP Limiting closed port RST response from 208 to 200 packets/sec Изменено 17 мая, 2014 пользователем want2know Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Limiting icmp unreach response from 545 to 200 В вашем случае ничего не значит, это левый мусор. В ipfw еще в такие моменты гляньте, мож там абилс чего неприятного вписывает. ПС. 82801 - это же вроде не сетевухи, а мосты ICH2? Древняя какая-то штука, очень не молодая. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Ну да, удп от души. Может торрент, а может кто ботнет словил. тцпдамп в помощь, тут только руками... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Вот еще vmstat , может будут полезны: vmstat -z ITEM SIZE LIMIT USED FREE REQUESTS FAILURES 64 Bucket: 536, 0, 303, 5, 303, 39 128 Bucket: 1048, 0, 1807, 14, 53223, 446 mbuf_packet: 256, 0, 16414, 994, 504362980, 4091 mbuf: 256, 0, 2, 2165, 312200807, 0 mbuf_cluster: 2048, 25600, 17408, 8192, 5020288, 8182 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Limiting icmp unreach response from 545 to 200 В вашем случае ничего не значит, это левый мусор. В ipfw еще в такие моменты гляньте, мож там абилс чего неприятного вписывает. ПС. 82801 - это же вроде не сетевухи, а мосты ICH2? Древняя какая-то штука, очень не молодая. В локальной сети NAT ,заметил на одном из натов : ipfw nat show: icmp=2, udp=44428, tcp=3555, sctp=0, pptp=0, proto=0, frag_id=0 frag_ptr=0 / tot=47985 При том, что на остальных tot<5k . Ну да, удп от души. Может торрент, а может кто ботнет словил. тцпдамп в помощь, тут только руками... Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? На отказавшей сетевухе ловить что летит вообще, есть ли входящий трафик. При зависании контроллера будет видно или ничего или только исх. трафик. Если вообще оно включится, может не дать включить promisc-mode. Ловить же флуд со своей сетки если решите, то делаете образно говоря tcpdump -nn -iigbX -c 1000 udp и смотрите что там за тыщу пакетов из удп прилетает. Главное установить "кто". Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Точно,Ошибся, сетевой адаптер 2 порта 1Гб/с NC362i. А что именно ловить tcpdump ? Может есть примеры? На отказавшей сетевухе ловить что летит вообще, есть ли входящий трафик. При зависании контроллера будет видно или ничего или только исх. трафик. Если вообще оно включится, может не дать включить promisc-mode. Ловить же флуд со своей сетки если решите, то делаете образно говоря tcpdump -nn -iigbX -c 1000 udp и смотрите что там за тыщу пакетов из удп прилетает. Главное установить "кто". Так , сделаю. А если при пропадании Интернета,все ip которые висят проблемном интерфейсе пингуются нормально(как из локалки так и с сервера) это не может говорить о том, что с железкой все хорошо? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Пинг локальных ипов не показатель. Если интерфейс завис, но в системе значится как рабочий, то система будет продолжать отвечать на пинги идущие к его ипам. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Понял, а если найти пока временную затычку которая будет передергивать интерфейс(если нет пинга на шлюз). Может у кого-нибудь есть(видел уже) пример? Еще в логах вот такое нашел при падении : ifa_add_loopback_route: insertion failed Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба Короче надо смотреть все. Что-то может создавать/убивать динамически интерфейсы/роуты? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба В том то и дело,что ничего 2 года не менялось, не перенастраивалось. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 (изменено) · Жалоба Магия. Может жарко в помещении и емкости на сетевухе сдохли :) Изменено 17 мая, 2014 пользователем DVM-Avgoor Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Вот такой скрипт накопал, как думаете будет работать? #!/bin/sh target="195.214.195.105"; # цель тестирования ukr.net fping_path="/usr/local/sbin/fping" datenow="$(date +%Y%m%d%H%M%S)" flags_path="/tmp/fping-$datenow.log" res=`$fping_path $target|grep -o 'alive' > $flags_path && grep 'alive' $flags_path | wc -l && rm $flags_path`; # собственно сама проверка канала ans=0; if [ $res>$ans ]; then echo "Link is UP $datenow" >> /tmp/reserver.log else echo "Link is DOWN $datenow" >> /tmp/reserver.log /sbin/ifconfig int down /sbin/ifconfig int up Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 17 мая, 2014 · Жалоба написано странно, вместо $res > $ans надо поставить бы [ $res -gt $ans ], обилие ненужных ';' в принципе не страшно. Да fi еще не хватает) Что-то там все как-то мудрёно-мудрёно устроено, не могу такое читать, сразу глазки болять :( Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 (изменено) · Жалоба Да попроще не нашел, а сам я в скриптах полный ноль. Поменял местами локалку и аплинк(только что упало опять) . Наблюдаю. Скрипт не работает :( Изменено 17 мая, 2014 пользователем want2know Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 (изменено) · Жалоба Магия. Может жарко в помещении и емкости на сетевухе сдохли :) Температура держится 22 градуса в помещении. Изменено 17 мая, 2014 пользователем want2know Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
roma33rus Опубликовано 17 мая, 2014 · Жалоба Надеюсь кабель пробовали менять от сетевой карты к медиаконвертеру? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба Надеюсь кабель пробовали менять от сетевой карты к медиаконвертеру? Кабель менял(заводской патчкорд) - ничего не изменилось. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
roma33rus Опубликовано 17 мая, 2014 · Жалоба А у Вас BGP? Если да, то что в логах? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
want2know Опубликовано 17 мая, 2014 · Жалоба А у Вас BGP? Если да, то что в логах? Нет, BGP нет. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...