Hawk128 Опубликовано 23 июня, 2014 · Жалоба FreeBSD gw01.comteks.biz 10.0-STABLE FreeBSD 10.0-STABLE #0 r264634: Fri Apr 18 05:54:56 MSK 2014 hawk@gw01.comteks.biz:/usr/obj/usr/src/sys/GENERIC amd64 Замена - в смысле железо, свежий как раз пришел, туда и переполз. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 16 июля, 2014 · Жалоба К сожалению, проблема ни куда не делась. Просто при смене сервера немного отползла... Итого, опять МПД впадает точно так же в ступор. Вроде при уничтожении очередного ngX интерфейса после отключения пользователя. Есть подозрения, что плохо дружат с BGP FV. Колбасят друг друга. Пока что вынес только МПД и ОСПФ на отдельную машину, пока что работает. Клиентов крохи, менее 200 подключений. Есть у кого-нибудь идеи? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
polmax Опубликовано 17 июля, 2014 (изменено) · Жалоба Есть у кого-нибудь идеи? Что только не пробовал, но овер 250 соединений связь с мпд пропадала, так как решить надо было быстро вопрос, то откатился на 9. А по теме вот: http://sourceforge.net/p/mpd/discussion/44692/thread/e446b64d/'>http://sourceforge.net/p/mpd/discussion/44692/thread/e446b64d/ сам не пробовал ибо уже откатился, но попробовать стоит, что-то там связанное с логами. И по проблеме советую написать пост тут всё же: http://sourceforge.net/p/mpd/discussion/44692/ Это проблема mpd всё же. Изменено 17 июля, 2014 пользователем polmax Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 17 июля, 2014 (изменено) · Жалоба Не мой случай, т.к. радиус нормально и всегда отвечает. Сейчас жду железо, приедет, буду экспериментировать. Изменено 17 июля, 2014 пользователем Hawk128 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
orca Опубликовано 25 июля, 2014 · Жалоба Я откатился на 9,2 проблема решилась. Видимо не все гладко у десятки с нетграфом. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 25 июля, 2014 · Жалоба В 10-ке изменили работу в интерфейсами внутри как-то. Теперь при создании и удалении идет информация дополнительная в сислог. Вот на удалении проблема и вылезает в каких-то случаях неясных... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 26 июля, 2014 · Жалоба В 10-ке devd запускает скрипты при up/down. Пробовали его вообще отключать? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 27 июля, 2014 · Жалоба Нет, не пробовал. Просто отключить? Не на что не влияет он? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
DVM-Avgoor Опубликовано 27 июля, 2014 · Жалоба Просто отключить? Не на что не влияет он? Да он особо на роутере ничем не нужен. Вряд ли вы постоянно вставляете pccard-девайсы да усб-свистки. Список правил в /etc/devd.conf гляньте, решите нужно оно вам вообще на роутере или нет. Многие отключают, потому что он околобесполезен. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
vlad11 Опубликовано 27 июля, 2014 · Жалоба Пробуйте как временную меру в loader.conf: net.graph.maxdata=2048 Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 28 июля, 2014 · Жалоба Пробовал. И больше вроде ставил. Сейчас проверить не могу, вынес МПД на отдельный сервак, на 10-ке - глюков нет. Как появятся - буду пробовать. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 15 сентября, 2014 · Жалоба Собственно, что помогло в решении проблемы и помогло ли? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 15 сентября, 2014 · Жалоба MPD сейчас крутиться на отдельном серваке и пока проблем нет. Скорее всего просто отсрочка, т.к. сервак много мощнее чем надо. Надеюсь к моменту возникновения проблем уже подправят систему... Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 16 сентября, 2014 · Жалоба А систему туда эту же перенесли, или заново ставили\собирали? Патчили ли ng_pptpgre на предмет решения вопроса переупорядочивания пакетов? Можете показать netstat -LAan с этой машины? Интересуют очереди у мпд. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Hawk128 Опубликовано 16 сентября, 2014 · Жалоба Систему просто клонировал, без изменений. Сейчас уже смысла нагрузку показывать нет, там значительная часть абонентов на еще один сервер перебралась по другим причинам. Т.е. сейчас там смех, а не нагрузка. ng_pptpgre не патчил. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 17 сентября, 2014 (изменено) · Жалоба ..Просто интересно, что после старта 5.7 на 10-stable у меня на ip.5006 1024 очереди, когда на ip.5006 8.4-stable\5.6 128. Да и с нагрузкой не очень-то коррелирует Изменено 17 сентября, 2014 пользователем Sincha Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Ivan_83 Опубликовано 17 сентября, 2014 · Жалоба А пробовал кто в src.conf писать: WITHOUT_UTMPX Set to not build user accounting tools such as last(1), users(1), who(1), ac(8), lastlogin(8) and utx(8). и пересобирать систему и порты? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 19 сентября, 2014 · Жалоба Не пробовал. Расскажите, почему Вы считаете, что это может помочь? Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Ivan_83 Опубликовано 19 сентября, 2014 · Жалоба Возможно это вообще выпилит utmpx из системы и устранит проблему. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 22 сентября, 2014 · Жалоба Пересобрал\стартанул\впустил клиентов. Посмотрим. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 29 сентября, 2014 · Жалоба что-то поламали в 10.1-beta2 или что-то у меня с машиной: постоянные ребуты, не крэша, не логов, ничего. На консоль нечего подключить, что бы увидеть. Корреляции с нагрузкой нет вообще. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 16 октября, 2014 · Жалоба Тут это.. Говорят, что частично какае-то проблема пофикшена: https://sourceforge.net/p/mpd/discussion/44693/thread/dc9ac93a/ Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Ivan_83 Опубликовано 17 октября, 2014 · Жалоба Собственно: kern.ipc.somaxconn переименовали в kern.ipc.soacceptqueue. grep -R "UTMPX" /usr/src/ показывает не так уж много где оно используется /usr/src/lib/libpam/modules/pam_lastlog/pam_lastlog.c /usr/src/usr.bin/getent/getent.c /usr/src/kerberos5/ /usr/src/crypto/heimdal/ /usr/src/contrib/opie/libopie/ /usr/src/contrib/ntp/libntp/ "Listen queue overflow" - неминуемый при продолжительном времени может означать только одно: неправильный алгоритм приёма соединений. Кажется я тоже наступал на эти грабли. Обычно: пришло соединение - сгенерировали эвент - приняли соединение Иногда: прошло несколько соединений - сгенерировали эвент - приняли ОДНО соединение. Можно попробовать проптчить файл pptp_ctrl.c функция PptpCtrlListenEvent превращается в static void PptpCtrlListenEvent(int type, void *cookie) { PptpLis const l = (PptpLis)cookie; struct sockaddr_storage peerst, selfst; struct u_addr peer_addr, self_addr; in_port_t peer_port, self_port; char ebuf[64]; PptpCtrl c; int sock; char buf[48], buf2[48]; socklen_t addrLen; /* Accept connection */ while ((sock = TcpAcceptConnection(l->sock, &peerst, FALSE)) >= 0) { sockaddrtou_addr(&peerst,&peer_addr,&peer_port); /* Get local IP address */ addrLen = sizeof(selfst); if (getsockname(sock, (struct sockaddr *) &selfst, &addrLen) < 0) { Perror("PPTP: %s getsockname()", __func__); u_addrclear(&self_addr); self_port = 0; } else { sockaddrtou_addr(&selfst, &self_addr, &self_port); } Log(LG_PHYS2, ("PPTP: Incoming control connection from %s %u to %s %u", u_addrtoa(&peer_addr, buf, sizeof(buf)), peer_port, u_addrtoa(&self_addr, buf2, sizeof(buf2)), self_port)); /* Initialize a new control block */ if ((c = PptpCtrlGetCtrl(FALSE, &self_addr, &peer_addr, peer_port, ebuf, sizeof(ebuf))) == NULL) { Log(LG_PHYS2, ("PPTP: Control connection failed: %s", ebuf)); close(sock); continue; } c->csock = sock; /* Initialize the session */ PptpCtrlInitCtrl(c, FALSE); } } Аналогично и pppoe.c PppoeListenEvent switch (sz = NgRecvData(PIf->dsock, response, sizeof(response), rhook)) { case -1: Log(LG_ERR, ("NgRecvData: %d", sz)); return; case 0: Log(LG_ERR, ("NgRecvData: socket closed")); return; } Превращается в while (0 != (sz = NgRecvData(PIf->dsock, response, sizeof(response), rhook))) { if (-1 == sz) { Log(LG_ERR, ("NgRecvData: %d", sz)); return; } ... (не забываем } снизу добавить и заменить return на continue) Ещё вариантом сделать глюк реже будет задрать приоритет mpd5 до -20. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Sincha Опубликовано 17 октября, 2014 · Жалоба Кстати, Listen queue overflow только сейчас попадает в месаджи, раньше он просто не попадал, но был виден в нетстате Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...
Ivan_83 Опубликовано 17 октября, 2014 · Жалоба Говорят патч для этого простой: http://mpd.cvs.sourceforge.net/viewvc/mpd/mpd/src/util.c?r1=1.78&r2=1.79&sortby=date но я не уверен что этого достаточно ибо возможно ситуация см выше. Вставить ник Цитата Ответить с цитированием Поделиться сообщением Ссылка на сообщение Поделиться на других сайтах More sharing options...