nsa2006 Posted December 22, 2015 · Report post Было одно сильное изменение с 1.9 на 1.10 - детали здесь: Спасибо, получилось! Share this post Link to post Share on other sites
_longhorn_ Posted December 22, 2015 · Report post Но кто мне объяснит смысл переписывания memset(sk_pppox(po) + 1, 0, sizeof(struct pppox_sock) - sizeof(struct sock)); ??? скорее - просто подстраховка, чтобы при race condition (когда воркер инициализирует соединение, прервав на средине дисконект) не потерлись нужные поля... Доброго здоровья! Как с новыми патчами, падает ли?) И у меня падает... Пробовал на одном 4.1.13 с патчем, на другом 4.1.15, там патч уже частично включен. Оба жили долго и счастливо и умерли в один день :) Откатился на 3.14.58 на обоих покаместь... Share this post Link to post Share on other sites
nsa2006 Posted December 22, 2015 (edited) · Report post А кто что скажет по этой теме? https://accel-ppp.org/forum/viewtopic.php?f=10&t=545 Что то обновление до 1.10 не решило проблему поедания soft-irq, на аналогичных брасах терминирующих PPPoE такой нагрузки не наблюдаю. Edited December 22, 2015 by nsa2006 Share this post Link to post Share on other sites
hsvt Posted December 22, 2015 · Report post https://accel-ppp.org/forum/viewtopic.php?f=10&t=545&sid=f263106d29f76a81a50ebd3a5eacb8db&start=10#p1875 так еще оказывается из-за unit-cache accel не сможет рестартиться и перезагружаться, что сейчас уже и заметно на 30cff41b56be0d4c3e407e8aa4de5b289eef2ab0. Хотя тут советовали как раз ставить в 1000 или 2000 unit-cache. Share this post Link to post Share on other sites
kayot Posted December 22, 2015 · Report post А кто что скажет по этой теме? https://accel-ppp.org/forum/viewtopic.php?f=10&t=545 Что то обновление до 1.10 не решило проблему поедания soft-irq, на аналогичных брасах терминирующих PPPoE такой нагрузки не наблюдаю. Я решил проблему апгрейдом сервера :) А так да, есть где-то узкое место в accel + IPoE. PPPoE сервера на том же железе у меня потребляют в 2-3 раза меньше ресурсов. Возможно dhcp relay так ресурсы кушает. Share this post Link to post Share on other sites
myth Posted December 30, 2015 (edited) · Report post Здравствуйте. Появился еще вопрос - почему может грузиться только одно ядро? Прерывания раскинуты по ядрам. Edited December 30, 2015 by myth Share this post Link to post Share on other sites
_longhorn_ Posted December 30, 2015 · Report post Здравствуйте. Появился еще вопрос - почему может грузиться только одно ядро? Прерывания раскинуты по ядрам. У вас PPPoE или IPoE? Если IPoE то используете ли QinQ? В данном случае это очень важно. Share this post Link to post Share on other sites
myth Posted December 30, 2015 (edited) · Report post Здравствуйте. Появился еще вопрос - почему может грузиться только одно ядро? Прерывания раскинуты по ядрам. У вас PPPoE или IPoE? Если IPoE то используете ли QinQ? В данном случае это очень важно. PPPoE. Потоков в конфиге 4 Edited December 30, 2015 by myth Share this post Link to post Share on other sites
_longhorn_ Posted December 30, 2015 (edited) · Report post Здравствуйте. Появился еще вопрос - почему может грузиться только одно ядро? Прерывания раскинуты по ядрам. У вас PPPoE или IPoE? Если IPoE то используете ли QinQ? В данном случае это очень важно. PPPoE. Потоков в конфиге 4 Тогда включайте RPS и RFS, должно помочь. Какая сетевая карта используется? Edited December 30, 2015 by _longhorn_ Share this post Link to post Share on other sites
myth Posted December 30, 2015 (edited) · Report post Интел с 4 совмещенными очередями. И сразу извиняюсь за дурацкий вопрос - а ссылочку можно? Беглое чтение гугла показало, что да - это то, что нужно. _longhorn_, спасибо, разобрался, все заработало как нужно Edited December 30, 2015 by myth Share this post Link to post Share on other sites
_longhorn_ Posted December 30, 2015 · Report post Интел с 4 совмещенными очередями Создайте количество очередей равное количеству ядер одного CPU. Например, Вы используете 4-х ядерный CPU, значит и количество векторов прерываний создайте 4. Привяжите каждый вектор вручную к каждому ядру и попробуйте включить RPS, затем можете попробовать добавить RFS, должно помочь. Share this post Link to post Share on other sites
myth Posted December 31, 2015 · Report post _longhorn_, спасибо еще раз. Вчера лимита не хватило. Все заработало. Share this post Link to post Share on other sites
myth Posted January 7, 2016 (edited) · Report post Всем привет! Возник вопрос относительно auth avg query time(5m/1m): 1007/1000 ms Биллинг - Abills. Движок базы - InnoDB. Нормально ли это? Прикладываю график с самописного плагина для мунина, дергающего "show stat". Провал вниз - с выдернутым линком из сетевухи Edited January 7, 2016 by myth Share this post Link to post Share on other sites
NiTr0 Posted January 7, 2016 · Report post похоже что норма. у меня тоже около 1 сек. Share this post Link to post Share on other sites
kayot Posted January 7, 2016 · Report post Это что ж там за база и запросы у абиллса такие кривожуткие? У меня 1/0 ms показывает, на весьма нагруженном сервере. Share this post Link to post Share on other sites
NiTr0 Posted January 7, 2016 · Report post хз не заморачивался профайлингом, работает - и ладно. Share this post Link to post Share on other sites
banec Posted January 7, 2016 · Report post Вопрос как избежать падения сервиса когда радиус не доступен? А то если сервер с радиусом перезагрузить accel-pptp падает. Share this post Link to post Share on other sites
NiTr0 Posted January 8, 2016 · Report post Вопрос как избежать падения сервиса когда радиус не доступен? А то если сервер с радиусом перезагрузить accel-pptp падает. странно, у меня не падали. настройте coredump, сделайте трейсы... или вы имеете ввиду что пользователи с брасов осыпаются? так укажите acct-timeout=0 Share this post Link to post Share on other sites
banec Posted January 10, 2016 · Report post судя по мониту то сервис был жив, а сессии сбросились. acct-timeout стояло 120 - поставил 0 хотя может стоит поставить просто по больше время. Share this post Link to post Share on other sites
myth Posted January 11, 2016 (edited) · Report post Недавно появилась проблема - accel начинает активно потреблять cache. Мегабайт по 10 в 5 минут. С чем это может быть связано? Предположительно после arp флуда в сети Edited January 11, 2016 by myth Share this post Link to post Share on other sites
banec Posted January 11, 2016 · Report post а по kill -HUP пид - конфиг аккел перечитывает? чтоб не рестартовать. Share this post Link to post Share on other sites
kayot Posted January 11, 2016 · Report post banec А смысл? reload в консоли конфиг перечитывает без рестарта. Share this post Link to post Share on other sites
NiTr0 Posted January 11, 2016 · Report post Недавно появилась проблема - accel начинает активно потреблять cache. Мегабайт по 10 в 5 минут. С чем это может быть связано? Предположительно после arp флуда в сети точно accel-ppp виноват? т.к. cache - это кеш прочитанных файлов. Share this post Link to post Share on other sites
myth Posted January 11, 2016 · Report post Вроде как больше нечему - на этом сервере ничего кроме него и munin-node не стоит... Share this post Link to post Share on other sites
nuclearcat Posted January 11, 2016 · Report post munin-node возможно пробегает по списку интерфейсов? к примеру может быть какой-то race condition или знатный баг как у net-snmp, что ppp интерфейсы увеличивают ifindex с каждым новым интерфейсом, а в net-snmp память о старых не высвобождалась... Share this post Link to post Share on other sites