Пишу билинг

Forst

Опубликовано 28 сентября, 2006 · Жалоба

Всем бАльшое здрасте!

Пишу небольшой билинг. Собирает статистику по NetFlow.

Вобщем с напарником возникли разногласия.

Как хранить детальную статистику.

Вобщем моя идея вот такая:

В течении дня коллектор будет всё собирать в текстовые файлы.

Раз в несколько минут сохранять.

Паралельно общие данные будет заносить в БД (для оперативного доступа к ним).

В начале следующего дня небольшая програмка будет обрабатывать накопленные за прошлый день файлы и пихать всё в бинарник.

Раз в неделю/месяц(в начале) бинарники(за прошлый месяц/неделю) будут архивироваться.

Вобщем человеку через веб будет доступна только общая статистика.

Если надо детально то по запросу, будет предоставляться распечатка из архивов.

У напарника идея проще: пихать всё в БД.

Чегось посоветуете?

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

EvilShadow

Опубликовано 28 сентября, 2006 · Жалоба

Все пихать в базу? Интересно, долго она протянет при таком подходе и какова будет скорость работы через Ндцать дней? :)

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Kuzin Andrey

Опубликовано 28 сентября, 2006 (изменено) · Жалоба

Вы разрабатываете Open Source или в закрытом виде ?!

У меня достаточно большой опыт создания биллинга для собственного пользования (уже более 3 лет). Хотел с нуля написать улучшенную версию распеределенной биллинговой системы и выложить в опенсорс, даже для этого домен имеется http://www.openbilling.ru , но сил не хватает одному такую систему создать. Если хотите, присоединяйтесь...

А теперь по вопросу... В своем биллинге я обрабатываю пакеты через libipq и заголовок каждого пакета записываю в файл. Помоему (стал забывать) каждая запись занимает 24 байта (заголовок и дата/время), таким образом записывается информация обо всех пакетах. При трафике в 300 гиг всего файлы занимают около 15 гиг, в сжатом виде около 3-4 гигов (для современных хардов это копейки у меня 100 гигов занимает информация за полгода, вполне достаточно если вдруг спорные вопросы возникнут).

Думаю для NetFlow также можно записывать в бинарном виде все приходящие посылки. А обрабатывать и считать надо в realtime. Смысла пихать это все в базу данных нет никакого. Надо считать сразу, потому что это процесс достаточно трудоемкий, и раз в сутки его делать достаточно накладно, можно уменьшить отклик системы и потерю новых данных.

Изменено 28 сентября, 2006 пользователем Kuzin Andrey

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

nikitich87

Опубликовано 28 сентября, 2006 · Жалоба

пихать всё в отдельную базу и через день\неделю\месяц\год выгребать все в файл-архив с очисткой БД.

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

hcube

Опубликовано 28 сентября, 2006 (изменено) · Жалоба

Вообще говоря, современные БД очень быстро считают с включенными индексами. Конкретно у меня приемлемая скорость работы достигалась при агрегации по IP пользователя, IP сайта и подневной сборке статистики - т.е. за день можно для конкретного IP посмотреть статистику посещений по обьему. На базе порядка 2000 адресов выборку делало за единицы секунд. Вероятно будет вполне нормально пахать и при почасовой сборке. А детальную - кто, куда, с кем, вплоть до пакетов - можно кидать в файл.

Изменено 28 сентября, 2006 пользователем hcube

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

balamutang

Опубликовано 28 сентября, 2006 · Жалоба

flow-tools рулят. читайте маны и будет вам щастье.

flow-capture складывает в бинарники раз в пять минут. по еще тепленькому бинарнику обсчитывать трафик и посчитанный складывать в SQL-базу: "дата, юзер, послал, принял". бинарники хранишь полгода для детализации (вдруг чо :)). по SQL-базе считаешь траф и отдаешь юзверям статистику. фсе

пихать все в БД - глупо. у вас трафик с БД будет больше чем тот который считаете по нетфлоу.

Войти

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Поделиться сообщением

Ссылка на сообщение

Поделиться на других сайтах

Join the conversation