Jump to content

Recommended Posts

Posted

Подходящей темы не нашел, видать не верные вопросы задаю поисковику (ткните носом, если есть такая тема).

Вопрос в следующем:

Есть ли верное, и оригинальное решение, как из доменов и URL, которые имеются в выгрузке, сгенерировать список для Cisco SCE?

Т.е. чтобы получалось следующее:

*domain.com

*domain.com/?url

 

Я делаю примерно так:

mysql -e "SELECT domain FROM domain" | sed -e 's/^www.//' | sed -e 's/^/*/' > sce_zapret_all.csv
mysql -e "SELECT url FROM url" | sed -e 's/[^/]*\/\/\([^@]*@\)\?\([^:/]*\).*/\2/' | sed -e 's/^www.//' | sed -e 's/^/*/' >> sce_zapret_all.csv

 

но тут есть пару проблем:

1. idn домены. Т.е. домен президент.рф Cisco не понимает. Нужно переводить idn в punycode

2. Не так давно, после всех этих sed'ов, в списке появилась просто "*", и как результат Cisco начала блокировать ВСЁ.

 

Все это я обошел топорным способом:

cat sce_zapret_all.csv | grep -v "рф" | grep -vx '^\*$' | uniq > sce_zapret.csv

 

Как реализовать генерацию списка для SCE, более правильно?

  • Replies 158
  • Created
  • Last Reply

Top Posters In This Topic

Top Posters In This Topic

Posted Images

Posted

Более правильная реализация не с точки зрения законов, а с точки зрения РКН - это если вы напишите скрипт который будет сам список проверять т.е. и резолв делать и всё прочее и проверять редиректы и только потом всё это передавать на SCE.

Posted

Почти год назад тоже озаботился данным вопросом. Потом забил ... так и не нашёл способа нормализовать url для SCE2000. Кстати, там есть ограничение на длину строки url, а при переводе в idn и обработке "русских" ссылок, получается больше этого ограничения. Получается, что на 100% выполнить требования РКН на SCE нельзя. Да и вообще, говорят, скоро заставят всех отечественное оборудование для этих целей покупать.

 

Но я всёравно присоединяюсь к вопросу.

Posted

не с точки зрения законов, а с точки зрения РКН

В данный момент, меня это не сильно интересует.

Меня интересует, привести домены и URL из выгрузки, к удобоваримому виду для SCE

Posted

Кстати, там есть ограничение на длину строки url, а при переводе в idn и обработке "русских" ссылок, получается больше этого ограничения.

Ну это не большая проблема, в качестве исключения можно ограничивать полностью домен а не URL.

Либо делать проверку на длину, и если больше, то обрезать до домена.

Posted

Кстати, там есть ограничение на длину строки url, а при переводе в idn и обработке "русских" ссылок, получается больше этого ограничения.

Ну это не большая проблема, в качестве исключения можно ограничивать полностью домен а не URL.

Либо делать проверку на длину, и если больше, то обрезать до домена.

 

Интересно, а можно ли обрезать по длине и в конец звёздочку впендюрить ? Будет так работать ?

Posted

Да и вообще, говорят, скоро заставят всех отечественное оборудование для этих целей покупать.

А HTTPS это оборудование будет блокировать?

 

Оффтоп:

 

 

Сейчас, это проблема, и при желании могут придраться "Почему вы не блокируете https://super-torrent.net.ru?" И некому не докажешь, что шифрованный трафик оборудование не блокирует... Хотя если и "отечественное" оборудование не будет блокировать https, то тут хоть можно будет себя обезопасить, типа "Ваше оборудование, сертифицированное для этих целей, не блокирует. Поэтому все вопросы к производителю".

 

Posted

Интересно, а можно ли обрезать по длине и в конец звёздочку впендюрить ? Будет так работать ?

Насколько я понимаю по доке, то можно так *domain.com/media* , т.е. будут блокироваться все URL для домена domain.com попадающие под маску /media*

http://www.cisco.com/c/en/us/td/docs/cable/serv_exch/serv_control/broadband_app/rel37x/blacklist/URL_DB_QSG2.html#wp41497

Posted

Да и вообще, говорят, скоро заставят всех отечественное оборудование для этих целей покупать.

А HTTPS это оборудование будет блокировать?

 

Оффтоп:

 

 

Сейчас, это проблема, и при желании могут придраться "Почему вы не блокируете https://super-torrent.net.ru?" И некому не докажешь, что шифрованный трафик оборудование не блокирует... Хотя если и "отечественное" оборудование не будет блокировать https, то тут хоть можно будет себя обезопасить, типа "Ваше оборудование, сертифицированное для этих целей, не блокирует. Поэтому все вопросы к производителю".

 

 

Рекомендации РКН вроде бы были такие: если не можете блокировать https, то блокируйте весь ойпи и порт 443, чтои было незамедлительно сделано :-).

Posted

то блокируйте весь ойпи и порт 443

Тогда весь yuotube был бы заблокирован, а это не вариант, клиенты "съедят"

 

Пока ни разу не съели. Так же ещё ни разу (когда проверял) ссылки на йутуп из запретинфо не вела на указанный там ойпи, всегда в какое-то то ли гугл-кеш, то ли какой-то другой йутуп.

Posted

Так же ещё ни разу (когда проверял) ссылки на йутуп из запретинфо не вела на указанный там ойпи, всегда в какое-то то ли гугл-кеш, то ли какой-то другой йутуп.

Дело в том, что у youtube очень много IP адресов, и когда ты блокируешь один его IP, то ссылка просто начинает открываться с другого IP. А если заблокировать все IP, то съедят, т.к. yuotube не будет открываться вообще, только через всякие VPN и прокси.

=youtube&commit=Search"]Пруф, по поводу того, что у youtube очень много IP, не одна тысяча IPv4 и столько же IPv6, плюс автономки

Posted

Так же ещё ни разу (когда проверял) ссылки на йутуп из запретинфо не вела на указанный там ойпи, всегда в какое-то то ли гугл-кеш, то ли какой-то другой йутуп.

Дело в том, что у youtube очень много IP адресов, и когда ты блокируешь один его IP, то ссылка просто начинает открываться с другого IP. А если заблокировать все IP, то съедят, т.к. yuotube не будет открываться вообще, только через всякие VPN и прокси.

=youtube&commit=Search"]Пруф, по поводу того, что у youtube очень много IP, не одна тысяча IPv4 и столько же IPv6, плюс автономки

эм ? а как ютуб узнает, что его залочили ? )) бгг

 

Я всего из 2 пулов айпи адреса наблюдал, в которые с оператора х резолвится домен ютуб.

Posted (edited)

эм ? а как ютуб узнает, что его залочили ? )) бгг

Он не знает что его залочили.

 

Чисто по моим наблюдениям, происходит примерно так: запрос на yuotube.com, резолвится адрес 64.15.125.123, который заблокирован, соответственно страница не открывается. Обновляешь страницу, и уже резовится адрес 208.117.255.123, который не заблокирован, и youtube.com открывается. Наблюдал лично на своем компьютере.

 

По какому принципу резолвятся разные IP, я не копал. Думаю Round robin, и AS...

Так же не стоит забывать про ДНС кеш, если в кеше сидит адрес 64.15.125.123, то после сброса кеша, вполне может зарезолвится и попасть в кеш другой адрес. И не ясно, какие адреса сидят в кеше у клиентов, поэтому блокировке нескольких IP youtube, они попросту не замечают.

Edited by KsenZ
Posted

;; QUESTION SECTION:

;youtube.com. IN A

 

;; ANSWER SECTION:

youtube.com. 97 IN A 173.194.44.78

youtube.com. 97 IN A 173.194.44.70

youtube.com. 97 IN A 173.194.44.67

youtube.com. 97 IN A 173.194.44.65

youtube.com. 97 IN A 173.194.44.73

youtube.com. 97 IN A 173.194.44.66

youtube.com. 97 IN A 173.194.44.64

youtube.com. 97 IN A 173.194.44.71

youtube.com. 97 IN A 173.194.44.69

youtube.com. 97 IN A 173.194.44.68

youtube.com. 97 IN A 173.194.44.72

 

обычный ответ на youtube.

 

В виндоднскэше лежит не один адрес.

 

Имя записи. . . . . . : clients.l.google.com

Тип записи. . . . . . : 1

Срок жизни. . . . . . : 41

Длина данных. . . . . : 4

Раздел. . . . . . . . : Ответ

А-запись (узла) . . . : 173.194.44.66

 

 

Имя записи. . . . . . : clients.l.google.com

Тип записи. . . . . . : 1

Срок жизни. . . . . . : 41

Длина данных. . . . . : 4

Раздел. . . . . . . . : Ответ

А-запись (узла) . . . : 173.194.44.70

 

 

Имя записи. . . . . . : clients.l.google.com

Тип записи. . . . . . : 1

Срок жизни. . . . . . : 41

Длина данных. . . . . : 4

Раздел. . . . . . . . : Ответ

А-запись (узла) . . . : 173.194.44.68

 

 

Имя записи. . . . . . : clients.l.google.com

Тип записи. . . . . . : 1

Срок жизни. . . . . . : 41

Длина данных. . . . . : 4

Раздел. . . . . . . . : Ответ

А-запись (узла) . . . : 173.194.44.71

 

Не пишите тогда ерунды :-)

Posted (edited)

zhenya`

а в чем заключается ерунда?

 

У меня, к примеру, резолвятся совершенно другие IP. На соседнем компьютере третьи. В чем ерунда то?

 

Речь идет о блокировке, и если блокировать только адреса которые есть в выгрузке, то youtube как открывался, так и будет открываться.

 

P.S. если вы про адреса, которые я написал выше, 64.15.125.123 и 208.117.255.123, то я взял их наугад, если так можно выразиться.

Edited by KsenZ
Posted

Да какая разница, что там открывается или нет и куда резовится ? Главное, чтобы проверялки РКН делали отчёт со статусом "ок". Но "ок" всёравно никогда не будет, хотя бы потому, что операторы блокируют по xml документу, который они получают самостоятельно, а провреялки проверяют по какому-то другому документу, который 100% будет получен в иное время и скорее всего будет отличаться.

 

И вообще, мы отвлеклись от темы :-). Как нормализовать url ?

Posted

Как сказал один из сотрудников если у вас установлен программный ревизор вас не привлекут к ответственности т.к. он не сертифицированный. А если у вас аппаратное решение, то уже были случай привлечения оператора.

Posted

Как сказал один из сотрудников если у вас установлен программный ревизор вас не привлекут к ответственности т.к. он не сертифицированный. А если у вас аппаратное решение, то уже были случай привлечения оператора.

 

Уже ж всем эти тп-линки перепрошитые поставили... не суть.

 

Почему это не работает?

 

#!/usr/bin/perl

use strict;
use warnings;

use Net::IDN::Encode ':all';
use URL::Encode ':all';


my $U = 'http://сптр-в-орске.рф/доставка-алкоголя-503752.htm';
#my $U = 'http://yandex.ru/доставка-алкоголя-503752.htm';

$U =~ /http\:\/\/(.+)\/(.+)$/;

print "$1\n";
print "$2\n\n";

my $domain      = domain_to_ascii($1);
my $url         = url_encode_utf8($2);

print "$domain\n";
print "$url\n";

 

Выдаёт:

 

сптр-в-орске.рф
доставка-алкоголя-503752.htm

disallowed character U+0081 at /usr/local/lib/perl/5.14.2/Net/IDN/Encode.pm line 46.

 

Я уже пару часов ищу рабочий пуникодер на перле ...

Posted

Подходящей темы не нашел, видать не верные вопросы задаю поисковику (ткните носом, если есть такая тема).

Вопрос в следующем:

Есть ли верное, и оригинальное решение, как из доменов и URL, которые имеются в выгрузке, сгенерировать список для Cisco SCE?

Т.е. чтобы получалось следующее:

*domain.com

*domain.com/?url

 

Я делаю примерно так:

mysql -e "SELECT domain FROM domain" | sed -e 's/^www.//' | sed -e 's/^/*/' > sce_zapret_all.csv
mysql -e "SELECT url FROM url" | sed -e 's/[^/]*\/\/\([^@]*@\)\?\([^:/]*\).*/\2/' | sed -e 's/^www.//' | sed -e 's/^/*/' >> sce_zapret_all.csv

 

но тут есть пару проблем:

1. idn домены. Т.е. домен президент.рф Cisco не понимает. Нужно переводить idn в punycode

2. Не так давно, после всех этих sed'ов, в списке появилась просто "*", и как результат Cisco начала блокировать ВСЁ.

 

Все это я обошел топорным способом:

cat sce_zapret_all.csv | grep -v "рф" | grep -vx '^\*$' | uniq > sce_zapret.csv

 

Как реализовать генерацию списка для SCE, более правильно?

 

Скажите, вы уверены, что если в SCE загрузить ссылку вида "http://xn-----elcnyxdiedhf.xn--p1ai/%D0%B4%D0%BE%D1%81%D1%82%D0%B0%D0%B2%D0%BA%D0%B0-%D0%B0%D0%BB%D0%BA%D0%BE%D0%B3%D0%BE%D0%BB%D1%8F-503752.htm" (это http://сптр-в-орске.рф/доставка-алкоголя-503752.htm), то она заблокируется ?

 

Т.е. вы это проверяли ?

 

А то может я зря мучаюсь ?:-).

Posted

Скажите, вы уверены, что если в SCE загрузить ссылку вида

 

Да, блокируется.

 

У меня на sce блокируется

И как вы генерируете список для SCE?

Posted

Скажите, вы уверены, что если в SCE загрузить ссылку вида

 

Да, блокируется.

 

У меня на sce блокируется

И как вы генерируете список для SCE?

 

Мне осталось забороть ошибку "disallowed character U+0081 at /usr/local/lib/perl/5.14.2/Net/IDN/Encode.pm line 46.

" (см. выше) и скорее всего будет всё работать.

 

Помогите, кто в перле шарит ?

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Create New...
На сайте используются файлы cookie и сервисы аналитики для корректной работы форума и улучшения качества обслуживания. Продолжая использовать сайт, вы соглашаетесь с использованием файлов cookie и с Политикой конфиденциальности.