Перейти к содержимому
Калькуляторы

Опубликована Процедура блокировки некошерной инфо

Делаем ставки?

<ээх, и почему мелкому форумному троллю все делать самому приходится?>

 

А немного помешать/помочь этому процессу? Хотя бы для виду.

Нагнать, скажем, пару сотен голосов вот этому. Вдруг таки вынудят родное Министерство принять стандартизованную процедуру тестирования? Во избежании произвольного

толкования того, что и как заблокировано должно быть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

на мой взгляд, проблема не в произвольной процедуре тестирования и даже не в произвольном толковании способов блокировки

а в совершенно безответственном наполнении реестра блокировок

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну да, а что же тут систематически вопросы вида

В реестре есть 2 записи для ссылок в домене korenacim.com с 2-мя IP адресами. IP адреса из реестра блокируются (блокировка по IP)

Но естественно korenacim.com давно с этих IP мигрировал на другие, а прокуратура делает проверку сейчас и ссылки открываются.

 

Кто-нибудь сталкивался с подобным, отбивался от проверок со сменой IP блокированного сайта и неотражением этой смены в реестре ?

возникают?

 

А наполняют как раз ответственно(чем я очень недоволен). Ручной режим у нас в применении этого закона. Если бы делали дословно как в законе написано - было бы гораздо веселее.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Можно тут чуть подробнее ?

Например так, если пока нет необходимости разбирать отдельно аргументы:

 

my $last = "";
while (<>) {
 chomp;
 next if not /^http:\/\/([^\/]+)\/?([^#]*)/;
 my $host = $1;
 my $path = $2;

 $host =~ s/\s+$//g;
 $host = `idn $host` if not $host =~ /^\p{ASCII}+$/;
 $url = 'http://' . $host;
 next if $url eq $last;
 if ($path) {
   $path =~ s/([\x00-\x1f\x7f-\xff])/sprintf("%%%02X",ord($1))/eg;
   $path =~ s/ /+/g;
   $url .= '/' . $path;
 }
 print $url . "\n";
 $last = $url;
}

 

На вход приходит сортированный список после xsltpros … | sort | uniq

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати, а много в реестре url-ов с '#'? Такое же нельзя заблокировать провайдером - соответствующий элемент url по сети просто не передается.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

а много в реестре url-ов с '#'? Такое же нельзя заблокировать провайдером

отсекаещь лишнее (начиная с #) и блокируешь

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

на мой взгляд, проблема не в произвольной процедуре тестирования и даже не в произвольном толковании способов блокировки

а в совершенно безответственном наполнении реестра блокировок

ну так и должно казаться на первый взгляд, в этом вся соль

в реале тестируется лояльность пользователей

 

 

это отличная технология: на нужной странице подставное лицо делает пост или комментарий, и на "законных" основаниях ресурс блочится

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

в реале тестируется лояльность пользователей

а им, пользователям, всей этой кухни не видно

чего тут тестировать-то ?

 

кто, куда, кому и на каких основаниях будет жаловаться на блокировку-то ?

 

особено после "успешного тестирования отмазки типа технический сбой"

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Например так, если пока нет необходимости разбирать отдельно аргументы:

 

Это, как я понимаю, на перле ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Notius

 

Похоже regexp не совсем верно отрабатывает. По крайней мере на вот таком URL.

talk.rcbazar.biz/index.php?/topic/164-омск-5note-работаемновый-прайс-ск-1г-1600р-акция/ переводится в

talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%81%D0%BA%D0%BE%D1%80%D0%BE-%D0%BE%D1%82%D0%BA%D1%80%D1%8B%D1%82%D0%B8%D0%B5%D0%BB%D0%B5%D0%B3%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%B0%D0%BD%D0%B0%D0%BB%D0%BE%D0%B3-%D0%BA%D0%BE%D0%BA%D0%B0/

но при запросе данного сайта в логах преобразование выглядит так:

[11/Oct/2013:10:14:38 +0600] "talk.rcbazar.biz" "GET /public/style_images/concise/js/ipbforumskins.js HTTP/1.1" 304 0 "http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/"

 

Тут не сложно уловить разницу.

После "5note-" regexp выдаёт "%D1%81", а в адресной строке "%D1%80"

Хотя большинство других URL преобразованы правильно.

Изменено пользователем Egenius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже regexp не совсем верно отрабатывает.

Вы куда-то не туда посмотрели. В выгрузке «скоро-открытиелегальный». Вот вам для декодирования:

perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'

большинство других URL преобразованы правильно

Большинство — значит не все. Можно примеры неправильных?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Notius

Вы куда-то не туда посмотрели. В выгрузке «скоро-открытиелегальный». Вот вам для декодирования:

Взято из сегодняшнего ночного дампа.

"http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-скоро-открытиелегальный-аналог-кока/"

Вот перевод данного URL Вашим скриптом, данным выше

# /usr/bin/xsltproc /gost-ssl/rzs/reg-url.xslt /gost-ssl/rzs/dump/dump.xml | sort | uniq | /gost-ssl/rzs/regexp.pl | grep talk.rcbazar.biz
http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%81%D0%BA%D0%BE%D1%80%D0%BE-%D0%BE%D1%82%D0%BA%D1%80%D1%8B%D1%82%D0%B8%D0%B5%D0%BB%D0%B5%D0%B3%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%B0%D0%BD%D0%B0%D0%BB%D0%BE%D0%B3-%D0%BA%D0%BE%D0%BA%D0%B0/

 

Обратное декодирование:

# /usr/bin/xsltproc /gost-ssl/rzs/reg-url.xslt /gost-ssl/rzs/dump/dump.xml | sort | uniq | /gost-ssl/rzs/regexp.pl | grep talk.rcbazar.biz | perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'
http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-скоро-открытиелегальный-аналог-кока/

 

Но, при копировании данного URL из хрома получаю:

http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/

 

Декодирование URL из хрома выявило в чём причина.

# echo "http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/" |  perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'
http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-работаемновый-прайс-ск-1г-1600р-акция/

 

Реврайт поставили. (

 

Большинство — значит не все. Можно примеры неправильных?

Извиняюсь. Остальные переведены верно.

Изменено пользователем Egenius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Реврайт поставили. (

С этим разобрались. :)

 

Но вы меня заставили удивиться, откуда там юникод, если в реестре запись 46774 в cp1251. Примените в xslt выше патчик, пожалуйста:

3c3
<   <xsl:output method="text"/>
---
>   <xsl:output method="text" encoding="windows-1251"/>

 

ЗЫ. Таким образом мы избежим двойного перекодирования строк, которые в реестре уже в юникоде. Как, например записи 31865 или 33227.

Изменено пользователем Notius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

cp1251

Просто удивительно, что еще никто им туда не накидал URL-ов из японского интернета с иероглифами внутри.

Я так думаю, найти что-нибудь подходящее будет несложно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Просто удивительно, что еще никто им туда не накидал URL-ов из японского интернета с иероглифами внутри.

И лучше не на картинки, а на порнографические тексты. С комментарием: «Вы только почитайте это! А если бы увидел мой ребенок?!». Интересно было бы почитать ответ и акт экспертизы.

 

А вообще у них там полно юникодных символов, да, в файле с шапкой encoding="windows-1251". Так что, думаю, впихнут то, что показал браузер, а мы спокойно отискейпим.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Но вы меня заставили удивиться, откуда там юникод, если в реестре запись 46774 в cp1251. Примените в xslt выше патчик, пожалуйста:

Брал исходный dump.xml и Ваш скрипт. Ничего не перекодировал.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

С размахом работают парни :)

Пришло письмо только что:

Направляется уведомление о внесении в «Единый реестр доменных имен, указателей страниц

сайтов в сети «Интернет» и сетевых адресов, позволяющих идентифицировать сайты в сети

«Интернет», содержащие информацию, распространение которой в Российской Федерации

запрещено» следующего(их) указателя (указателей) страницы (страниц) сайта в сети

"Интернет": http://www.celuu.ru/lovestory/10214.html.

Достоверно известно что адрес этот прошел по линии ЛБИ, потому что эти клоуны писали нам неделю назад:

На ресурсе http://www.celuu.ru/lovestory/10214.html, IP-адрес 188.130.180.22,

обнаружена информация о способах, совершения самоубийства либо призывы к совершению

самоубийства, распространение которой в сети Интернет запрещено в соответствии с

Федеральным законом от 27.07.2006 N149-ФЗ "Об информации, информационных технологиях и о

защите информации".

Просим Вас, рассмотреть факт наличия указанной информации и принять решение по её

блокированию.

в пень послать не удалось потому что с адреса no-reply@ligainternet.ru

 

Успейте оценить размах описанного способа суицида пока мы не побанили страничку :)

Всем пис.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

...

Жесточайшая пропаганда суицида, ога...

А ролик в ссылке, который на ютьюбе лежит, и вдохновил автора, это же видео урок просто...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

...

Жесточайшая пропаганда суицида, ога...

А ролик в ссылке, который на ютьюбе лежит, и вдохновил автора, это же видео урок просто...

Что за ролик???

Пости ссылку смело, у нас в Тексас Стэйт эти ваши российские законы слабо исполняют, я смогу посмотреть ;-)

 

Кстати, для демографии России более актуально:

- тоже практически суицид, практически открытым текстом

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что за ролик???

Сайт перестал открываться (ficbook, заблокировали по ip?), на той же странице в начале автор пишет, что на создание сего произведения, ее вдохновил ролик и ссылка.

Или просто поиск по youtube на странице, сразу на ссылку должен попасть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nnm-club.me затеялись менять свой ip постянно.

 

Роскомнадзор звонит и угрожает составлением актов.

 

в три ночи список отработался, ip отресолвился, в 9 утра надзорщики мне звонят и угрожают актами и штрафами...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nnm-club.me затеялись менять свой ip постянно.

 

Роскомнадзор звонит и угрожает составлением актов.

 

в три ночи список отработался, ip отресолвился, в 9 утра надзорщики мне звонят и угрожают актами и штрафами...

Ага, у нас тоже самое. А как они проверяют то ? У меня вот они наши клиенты )

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас