Перейти к содержимому
Калькуляторы

Опубликована Процедура блокировки некошерной инфо

Делаем ставки?

<ээх, и почему мелкому форумному троллю все делать самому приходится?>

 

А немного помешать/помочь этому процессу? Хотя бы для виду.

Нагнать, скажем, пару сотен голосов вот этому. Вдруг таки вынудят родное Министерство принять стандартизованную процедуру тестирования? Во избежании произвольного

толкования того, что и как заблокировано должно быть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

на мой взгляд, проблема не в произвольной процедуре тестирования и даже не в произвольном толковании способов блокировки

а в совершенно безответственном наполнении реестра блокировок

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Ну да, а что же тут систематически вопросы вида

В реестре есть 2 записи для ссылок в домене korenacim.com с 2-мя IP адресами. IP адреса из реестра блокируются (блокировка по IP)

Но естественно korenacim.com давно с этих IP мигрировал на другие, а прокуратура делает проверку сейчас и ссылки открываются.

 

Кто-нибудь сталкивался с подобным, отбивался от проверок со сменой IP блокированного сайта и неотражением этой смены в реестре ?

возникают?

 

А наполняют как раз ответственно(чем я очень недоволен). Ручной режим у нас в применении этого закона. Если бы делали дословно как в законе написано - было бы гораздо веселее.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Можно тут чуть подробнее ?

Например так, если пока нет необходимости разбирать отдельно аргументы:

 

my $last = "";
while (<>) {
 chomp;
 next if not /^http:\/\/([^\/]+)\/?([^#]*)/;
 my $host = $1;
 my $path = $2;

 $host =~ s/\s+$//g;
 $host = `idn $host` if not $host =~ /^\p{ASCII}+$/;
 $url = 'http://' . $host;
 next if $url eq $last;
 if ($path) {
   $path =~ s/([\x00-\x1f\x7f-\xff])/sprintf("%%%02X",ord($1))/eg;
   $path =~ s/ /+/g;
   $url .= '/' . $path;
 }
 print $url . "\n";
 $last = $url;
}

 

На вход приходит сортированный список после xsltpros … | sort | uniq

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Кстати, а много в реестре url-ов с '#'? Такое же нельзя заблокировать провайдером - соответствующий элемент url по сети просто не передается.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Sergey Gilfanov сейчас один, igetm.com

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

а много в реестре url-ов с '#'? Такое же нельзя заблокировать провайдером

отсекаещь лишнее (начиная с #) и блокируешь

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

на мой взгляд, проблема не в произвольной процедуре тестирования и даже не в произвольном толковании способов блокировки

а в совершенно безответственном наполнении реестра блокировок

ну так и должно казаться на первый взгляд, в этом вся соль

в реале тестируется лояльность пользователей

 

 

это отличная технология: на нужной странице подставное лицо делает пост или комментарий, и на "законных" основаниях ресурс блочится

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

в реале тестируется лояльность пользователей

а им, пользователям, всей этой кухни не видно

чего тут тестировать-то ?

 

кто, куда, кому и на каких основаниях будет жаловаться на блокировку-то ?

 

особено после "успешного тестирования отмазки типа технический сбой"

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Например так, если пока нет необходимости разбирать отдельно аргументы:

 

Это, как я понимаю, на перле ?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Notius

 

Похоже regexp не совсем верно отрабатывает. По крайней мере на вот таком URL.

talk.rcbazar.biz/index.php?/topic/164-омск-5note-работаемновый-прайс-ск-1г-1600р-акция/ переводится в

talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%81%D0%BA%D0%BE%D1%80%D0%BE-%D0%BE%D1%82%D0%BA%D1%80%D1%8B%D1%82%D0%B8%D0%B5%D0%BB%D0%B5%D0%B3%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%B0%D0%BD%D0%B0%D0%BB%D0%BE%D0%B3-%D0%BA%D0%BE%D0%BA%D0%B0/

но при запросе данного сайта в логах преобразование выглядит так:

[11/Oct/2013:10:14:38 +0600] "talk.rcbazar.biz" "GET /public/style_images/concise/js/ipbforumskins.js HTTP/1.1" 304 0 "http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/"

 

Тут не сложно уловить разницу.

После "5note-" regexp выдаёт "%D1%81", а в адресной строке "%D1%80"

Хотя большинство других URL преобразованы правильно.

Изменено пользователем Egenius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Похоже regexp не совсем верно отрабатывает.

Вы куда-то не туда посмотрели. В выгрузке «скоро-открытиелегальный». Вот вам для декодирования:

perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'

большинство других URL преобразованы правильно

Большинство — значит не все. Можно примеры неправильных?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Notius

Вы куда-то не туда посмотрели. В выгрузке «скоро-открытиелегальный». Вот вам для декодирования:

Взято из сегодняшнего ночного дампа.

"http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-скоро-открытиелегальный-аналог-кока/"

Вот перевод данного URL Вашим скриптом, данным выше

# /usr/bin/xsltproc /gost-ssl/rzs/reg-url.xslt /gost-ssl/rzs/dump/dump.xml | sort | uniq | /gost-ssl/rzs/regexp.pl | grep talk.rcbazar.biz
http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%81%D0%BA%D0%BE%D1%80%D0%BE-%D0%BE%D1%82%D0%BA%D1%80%D1%8B%D1%82%D0%B8%D0%B5%D0%BB%D0%B5%D0%B3%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B9-%D0%B0%D0%BD%D0%B0%D0%BB%D0%BE%D0%B3-%D0%BA%D0%BE%D0%BA%D0%B0/

 

Обратное декодирование:

# /usr/bin/xsltproc /gost-ssl/rzs/reg-url.xslt /gost-ssl/rzs/dump/dump.xml | sort | uniq | /gost-ssl/rzs/regexp.pl | grep talk.rcbazar.biz | perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'
http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-скоро-открытиелегальный-аналог-кока/

 

Но, при копировании данного URL из хрома получаю:

http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/

 

Декодирование URL из хрома выявило в чём причина.

# echo "http://talk.rcbazar.biz/index.php?/topic/164-%D0%BE%D0%BC%D1%81%D0%BA-5note-%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0%D0%B5%D0%BC%D0%BD%D0%BE%D0%B2%D1%8B%D0%B9-%D0%BF%D1%80%D0%B0%D0%B9%D1%81-%D1%81%D0%BA-1%D0%B3-1600%D1%80-%D0%B0%D0%BA%D1%86%D0%B8%D1%8F/" |  perl -pe 's/%([0-9A-Fa-f]{2})/chr(hex($1))/eg'
http://talk.rcbazar.biz/index.php?/topic/164-омск-5note-работаемновый-прайс-ск-1г-1600р-акция/

 

Реврайт поставили. (

 

Большинство — значит не все. Можно примеры неправильных?

Извиняюсь. Остальные переведены верно.

Изменено пользователем Egenius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Реврайт поставили. (

С этим разобрались. :)

 

Но вы меня заставили удивиться, откуда там юникод, если в реестре запись 46774 в cp1251. Примените в xslt выше патчик, пожалуйста:

3c3
<   <xsl:output method="text"/>
---
>   <xsl:output method="text" encoding="windows-1251"/>

 

ЗЫ. Таким образом мы избежим двойного перекодирования строк, которые в реестре уже в юникоде. Как, например записи 31865 или 33227.

Изменено пользователем Notius

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

cp1251

Просто удивительно, что еще никто им туда не накидал URL-ов из японского интернета с иероглифами внутри.

Я так думаю, найти что-нибудь подходящее будет несложно.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Просто удивительно, что еще никто им туда не накидал URL-ов из японского интернета с иероглифами внутри.

И лучше не на картинки, а на порнографические тексты. С комментарием: «Вы только почитайте это! А если бы увидел мой ребенок?!». Интересно было бы почитать ответ и акт экспертизы.

 

А вообще у них там полно юникодных символов, да, в файле с шапкой encoding="windows-1251". Так что, думаю, впихнут то, что показал браузер, а мы спокойно отискейпим.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Но вы меня заставили удивиться, откуда там юникод, если в реестре запись 46774 в cp1251. Примените в xslt выше патчик, пожалуйста:

Брал исходный dump.xml и Ваш скрипт. Ничего не перекодировал.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

С размахом работают парни :)

Пришло письмо только что:

Направляется уведомление о внесении в «Единый реестр доменных имен, указателей страниц

сайтов в сети «Интернет» и сетевых адресов, позволяющих идентифицировать сайты в сети

«Интернет», содержащие информацию, распространение которой в Российской Федерации

запрещено» следующего(их) указателя (указателей) страницы (страниц) сайта в сети

"Интернет": http://www.celuu.ru/lovestory/10214.html.

Достоверно известно что адрес этот прошел по линии ЛБИ, потому что эти клоуны писали нам неделю назад:

На ресурсе http://www.celuu.ru/lovestory/10214.html, IP-адрес 188.130.180.22,

обнаружена информация о способах, совершения самоубийства либо призывы к совершению

самоубийства, распространение которой в сети Интернет запрещено в соответствии с

Федеральным законом от 27.07.2006 N149-ФЗ "Об информации, информационных технологиях и о

защите информации".

Просим Вас, рассмотреть факт наличия указанной информации и принять решение по её

блокированию.

в пень послать не удалось потому что с адреса no-reply@ligainternet.ru

 

Успейте оценить размах описанного способа суицида пока мы не побанили страничку :)

Всем пис.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Уже забанили. Вот копия: http://ficbook.net/printfic/392270/1455777

Жесточайшая пропаганда суицида, ога...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

...

Жесточайшая пропаганда суицида, ога...

А ролик в ссылке, который на ютьюбе лежит, и вдохновил автора, это же видео урок просто...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

...

Жесточайшая пропаганда суицида, ога...

А ролик в ссылке, который на ютьюбе лежит, и вдохновил автора, это же видео урок просто...

Что за ролик???

Пости ссылку смело, у нас в Тексас Стэйт эти ваши российские законы слабо исполняют, я смогу посмотреть ;-)

 

Кстати, для демографии России более актуально:

- тоже практически суицид, практически открытым текстом

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Что за ролик???

Сайт перестал открываться (ficbook, заблокировали по ip?), на той же странице в начале автор пишет, что на создание сего произведения, ее вдохновил ролик и ссылка.

Или просто поиск по youtube на странице, сразу на ссылку должен попасть.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nnm-club.me затеялись менять свой ip постянно.

 

Роскомнадзор звонит и угрожает составлением актов.

 

в три ночи список отработался, ip отресолвился, в 9 утра надзорщики мне звонят и угрожают актами и штрафами...

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

nnm-club.me затеялись менять свой ip постянно.

 

Роскомнадзор звонит и угрожает составлением актов.

 

в три ночи список отработался, ip отресолвился, в 9 утра надзорщики мне звонят и угрожают актами и штрафами...

Ага, у нас тоже самое. А как они проверяют то ? У меня вот они наши клиенты )

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Гость
Ответить в тему...

×   Вставлено в виде отформатированного текста.   Вставить в виде обычного текста

  Разрешено не более 75 смайлов.

×   Ваша ссылка была автоматически встроена.   Отобразить как ссылку

×   Ваш предыдущий контент был восстановлен.   Очистить редактор

×   Вы не можете вставить изображения напрямую. Загрузите или вставьте изображения по ссылке.