Раньше    31.10     01.11     02.11     03.11     07.11     08.11     09.11     10.11     11.11     14.11     Позже

Неизвестный спрашивает: «Как на практике СМИ будут следить, чтобы в тексты не просочилось ни одного из пяти миллионов слов и сочетаний, запрещенных Роскомнадзором?»

Вопрос интересный.

Подразумевается, что СМИ (речь идет о владельцах лицензии) должны снимать с публикаций материалы, которые противоречат требованиям этой самой лицензии. Понятное дело, что к примеру Лента.ру «известное русское слово из трех букв» в свои авторские публикации не пропустит. А вот в комментариях наличие такого слова весьма вероятно. Я, конечно, упрощаю, так как методы технической защиты на сайтах СМИ достаточно эффективно «фильтруют базар» в виде бытового мата. Но, со словосочетаниями дело обстоит сложнее. Особенно если это оскорбление, выраженное не в крепких выражениях или всякие призывы и прочее.

Мне кажется, что коли Роскомнадзор получит систему отслеживания всяких нежелательных для лицензиата словосочетаний, то онлайн СМИ смогут существенно сэкономить. Можно уволить персонал, который отслеживает комментарии в форумах и ждать сигнала от надзирающего органа о наличии плохого контента. Регламент позволяет особо не спешить и исполнять предписание.
Технологически вполне возможно и даже не кажется сверхсложным. Поисковые технологии позволяют индексировать содержимое сайтов и показывать пользователю максимально релевантный ответ на запрос. Скорее всего, поиск будет идти по базе адресов сайтов СМИ с проверкой наличия этих самых 5 млн слов. Далее сортировка по максимальному количеству таких слов, ручная проверка, и уведомление о наличии на сайте нежелательной или противозаконной информации.

Те СМИ, которые не реагируют на запросы и не удаляют вредный контент — могут быть закрыты в судебном порядке. Думаю, что как механизм самоочищения — это было бы полезно не только для СМИ, но и для всего Интернет пространства.

Однако, нужно быть очень осторожным в применении этого инструмента. Количество слов 5 млн представляется слишком уж большим и, скорее всего, включает в себя максимальны уровень «нежелательных» слов, а, значит, будет много ложных детектов и большая трудоемкость по ручной обработке и как следствие — ошибки.

Ключевой элемент системы — словарь, думаю, что должен пройти дополнительное согласование и экспертное утверждение, так же должен быть определен порядок добавления в него новых слов.

Да, и еще проблема — как быть со словами, которые используются не для оскорбления, а для создания определенного образа, например в художественных произведениях. Наверно придется делать список исключений.
А СМИ и не надо ни за чем следить — специально ведь для этого программу и написали.

По смыслу для СМИ это ничем не отличается от того, что есть сейчас - есть закон и надо его соблюдать, независимо от того, следит за тобой кто-то или нет. С вашего позволения, я проведу реальный эксперимент прямо на Веббии — «кокаин», «бомба», «фашисты». Мы сейчас с вами ничего не нарушили, но я практически уверен, что «попали» в список «черных слов». Теперь нас с вами обнаружат, вручную проверят и... ничего.

Другое дело, что данный аппаратный комплекс может быть создан с более дальновидными целями — не только выискивать нарушителей сейчас, но и брать «на карандаш» потенциально «опасные» издания. При определенной степени паранойи и нелояльности к нынешней государственной власти эту разработку можно назвать хорошей программной платформой для будущей цензуры в интернете. Но вот оценку сему факту я уже давать не готов - я вне политики и спорта.

Дополнения читателей

Андрей 08.11.11 08:23
Я уверен что большая часть пользователей интернета не одобрит цензуру во всемирной паутине, а уж пользоваться или нет матерными выражениями это уже дело каждого отдельного пользователя, и показатель их морального состояния, все таки интернет для них это одно из немногих мест где они могут полностью выговориться невзирая на последствия
Написать свой комментарий

Задать вопрос дежурным
Хотите что-то добавить по сути вопроса — пишите сюда.



Справка
Андрей Ярных — начальник отдела интернет-решений Лаборатории Касперского.
Алексей Довжиков — Директор по развитию TRINET, генеральный директор eLama.ru.