Автоматизировать цензуру в Рунете не удалось
Основной задачей этой системы является анализ на предмет нарушения законодательства текстов, картинок, аудио-и видеофайлов, причем не только редакционных публикаций, но и комментариев читателей. Она должна была обнаруживать экстремистские материалы, порнографию, материалы о наркотиках и об организациях, закрытых по постановлению суда. Разработка системы была отдана компании "ДатаЦентр" потому, что та запросила минимальный бюджет - 4,6 млн рублей при изначально запланированных Роскомнадзором 15 млн.
В ноябре систему уже презентовали журналистам. Представитель "ДатаЦентра" рассказывал СМИ, что мощностей программно-аппаратного комплекса хватает на отслеживание в режиме реального времени всех материалов и комментариев, публикуемых на всех сайтах, зарегистрированных как СМИ. Словарь программы на тот момент составлял более тысячи слов, в результате чего программа не видела ничего криминального в словосочетании "мочить чёрных", зато считала наркоманскими любые статьи про крокодилов. В перспективе планировалось расширить словарь до 5,5 миллионов слов. Однако, Константин Протопопов из Роскомнадзора был полон оптимизма и отмечал, что "машину все уже боятся, хотя никто не видел".
Источник:Roem.ru