Как устроена система анализа запрещённого контента

Роскомнадзор запустил «Окулус» — систему автоматического анализа фото- и видеоконтента на наличие запрещённых материалов. Объясняем, зачем нужен этот инструмент.

Стоимость разработки «Окулуса»

О планах по созданию «Окулуса» стало известно ещё в 2021 году. Главный радиочастотный центр (ГРЧЦ, подведомственная организация Роскомнадзора) заказал за 15 млн рублей проектирование этой системы. На непосредственно разработку «Окулуса» было заложено 57,7 млн рублей. Исполнителем этого заказа стала IT-компания Execution RDC.

Эксперты оценивают стоимость создания и внедрения комплекса поиска и блокировки запрещённого контента куда выше. Собеседник «Ведомостей» в одной из отечественных IT-компаний говорит о 1,5 млрд рублей. Совладелец компании «Ланит-Терком» Владимир Уфнаровский считает, что разработка «Окулуса» обошлась в несколько десятков или сотен миллионов, внедрение — в миллиарды рублей.

Возможности «Окулуса»

Система умеет классифицировать изображения и видео на предмет соблюдения требований закона. Сейчас она способна обнаружить экстремистский контент, призывы к массовым беспорядкам, пропаганду ЛГБТ и наркотических веществ.

Окулус

Анализ данных происходит по заранее заданным источникам информации, то есть «Окулус» не умеет сам собирать данные. Производительность системы превышает 200 000 картинок в сутки, обработка одной единицы контента занимает около трёх секунд. Для сравнения, операторы вручную могли обработать в среднем 106 изображений и 101 видео в день.

Необходимость использования автоматической системы для поиска запрещенного контента в ГРЧЦ объясняют «агрессивно растущим потоком подобных материалов в интернете». В 2022-м по требованию Генпрокуратуры заблокировали свыше 100 тысяч онлайн-ресурсов, что в десятки раз превышает показатели предыдущих лет.

К 2025 году «Окулус» планируют усовершенствовать. Система сможет определять новые типы нарушений, распознавать сложные рукописные тексты и рисованный контент, а также позы людей и их действия.

Риски системы

Точность любой системы на базе искусственного интеллекта ограничивается вероятностью ложноположительных и ложноотрицательных срабатываний, отмечает гендиректор компании «Социальная лаборатория» Наталия Тылевич. Гендиректор Лиги безопасного интернета Екатерина Мизулина соглашается, что любые выводы «Окулуса» должны проверяться вручную.

Окулус

Мизулина полагает, что на текущем этапе вся выявленная информация «не будет автоматически куда-либо отправляться», в том числе для возбуждения административных и уголовных дел, а также для внесения в реестр запрещённых сайтов.

Пока неясно, как выбираются источники данных для анализа. Пропустить через «Окулус» весь русскоязычный сегмент интернета проблематично чисто технически, считает исполнительный директор Artezio Павел Адылин.

Источник

Поделиться ссылкой:

Total Views: 138 ,
 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *