ИИ умеет обманывать людей ради личной выгоды

Исследователи Массачусетского технологического института пришли к выводу, что некоторые системы искусственного интеллекта, созданные исключительно из благих намерений, научились вводить людей в заблуждение. Учёные выяснили, что ИИ может использовать разные уловки для достижения нужных ему целей.

Согласно результатам исследования, разработанный компанией Meta* ИИ под названием Ciceron изначально задумывался как честный противник в онлайн-игре про дипломатию. По словам Питера Парка, ведущего автора эксперимента, нейросеть выступала за Францию и тайно объединилась с Германией, управляемой человеком, чтобы предать Англию (тоже под контролем человека), хотя изначально обещала защитить Англию от возможного вторжения. Во втором случае чат-бот на базе языковой модели GPT-4 от OpenAI просил людей помочь ему пройти проверку CAPTCHA, ссылаясь на то, что у него якобы проблемы со зрением и сам он не способен выполнить задание.

По словам исследователей, компаниям следует классифицировать потенциально опасные системы ИИ как те, что могут обманывать людей в личных целях.

* Компания Meta признана экстремистской организацией в России 

Источник

Поделиться ссылкой:

Total Views: 42 ,
 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *