«Яндекс» объявил о капитальной внутренней переработке «Поиска» и внедрении новой гибридной архитектуры искусственного интеллекта. Компания объединила два подхода, которые раньше в основном встречались в научных работах, и адаптировала их под реальные нагрузки.
Речь о комбинации архитектур «энкодер-декодер» и «смеси экспертов» (MoE). Первая отвечает за разбор запроса и анализ документов, вторая — за генерацию ответа. В «Яндексе» подчеркнули, что подобная комбинация методов ранее применялась преимущественно в научных исследованиях из-за сложности и требований к ресурсам.
Главная проблема, которую пришлось решать, — баланс между качеством и скоростью. В отличие от обычных нейросетей, поиск должен обрабатывать огромные объёмы данных и выдавать результат почти мгновенно. Здесь MoE играет ключевую роль: модель использует не все свои «части» сразу, а только нужные для конкретного запроса, снижая нагрузку и ускоряя работу.

Нам удалось модифицировать архитектуру, добавив слои MoE. В совокупности все улучшения, включая создание гибридной архитектуры, позволили нам повысить качество и совокупно снизить стоимость инференса.
Екатерина Серажим
технический директор «Яндекс Поиска»
Под эту архитектуру в «Яндексе» развивают отдельное семейство моделей — Alice AI Search. Они заточены именно под поиск, а не под универсальные задачи. За последний год компания переработала весь стек: от обучения моделей до инфраструктуры, чтобы уложиться в жёсткие ограничения по задержке и стоимости каждого запроса.
По итогам внедрения заявляется заметный эффект: стоимость обработки запросов снизилась примерно в 3 раза, а доля случаев, когда поиск сразу даёт готовый ИИ-ответ, выросла в 1,5 раза.
