«Яндекс Поиск» стал быстрее и точнее генерировать ответы

«Яндекс» объявил о капитальной внутренней переработке «Поиска» и внедрении новой гибридной архитектуры искусственного интеллекта. Компания объединила два подхода, которые раньше в основном встречались в научных работах, и адаптировала их под реальные нагрузки.

Речь о комбинации архитектур «энкодер-декодер» и «смеси экспертов» (MoE). Первая отвечает за разбор запроса и анализ документов, вторая — за генерацию ответа. В «Яндексе» подчеркнули, что подобная комбинация методов ранее применялась преимущественно в научных исследованиях из-за сложности и требований к ресурсам.

Главная проблема, которую пришлось решать, — баланс между качеством и скоростью. В отличие от обычных нейросетей, поиск должен обрабатывать огромные объёмы данных и выдавать результат почти мгновенно. Здесь MoE играет ключевую роль: модель использует не все свои «части» сразу, а только нужные для конкретного запроса, снижая нагрузку и ускоряя работу.

Яндекс Поиск

Нам удалось модифицировать архитектуру, добавив слои MoE. В совокупности все улучшения, включая создание гибридной архитектуры, позволили нам повысить качество и совокупно снизить стоимость инференса.

Екатерина Серажим

технический директор «Яндекс Поиска»

Под эту архитектуру в «Яндексе» развивают отдельное семейство моделей — Alice AI Search. Они заточены именно под поиск, а не под универсальные задачи. За последний год компания переработала весь стек: от обучения моделей до инфраструктуры, чтобы уложиться в жёсткие ограничения по задержке и стоимости каждого запроса.

По итогам внедрения заявляется заметный эффект: стоимость обработки запросов снизилась примерно в 3 раза, а доля случаев, когда поиск сразу даёт готовый ИИ-ответ, выросла в 1,5 раза.

Источник

Поделиться ссылкой:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *