Команда Яндекса внедрила в свой поисковый сервис гибридную архитектуру искусственного интеллекта, основанную на научных исследованиях. На конференции «День Поиска 2026» технический директор «Яндекс Поиска» Екатерина Серажим сообщила, что компания интегрировала методы «смеси экспертов» (Mixture of Experts, MoE) и «энкодер-декодер» (encoder-decoder). Это позволило улучшить качество генеративных ответов и в три раза сократить затраты на их обработку.
Екатерина Серажим отметила, что генеративные ответы являются важной функцией поиска, требующей быстроты и лаконичности. Для этого Яндекс разработал семейство моделей Alice AI Search, оптимизированных для поисковых задач. Эти модели используют архитектуру «энкодер-декодер», где одна часть модели занимается анализом запроса и документов, а другая — формированием ответа. Чтобы ускорить процесс без потери качества, был применён подход MoE, который активирует только часть модели для генерации каждого следующего токена.
Екатерина Серажим подчеркнула, что в поисковой системе модель должна одновременно обрабатывать большой объём данных и соответствовать строгим требованиям по скорости и стоимости для каждого запроса. Яндексу удалось модифицировать архитектуру, добавив слои MoE. Все эти улучшения, включая создание гибридной архитектуры, позволили повысить качество и снизить совокупные затраты на инференс в три раза.
В результате доля запросов, на которые поиск сразу предоставляет генеративный ответ, увеличилась за год в 1,5 раза.