Google Research и Google Cloud представили новую архитектуру поиска и генерации ответов под названием agentic RAG, которая является расширением подхода retrieval-augmented generation (RAG). Эта система не ограничивается одноразовым поиском информации, а способна итеративно уточнять запросы и добирать недостающие данные из разных источников. Новая архитектура встроена в платформу Gemini Enterprise Agent Platform и используется для кросс-корпусного поиска, то есть работы сразу с несколькими разрозненными хранилищами данных.
Классический подход RAG работает в один шаг: система получает запрос, находит близкие документы и передаёт их языковой модели для генерации ответа. Это эффективно для простых запросов, но не подходит для задач, где информация распределена по разным источникам и требует «цепочки поиска». Например, если документ о проекте содержит только идентификатор сервера, система может не догадаться сделать второй запрос в другую базу, чтобы найти его характеристики.
Agentic RAG решает эту проблему за счёт многоагентной схемы. Запрос сначала анализируется «корневым агентом», затем «планировщик» разбивает задачу на подзапросы, а «переписчик запросов» упрощает их для поиска. Отдельный агент выполняет извлечение данных из разных источников, после чего специальный модуль проверяет, достаточно ли найденного контекста для ответа. Ключевая особенность системы — механизм проверки полноты данных (sufficient context), который анализирует, покрывают ли найденные фрагменты все фрагменты исходного запроса. Если нет, то система не завершает ответ, а формирует уточнения и запускает дополнительный поиск.
По данным разработчиков, agentic RAG увеличивает точность ответов на задачах с проверкой фактов до 34% по сравнению с базовыми RAG-системами. Отдельно отмечается устойчивость при работе с несколькими независимыми наборами данных: в кросс-корпусных тестах система сохраняет около 90,1% точности даже при необходимости выбирать между несколькими источниками. Важным элементом архитектуры является и то, что она не требует значительного увеличения времени ответа: задержка остаётся близкой к стандартным системам поиска, отклонение составляет около 3%.
Исследователи подчёркивают, что ключевая проблема современных RAG-систем — не в качестве моделей, а в отсутствии механизма понимания полноты информации. Именно этот разрыв между «что найдено» и «что нужно для ответа» и закрывает agentic подход. Google позиционирует новую систему как шаг к более надёжным корпоративным ИИ-системам, способным работать с распределёнными базами данных в компаниях, где информация хранится в разных подразделениях и форматах. В настоящее время agentic RAG доступен в режиме публичного предпросмотра в Gemini Enterprise Agent Platform.