На конференции Google I/O 2025 компания анонсировала масштабное обновление своих ИИ-моделей Gemini 2.5, включая новый режим Deep Think для Gemini 2.5 Pro. По заявлению Google, эта версия превосходит последние модели OpenAI o3 и o4 в ключевых тестах, включая математику, программирование и мультимодальные задачи.
Gemini 2.5 Pro Deep Think — новый уровень ИИ-рассуждений
Режим Deep Think не является отдельной моделью, а расширяет возможности Gemini 2.5 Pro, улучшая её способность анализировать несколько гипотез перед формированием ответа. Это делает ИИ более точным в сложных задачах.
Ключевые результаты тестирования:
-
49,4% — результат на сложном математическом бенчмарке USAMO 2025 (олимпиадный уровень).
-
80,4% — точность в LiveCodeBench (тест на профессиональное программирование).
-
84,0% — мультимодальное понимание в MMMU (анализ текста, изображений и данных).
Эти показатели устанавливают новый рекорд (SOTA — state of the art) и опережают аналоги от OpenAI. Пока Deep Think доступен только избранным тестерам через API, но массовый релиз ожидается в ближайшее время.
Обновлённая Gemini 2.5 Flash — быстрее и доступнее
Google также улучшила Gemini 2.5 Flash — облегчённую и экономичную версию модели. Она стала точнее в тестах и уже доступна в:
-
Google AI Studio (для разработчиков),
-
Vertex AI (для бизнеса),
-
приложении Gemini.
Стабильная версия выйдет в июне 2025 года.
Новые инструменты для разработчиков
Google расширила API и инструментарий для интеграции ИИ:
-
Live API Preview — поддержка нескольких голосов в режиме текст-в-речь и улучшенный аудиовыход.
-
Model Context Protocol (MCP) — упрощённая работа с open-source-инструментами.
-
Thinking budgets — настройка «бюджета» вычислительных ресурсов для Gemini 2.5 Pro (скоро в промышленном использовании).
-
Project Mariner — интеграция ИИ в настольные приложения через Gemini API и Vertex AI.
-
Генерация резюме мыслей (thought summaries) — новая функция для анализа решений ИИ.
Подробнее о нововведениях можно узнать на официальном сайте Gemini.
Вывод
С выходом Gemini 2.5 Pro Deep Think и обновлённой Flash Google укрепляет свои позиции в гонке ИИ, предлагая более мощные и доступные решения для пользователей и разработчиков.