На конференции Google I/O 2025 компания анонсировала масштабное обновление своих ИИ-моделей Gemini 2.5, включая новый режим Deep Think для Gemini 2.5 Pro. По заявлению Google, эта версия превосходит последние модели OpenAI o3 и o4 в ключевых тестах, включая математику, программирование и мультимодальные задачи.

Gemini 2.5 Pro Deep Think — новый уровень ИИ-рассуждений

Режим Deep Think не является отдельной моделью, а расширяет возможности Gemini 2.5 Pro, улучшая её способность анализировать несколько гипотез перед формированием ответа. Это делает ИИ более точным в сложных задачах.

Ключевые результаты тестирования:

  • 49,4% — результат на сложном математическом бенчмарке USAMO 2025 (олимпиадный уровень).

  • 80,4% — точность в LiveCodeBench (тест на профессиональное программирование).

  • 84,0% — мультимодальное понимание в MMMU (анализ текста, изображений и данных).

Эти показатели устанавливают новый рекорд (SOTA — state of the art) и опережают аналоги от OpenAI. Пока Deep Think доступен только избранным тестерам через API, но массовый релиз ожидается в ближайшее время.

Обновлённая Gemini 2.5 Flash — быстрее и доступнее

Google также улучшила Gemini 2.5 Flash — облегчённую и экономичную версию модели. Она стала точнее в тестах и уже доступна в:

  • Google AI Studio (для разработчиков),

  • Vertex AI (для бизнеса),

  • приложении Gemini.

Стабильная версия выйдет в июне 2025 года.

Новые инструменты для разработчиков

Google расширила API и инструментарий для интеграции ИИ:

  • Live API Preview — поддержка нескольких голосов в режиме текст-в-речь и улучшенный аудиовыход.

  • Model Context Protocol (MCP) — упрощённая работа с open-source-инструментами.

  • Thinking budgets — настройка «бюджета» вычислительных ресурсов для Gemini 2.5 Pro (скоро в промышленном использовании).

  • Project Mariner — интеграция ИИ в настольные приложения через Gemini API и Vertex AI.

  • Генерация резюме мыслей (thought summaries) — новая функция для анализа решений ИИ.

Подробнее о нововведениях можно узнать на официальном сайте Gemini.

Вывод

С выходом Gemini 2.5 Pro Deep Think и обновлённой Flash Google укрепляет свои позиции в гонке ИИ, предлагая более мощные и доступные решения для пользователей и разработчиков.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *