Компания Microsoft представила три новые модели искусственного интеллекта: MAI-Transcribe-1, MAI-Voice-1 и MAI-Image-2. Эти модели, разработанные внутри компании, предназначены для преобразования речи в текст, генерации голоса и создания изображений. Они доступны через платформы Microsoft Foundry и MAI Playground. MAI-Transcribe-1 — это система, которая преобразует речь в текст и демонстрирует минимальный средний уровень ошибок слов (Word Error Rate) на тесте FLEURS для 25 языков. Эта модель превосходит OpenAI Whisper-large-v3 и Google Gemini 3.1 Flash в большинстве языков. Она поддерживает форматы MP3, WAV и FLAC и работает в 2,5 раза быстрее предыдущих решений Microsoft.

Модель MAI-Voice-1 предназначена для преобразования текста в речь и может генерировать 60 секунд естественного звучания за одну секунду. Она позволяет создавать пользовательские голоса на основе нескольких секунд аудио. Стоимость использования составляет $22 за 1 миллион символов. Обновлённая модель MAI-Image-2, предназначенная для генерации изображений, работает в два раза быстрее предыдущей версии и уже используется в Bing и PowerPoint. Стоимость её использования составляет $5 за 1 миллион текстовых токенов и $33 за 1 миллион токенов изображений.

Эти модели стали возможны благодаря пересмотру контракта с OpenAI, что позволило Microsoft самостоятельно разрабатывать модели. Тем не менее, партнёрство с OpenAI продолжится до 2032 года. Разработкой моделей занимались небольшие команды, каждая из которых насчитывает менее 10 человек. Microsoft позиционирует свои модели как доступные и эффективные решения для бизнеса. MAI-Transcribe-1 уже проходит тестирование в Microsoft Teams и Copilot, а MAI-Image-2 используется в рекламных кампаниях крупных компаний, таких как WPP.

В будущем Microsoft планирует разработку универсальных языковых моделей, которые смогут конкурировать с ChatGPT. Компания стремится к полной независимости в области искусственного интеллекта, создавая собственные вычислительные кластеры и инфраструктуру для поддержки суперинтеллекта.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *