Китайская компания Moonshot AI, разработчик чат-бота Kimi, представила новую открытую языковую модель Kimi K2.

Эта инновация составляет прямую конкуренцию закрытым системам от OpenAI и Anthropic, демонстрируя впечатляющие результаты в программировании и автономных задачах.

Kimi K2 построена на архитектуре «смесь экспертов» с общим числом параметров в 1 триллион, из которых активно используются 32 миллиарда.

Компания выпустила две версии модели: стандартную и оптимизированную Kimi K2-Instruct, предназначенную для чатов и автономных агентов. «Kimi K2 не просто отвечает — он действует», — заявили в Moonshot AI.

Иллюстрация: Sora.

Основное преимущество модели заключается в её «агентных» возможностях: она способна автономно работать с инструментами, писать и выполнять код, а также решать многошаговые задачи без вмешательства человека.

В тесте SWE-bench Verified, оценивающем инженерные навыки, Kimi K2 достигла точности 65,8%, обойдя большинство открытых аналогов и сравнявшись с закрытыми системами.

На тесте кодирования LiveCodeBench модель показала 53,7% точности, превосходя DeepSeek-V3 с 46,9% и GPT-4.1 с 44,7%.

В математическом тесте MATH-500 она достигла 97,4% точности по сравнению с 92,4% у GPT-4.1.

При этом Moonshot смогла достичь таких результатов с меньшими затратами на обучение и вычисления.

Техническая документация раскрывает инновацию MuonClip — оптимизатор, обеспечивший стабильное обучение триллионной модели без нестабильности.

Этот подход решает проблему «взрывных» логитов внимания через масштабирование матриц весов, что потенциально снижает вычислительные затраты в отрасли.

Moonshot предлагает два варианта доступа: бесплатную версию и коммерческий API по цене $0,15 за 1 миллион входных токенов и $2,50 за 1 миллион выходных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *