Arcee, лаборатория из Сан-Франциско, представила новую текстовую reasoning-модель под названием Trinity-Large-Thinking, обладающую 399 миллиардами параметров. Модель распространяется под лицензией Apache 2.0, что позволяет её свободно использовать и изменять как независимым разработчикам, так и крупным корпорациям. Trinity-Large-Thinking была разработана как альтернатива закрытым моделям, которые в настоящее время доминируют на рынке. Выпуск модели совпал с ростом обеспокоенности компаний по поводу использования китайских технологий в критически важной инфраструктуре. Arcee предлагает разработчикам инструмент, который они могут полностью контролировать. Arcee — это небольшая команда из 30 человек, которая выделяется своим подходом "инженерия через ограничения". В 2026 году компания инвестировала 20 миллионов долларов, что составляет почти половину её бюджета, в 33-дневный цикл обучения Trinity-Large. Для этого использовался кластер из 2048 графических процессоров NVIDIA B300 Blackwell, что позволило достичь высокой скорости обучения. Иллюстрация: Nano Banana.

Модель отличается редкой архитектурой Mixture-of-Experts, где из 400 миллиардов параметров активны только 1,56% (13 миллиардов) для каждого токена. Это обеспечивает высокую скорость и эффективность работы. Для решения проблем стабильности Arcee разработала механизм SMEBU (Soft-clamped Momentum Expert Bias Updates), который равномерно распределяет нагрузку между экспертами. Обучение Trinity-Large включало 20 триллионов токенов, половина из которых — синтетические данные, созданные с помощью переработки текстов. Такой подход позволил модели лучше понимать концепции и информацию, а не просто запоминать текст.

Ключевым обновлением Trinity-Large-Thinking стала фаза "мышления" перед генерацией ответа. Это улучшило способность модели выполнять сложные многошаговые задачи и обеспечило стабильность в долгосрочных сценариях. На тестах PinchBench модель набрала 91.9 балла, что близко к лидеру рынка Claude Opus 4.6, который имеет 93.3 балла. Лицензия Apache 2.0 выделяет Trinity-Large-Thinking среди конкурентов, предоставляя предприятиям возможность полного контроля над моделью. Arcee также выпустила Trinity-Large-TrueBase — контрольную точку с 10 триллионами токенов, которая позволяет полностью адаптировать модель под свои нужды.

Trinity-Large-Thinking уже получила положительные отзывы сообщества. На платформе OpenRouter модель стала самой популярной в США, обработав более 80 миллиардов токенов за день. При стоимости $0.90 за миллион токенов Trinity значительно дешевле конкурентов, таких как Claude Opus 4.6, который стоит $25 за миллион токенов. Arcee планирует использовать наработки Trinity-Large для обновления своих компактных моделей Mini и Nano, открыв их также для широкого круга пользователей.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *