Стартап Thinking Machines, созданный бывшими ведущими разработчиками OpenAI под руководством Миры Мурати, представил свой дебютный продукт под названием Tinker.
Это API, которое предоставляет разработчикам возможность разрабатывать и запускать алгоритмы для дополнительного обучения моделей искусственного интеллекта.
Вся инфраструктура, включая распределение серверных ресурсов и восстановление после сбоев, управляется системой Thinking Machines.
Платформа поддерживает модели различных размеров, от небольших до очень крупных, включая архитектуру Mixture-of-Experts.
API предлагает низкоуровневые примитивы, которые позволяют реализовать популярные методы тонкой настройки моделей.
Для более сложных задач Thinking Machines выпустили открытый набор готовых алгоритмов под названием Tinker Cookbook.
В него вошли распространённые техники дополнительного обучения, такие как обучение с подкреплением с обратной связью (RLHF), многопользовательские модели, использование вспомогательных инструментов и задачи математического рассуждения.
Согласно источнику, Tinker уже протестировали несколько ведущих научных групп.
Например, в Принстоне с его помощью обучили модель для доказательства математических теорем, а в Беркли разработали специализированные методы обучения с подкреплением для агентов в многопользовательской среде.
Основная цель Tinker — предоставить разработчикам полный контроль над процессом обучения и экспериментов, освобождая их от сложностей администрирования вычислительной инфраструктуры.
В настоящее время инструмент доступен в закрытом бета-тестировании, и на начальном этапе его использование бесплатно, но в будущем планируется ввести оплату за использование ресурсов.