OpenAI продолжает тестирование собственного чипа, и, по заявлению компании, предварительные результаты демонстрируют значительно лучшую производительность на ватт по сравнению с передовыми альтернативами, представленными на рынке. Партнерство, в рамках которого ведется разработка, было официально анонсировано в октябре, однако планы OpenAI по созданию чипов обсуждались давно — этот шаг рассматривается как способ снизить зависимость от графических процессоров Nvidia.

Google и Amazon уже пошли по этому пути, создав кастомные микросхемы для аналогичных целей — их часто называют «ускорителями искусственного интеллекта», то есть кремнием, разработанным специально для ускорения рабочих нагрузок машинного обучения. Президент OpenAI Грег Брокман вскоре после объявления о партнерстве с Broadcom объяснил подход компании в подкасте: «У нас есть глубокое понимание рабочей нагрузки, мы давно ищем те специфические задачи, которые недостаточно обеспечены, и задаемся вопросом, как создать нечто, что расширит горизонты возможного».

Чип под кодовым названием Jalapeño целенаправленно спроектирован для инференса — процесса выполнения готовых ИИ-моделей в ответ на запросы пользователей. В анонсе OpenAI особенно выделила низкую стоимость эксплуатации чипа при запуске моделей для генерации кода в реальном времени. При этом более ресурсоемкие задачи, такие как предварительное обучение, вероятнее всего, продолжат выполняться на оборудовании Nvidia, однако даже небольшое снижение затрат на инференс способно серьезно улучшить финансовые показатели компании.

Оптимизация системы инференса становится решающим фактором в экономике искусственного интеллекта, и происходить она будет на всех уровнях технологического стека. OpenAI уже создает агентные продукты вроде Codex и модели, которые лежат в их основе, а также дата-центры для их запуска. Переход на специализированные чипы позволяет компании продвинуться в этом процессе еще дальше.

В официальном заявлении компания подчеркнула: «OpenAI не просто разрабатывает передовые модели или строит продукты на их основе; она проектирует инфраструктуру под ними: архитектуру чипов, ядра, системы памяти, сетевое взаимодействие, планировщики, системы развертывания и пользовательский опыт». Поскольку OpenAI работает на всех уровнях стека, каждый слой может быть оптимизирован вокруг единой цели — сделать модели быстрее, надежнее и доступнее для пользователей.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *