OpenAI и Broadcom представили Jalapeno — первый интеллектуальный процессор OpenAI, созданный в соответствии с видением компании о будущем обработки данных с применением линейных моделей машинного обучения. Он также является первым акселератором ИИ в рамках вычислительной платформы, рассчитанной на много поколений. Президент и главный исполнительный директор Broadcom Хок Тан вместе с президентом Чарли Каввасом передали новый чип генеральному директору OpenAI Сэму Альтману и президенту Грегу Брокману.
OpenAI разрабатывала чип с нуля, опираясь на глубокое понимание основ больших языковых моделей, в сотрудничестве с партнёрами Broadcom и Celestica. Архитектура Jalapeno спроектирована с учётом гибкости, чтобы работать со всеми большими языковыми моделями, и опирается на знания OpenAI о потребностях в выводе данных как для текущих, так и для будущих индустриальных моделей ИИ. Инженерные образцы чипа уже функционируют в лаборатории, выполняя задачи машинного обучения на целевой частоте и при целевом энергопотреблении, включая работу с GPT-5.3-Codex-Spark.
Хотя окончательные замеры производительности ещё продолжаются, предварительные тесты указывают, что Jalapeno обеспечит значительно лучшую производительность на ватт по сравнению с современными передовыми технологиями. Подробный технический отчёт о производительности планируется представить в ближайшие месяцы.
Архитектура чипа уменьшает объём перемещения данных и балансирует вычислительные, запоминающие и сетевые ресурсы, позволяя достичь фактического уровня использования, гораздо более близкого к теоретической пиковой производительности. Микросхемная реализация и сетевые технологии Broadcom, в том числе сетевые микросхемы Tomahawk, помогают вывести платформу на крупномасштабный производственный уровень.
Руководитель программы OpenAI по аппаратному обеспечению Ричард Хо отметил, что Jalapeno с самого начала разрабатывался для выполнения задач больших языковых моделей на основе подробных данных, полученных в ходе тесного сотрудничества с исследователями OpenAI. Он пояснил, что команда оптимизировала архитектуру, учитывая ядра, перемещение памяти, сетевые возможности и паттерны обслуживания, наиболее важные для передовых моделей ИИ. По его словам, предварительные тесты показывают, что чип будет эффективно выполнять самые важные рабочие нагрузки, функционируя на уровне, близком к теоретическим пределам возможностей оборудования.