OpenAI, компания-разработчик ChatGPT и Codex, а также моделей, лежащих в основе этих инструментов, и Broadcom, признанный поставщик кремниевых решений, анонсировали новый чип под названием Jalapeño. Он спроектирован специально для инференса больших языковых моделей в дата-центрах.
Новинка предназначена для развёртывания в крупных вычислительных центрах. Обе компании заявляют, что это лишь первое поколение в рамках долгосрочного проекта, который предполагает последующее совершенствование чипов.
Характеристики и доступность устройства пока не раскрываются, однако известно, что в будущем архитектура будет дорабатываться, а само семейство чипов продолжит развиваться. Инженеры OpenAI и Broadcom намерены в ближайшие годы оптимизировать вычислительные блоки под задачи обслуживания генеративных моделей.
Проект Jalapeño отражает тренд на создание специализированного оборудования для искусственного интеллекта: вместо использования универсальных ускорителей компании делают ставку на узкую специализацию под инференс. Это должно повысить производительность и снизить энергопотребление в контексте быстро растущих нагрузок на дата-центры.
Представители OpenAI и Broadcom подчеркнули, что сотрудничество рассчитано на серию продуктов. Первый чип станет основой для будущих версий, каждая из которых будет получать архитектурные улучшения с учётом опыта эксплуатации и новых требований к обработке больших языковых моделей.