OpenAI Jalapeño: собственный чип для инференса LLM | AiManual
AiManual Logo Ai / Manual.
24 Июн 2026 Новости

OpenAI показала Jalapeño: свой чип, свой мир и прощай, NVIDIA?

OpenAI представила чип Jalapeño для инференса LLM. Совместная разработка с Broadcom, производство на TSMC 3 нм. Детали, производительность и перспективы снижени

Реклама
partv2

Долгая дорога к собственному кремнию

OpenAI больше не хочет платить NVIDIA по счёту. 24 июня 2026 года компания официально представила Jalapeño — первый собственный чип для инференса больших языковых моделей. Разработка велась совместно с Broadcom, производство доверили TSMC (3-нм техпроцесс). Цель — радикально снизить стоимость каждого токена и вырваться из цепкой хватки поставщика GPU.

Jalapeño — не training-чип. Это специализированный ASIC для вывода (inference), оптимизированный под архитектуру GPT-5 и будущих моделей. По заявлению OpenAI, чип обеспечивает до 4,5x лучшую производительность на ватт по сравнению с H100 на задачах инференса.

Новость — не просто очередной хайп. Это сигнал: эра тотальной зависимости от одного вендора подходит к концу. Microsoft уже анонсировала интеграцию Jalapeño в Azure, а конкуренты вроде vLLM нервно пересчитывают свои оптимизации софта.

Технический нокаут: что под капотом Jalapeño

Подробностей — минимум, но хватает, чтобы утереть нос традиционным GPU. Чип построен на архитектуре Tensor Sparse Core, которая аппаратно поддерживает разреженность (sparsity). Это значит: нейроны, которые «молчат» в конкретном запросе, не тратят энергию. Звучит знакомо? Да, мы уже обсуждали парадокс нуля в контексте нейроморфных чипов, но OpenAI пошли другим путём — без спайков, зато с жёсткой логикой.

ХарактеристикаJalapeñoNVIDIA H100 (инференс)Microsoft Maia 200
ТехпроцессTSMC 3 нмTSMC 4 нмTSMC 5 нм
Производительность (INT8 TOPS)~2 500~1 979~1 200
Энергопотребление (TDP)350 Вт700 Вт500 Вт
ПамятьHBM3e 192 ГБHBM3 80 ГБHBM3 128 ГБ
Скорость инференса (GPT-5, average)~240 токенов/с~120 токенов/с~165 токенов/с

Цифры впечатляют. Но есть нюанс: всё это — в идеальных условиях дата-центра. Для домашнего использования Jalapeño не предназначен. Никаких PCIe-карт в магазине. Только облачные кластеры. Прямо сейчас чип монтируется в серверные стойки OpenAI и Azure.

Почему Jalapeño жёстче, чем Groq и Furiosa

Рынок AI-ускорителей перегрет. Тут и Groq с их LPU, и Furiosa с потребительским чипом, и Microsoft Maia 200. Но Jalapeño выбивается за счёт уникальной связки: софт + железо.

  • Прямая интеграция с Triton — OpenAI форкнула собственный компилятор для нейросетей, который теперь генерирует машинный код специально под Jalapeño. Никаких лишних слоёв абстракции.
  • Поддержка Sparsity на уровне ISA — чип аппаратно режет матрицы, отбрасывая до 60% умножений без потери точности. В тестах на GPT-5 точность упала всего на 0.3 bpp (perplexity).
  • Масштабирование через UltraLink — собственная сеть NVLink-подобного типа, соединяющая до 1024 чипов с пропускной способностью 1.2 ТБ/с на линк.

Всё это вместе даёт результат, который NVIDIA AETHER-X обещал на бумаге — но Jalapeño уже в продакшене.

Смерть NVIDIA? Не спешите хоронить

Да, OpenAI уводит часть нагрузки на свои чипы. Но NVIDIA не стоит на месте. Их AETHER-X — программный метод, который обещает 4.9x ускорение на существующих GPU. А Groq 3 — вообще LPU, работающая по принципу «нейронной сети на стероидах».

К тому же нейроморфные чипы (мы писали о них) могут выстрелить позже, когда конвертация ANN-to-SNN станет рутинной. Jalapeño пока что работает в классической парадигме — он энергоэффективен, но всё ещё потребляет 350 Вт.

Важный момент: OpenAI не раскрывает цены. Но аналитики подсчитали: стоимость инференса GPT-5 на Jalapeño будет примерно на 60% ниже, чем на H100. Если это подтвердится, битва за рынок AI-инфраструктуры перейдёт в горячую фазу.

Что дальше? Три сценария

Первый — оптимистичный: OpenAI открывает доступ к Jalapeño через API, разработчики получают дешёвый и быстрый инференс, NVIDIA теряет долю рынка. Второй — реалистичный: NVIDIA отвечает новым чипом Blackwell-Ultra, и гонка продолжается. Третий — скучный: производственные мощности TSMC не справляются, и Jalapeño остаётся экзотикой внутри Azure.

Лично я ставлю на второй вариант. Но одно ясно: OpenAI больше не хочет быть заложником GPU. Им нужен свой кремний. Jalapeño — первая ласточка. Осторожно: может быть острой.

Подписаться на канал