OpenAI Jalapeño: собственный чип для инференса LLM

Долгая дорога к собственному кремнию

OpenAI больше не хочет платить NVIDIA по счёту. 24 июня 2026 года компания официально представила Jalapeño — первый собственный чип для инференса больших языковых моделей. Разработка велась совместно с Broadcom, производство доверили TSMC (3-нм техпроцесс). Цель — радикально снизить стоимость каждого токена и вырваться из цепкой хватки поставщика GPU.

Jalapeño — не training-чип. Это специализированный ASIC для вывода (inference), оптимизированный под архитектуру GPT-5 и будущих моделей. По заявлению OpenAI, чип обеспечивает до 4,5x лучшую производительность на ватт по сравнению с H100 на задачах инференса.

Новость — не просто очередной хайп. Это сигнал: эра тотальной зависимости от одного вендора подходит к концу. Microsoft уже анонсировала интеграцию Jalapeño в Azure, а конкуренты вроде vLLM нервно пересчитывают свои оптимизации софта.

Технический нокаут: что под капотом Jalapeño

Подробностей — минимум, но хватает, чтобы утереть нос традиционным GPU. Чип построен на архитектуре Tensor Sparse Core, которая аппаратно поддерживает разреженность (sparsity). Это значит: нейроны, которые «молчат» в конкретном запросе, не тратят энергию. Звучит знакомо? Да, мы уже обсуждали парадокс нуля в контексте нейроморфных чипов, но OpenAI пошли другим путём — без спайков, зато с жёсткой логикой.

Характеристика	Jalapeño	NVIDIA H100 (инференс)	Microsoft Maia 200
Техпроцесс	TSMC 3 нм	TSMC 4 нм	TSMC 5 нм
Производительность (INT8 TOPS)	~2 500	~1 979	~1 200
Энергопотребление (TDP)	350 Вт	700 Вт	500 Вт
Память	HBM3e 192 ГБ	HBM3 80 ГБ	HBM3 128 ГБ
Скорость инференса (GPT-5, average)	~240 токенов/с	~120 токенов/с	~165 токенов/с

Цифры впечатляют. Но есть нюанс: всё это — в идеальных условиях дата-центра. Для домашнего использования Jalapeño не предназначен. Никаких PCIe-карт в магазине. Только облачные кластеры. Прямо сейчас чип монтируется в серверные стойки OpenAI и Azure.

Почему Jalapeño жёстче, чем Groq и Furiosa

Рынок AI-ускорителей перегрет. Тут и Groq с их LPU, и Furiosa с потребительским чипом, и Microsoft Maia 200. Но Jalapeño выбивается за счёт уникальной связки: софт + железо.

Прямая интеграция с Triton — OpenAI форкнула собственный компилятор для нейросетей, который теперь генерирует машинный код специально под Jalapeño. Никаких лишних слоёв абстракции.
Поддержка Sparsity на уровне ISA — чип аппаратно режет матрицы, отбрасывая до 60% умножений без потери точности. В тестах на GPT-5 точность упала всего на 0.3 bpp (perplexity).
Масштабирование через UltraLink — собственная сеть NVLink-подобного типа, соединяющая до 1024 чипов с пропускной способностью 1.2 ТБ/с на линк.

Всё это вместе даёт результат, который NVIDIA AETHER-X обещал на бумаге — но Jalapeño уже в продакшене.

Смерть NVIDIA? Не спешите хоронить

Да, OpenAI уводит часть нагрузки на свои чипы. Но NVIDIA не стоит на месте. Их AETHER-X — программный метод, который обещает 4.9x ускорение на существующих GPU. А Groq 3 — вообще LPU, работающая по принципу «нейронной сети на стероидах».

К тому же нейроморфные чипы (мы писали о них) могут выстрелить позже, когда конвертация ANN-to-SNN станет рутинной. Jalapeño пока что работает в классической парадигме — он энергоэффективен, но всё ещё потребляет 350 Вт.

Важный момент: OpenAI не раскрывает цены. Но аналитики подсчитали: стоимость инференса GPT-5 на Jalapeño будет примерно на 60% ниже, чем на H100. Если это подтвердится, битва за рынок AI-инфраструктуры перейдёт в горячую фазу.

Что дальше? Три сценария

Первый — оптимистичный: OpenAI открывает доступ к Jalapeño через API, разработчики получают дешёвый и быстрый инференс, NVIDIA теряет долю рынка. Второй — реалистичный: NVIDIA отвечает новым чипом Blackwell-Ultra, и гонка продолжается. Третий — скучный: производственные мощности TSMC не справляются, и Jalapeño остаётся экзотикой внутри Azure.

Лично я ставлю на второй вариант. Но одно ясно: OpenAI больше не хочет быть заложником GPU. Им нужен свой кремний. Jalapeño — первая ласточка. Осторожно: может быть острой.

Подписаться на канал

OpenAI показала Jalapeño: свой чип, свой мир и прощай, NVIDIA?

Долгая дорога к собственному кремнию

Технический нокаут: что под капотом Jalapeño

Почему Jalapeño жёстче, чем Groq и Furiosa

Смерть NVIDIA? Не спешите хоронить

Что дальше? Три сценария

Подписывайтесь на наш канал!