Долгая дорога к собственному кремнию
OpenAI больше не хочет платить NVIDIA по счёту. 24 июня 2026 года компания официально представила Jalapeño — первый собственный чип для инференса больших языковых моделей. Разработка велась совместно с Broadcom, производство доверили TSMC (3-нм техпроцесс). Цель — радикально снизить стоимость каждого токена и вырваться из цепкой хватки поставщика GPU.
Jalapeño — не training-чип. Это специализированный ASIC для вывода (inference), оптимизированный под архитектуру GPT-5 и будущих моделей. По заявлению OpenAI, чип обеспечивает до 4,5x лучшую производительность на ватт по сравнению с H100 на задачах инференса.
Новость — не просто очередной хайп. Это сигнал: эра тотальной зависимости от одного вендора подходит к концу. Microsoft уже анонсировала интеграцию Jalapeño в Azure, а конкуренты вроде vLLM нервно пересчитывают свои оптимизации софта.
Технический нокаут: что под капотом Jalapeño
Подробностей — минимум, но хватает, чтобы утереть нос традиционным GPU. Чип построен на архитектуре Tensor Sparse Core, которая аппаратно поддерживает разреженность (sparsity). Это значит: нейроны, которые «молчат» в конкретном запросе, не тратят энергию. Звучит знакомо? Да, мы уже обсуждали парадокс нуля в контексте нейроморфных чипов, но OpenAI пошли другим путём — без спайков, зато с жёсткой логикой.
| Характеристика | Jalapeño | NVIDIA H100 (инференс) | Microsoft Maia 200 |
|---|---|---|---|
| Техпроцесс | TSMC 3 нм | TSMC 4 нм | TSMC 5 нм |
| Производительность (INT8 TOPS) | ~2 500 | ~1 979 | ~1 200 |
| Энергопотребление (TDP) | 350 Вт | 700 Вт | 500 Вт |
| Память | HBM3e 192 ГБ | HBM3 80 ГБ | HBM3 128 ГБ |
| Скорость инференса (GPT-5, average) | ~240 токенов/с | ~120 токенов/с | ~165 токенов/с |
Цифры впечатляют. Но есть нюанс: всё это — в идеальных условиях дата-центра. Для домашнего использования Jalapeño не предназначен. Никаких PCIe-карт в магазине. Только облачные кластеры. Прямо сейчас чип монтируется в серверные стойки OpenAI и Azure.
Почему Jalapeño жёстче, чем Groq и Furiosa
Рынок AI-ускорителей перегрет. Тут и Groq с их LPU, и Furiosa с потребительским чипом, и Microsoft Maia 200. Но Jalapeño выбивается за счёт уникальной связки: софт + железо.
- Прямая интеграция с Triton — OpenAI форкнула собственный компилятор для нейросетей, который теперь генерирует машинный код специально под Jalapeño. Никаких лишних слоёв абстракции.
- Поддержка Sparsity на уровне ISA — чип аппаратно режет матрицы, отбрасывая до 60% умножений без потери точности. В тестах на GPT-5 точность упала всего на 0.3 bpp (perplexity).
- Масштабирование через UltraLink — собственная сеть NVLink-подобного типа, соединяющая до 1024 чипов с пропускной способностью 1.2 ТБ/с на линк.
Всё это вместе даёт результат, который NVIDIA AETHER-X обещал на бумаге — но Jalapeño уже в продакшене.
Смерть NVIDIA? Не спешите хоронить
Да, OpenAI уводит часть нагрузки на свои чипы. Но NVIDIA не стоит на месте. Их AETHER-X — программный метод, который обещает 4.9x ускорение на существующих GPU. А Groq 3 — вообще LPU, работающая по принципу «нейронной сети на стероидах».
К тому же нейроморфные чипы (мы писали о них) могут выстрелить позже, когда конвертация ANN-to-SNN станет рутинной. Jalapeño пока что работает в классической парадигме — он энергоэффективен, но всё ещё потребляет 350 Вт.
Важный момент: OpenAI не раскрывает цены. Но аналитики подсчитали: стоимость инференса GPT-5 на Jalapeño будет примерно на 60% ниже, чем на H100. Если это подтвердится, битва за рынок AI-инфраструктуры перейдёт в горячую фазу.
Что дальше? Три сценария
Первый — оптимистичный: OpenAI открывает доступ к Jalapeño через API, разработчики получают дешёвый и быстрый инференс, NVIDIA теряет долю рынка. Второй — реалистичный: NVIDIA отвечает новым чипом Blackwell-Ultra, и гонка продолжается. Третий — скучный: производственные мощности TSMC не справляются, и Jalapeño остаётся экзотикой внутри Azure.
Лично я ставлю на второй вариант. Но одно ясно: OpenAI больше не хочет быть заложником GPU. Им нужен свой кремний. Jalapeño — первая ласточка. Осторожно: может быть острой.