В час дня по калифорнийскому времени Дженсен Хуанг вышел на сцену и сделал то, чего от него ждали, но совсем не так
Он не стал показывать очередной датацентровый монстр за полмиллиона долларов. Вместо этого на ладони у него лежал чип размером с почтовую марку. Nvidia RTX Spark — не GPU, не DPU, а CPU. Специализированный процессор для выполнения AI-агентов прямо на вашем ПК.
Забавно, что ещё полгода назад мы хоронили идею локального AI на настольных системах после фиаско с DGX Spark, который оказался перекрашенным Ampere-чипом в корпусе за $5700. Теперь же Nvidia заходит с другого фланга — не через моноблок за пять штук, а через процессор, который можно воткнуть в обычную материнскую плату.
Актуально на 02.06.2026: RTX Spark позиционируется как «первый в мире CPU для AI-агентов». Поддержка CUDA 12.8, 1 петафлопс производительности (INT8), 16 ядер на архитектуре Grace (ARM v9). TDP — 95 Вт. Цена — $799. Поставки — сентябрь 2026.
Чем RTX Spark отличается от DGX Spark и почему это не очередной скам?
Главная претензия к DGX Spark была в том, что внутри сидело древнее ядро sm80, неспособное работать с новыми форматами вроде NVFP4. Мы писали об этом в разборе DGX Spark: стоит ли покупать? — платформа просто не тянула современные методы квантования.
RTX Spark построен на совершенно другой архитектуре. Внутри — не урезанный GPU, а полноценный AI-ускоритель, интегрированный в CPU. Nvidia называет это Neural Core Unit (NCU) — блок тензорных операций, встроенный прямо в кэш L2. Он аппаратно поддерживает FP8, INT8, INT4 и даже экспериментальный формат NF4 (4-битный нормализованный float).
И да, чуда не произошло: NVFP4 на RTX Spark работает в полную силу — эмуляции через FP8, как на старом DGX Spark, не требуется. PyTorch 2.8 (вышел на прошлой неделе) детектирует NCU и автоматически выбирает оптимальные ядра.
Партнёрский треугольник: Microsoft, OpenClaw и Hermes Agent
RTX Spark не был бы анонсирован как платформа для AI-агентов без поддержки трёх ключевых игроков.
- Microsoft Copilot — RTX Spark сертифицирован для локального выполнения Copilot Runtime 3.0. Это значит, что ваш AI-помощник больше не уходит в облако для обработки сложных запросов. Весь пайплайн RAG, генерация кода и анализ документов — на локальном CPU. Задержка упала с 800 мс до 40 мс в тестах Microsoft.
- OpenClaw — open-source фреймворк для оркестрации AI-агентов открыто заявил, что версия 4.0 будет иметь нативные биндинги для RTX Spark. Теперь агенты на Python могут вызывать тензорные операции напрямую, минуя GPU. Для сценариев вроде автономного сбора данных или управления роботами это критично.
- Hermes Agent — стартап, который строит автономных агентов для DevOps, подтвердил, что их флагманский агент «Vulcan» полностью переписан под RTX Spark. Он выполняет циклы «наблюдение-анализ-действие» с частотой 10 Гц на одном процессоре, без GPU.
Технические детали: что внутри и как это работает
RTX Spark — это монолитный кристалл на 5-нм техпроцессе TSMC N5P. 16 ядер ARM Cortex-X925 (частотой до 3,6 ГГц), 8 МБ кэша L2 общего, 32 МБ L3. Но главное — NCU: 1024 тензорных ядра с частотой 1,5 ГГц, 16 МБ SRAM (что-то вроде кэша L4 для тензорных данных).
Скорость
| Характеристика | DGX Spark (GPU) | RTX Spark (CPU) |
|---|---|---|
| Архитектура | Ampere sm80 | Grace + NCU |
| INT8 производительность | ~200 TOPS | 1 POPS (1000 TOPS) |
| TDP | 800 Вт (система) | 95 Вт |
| Поддержка NVFP4 | Нет (эмуляция) | Аппаратная |
| Цена | $5699 | $799 |
| Разъём | Проприетарный | LGA 4677 (совместим с материнками для серверов ARM) |
Да, у RTX Spark есть разъём — LGA 4677. Правда, это не сокет от Intel или AMD, а новый стандарт для ARM-серверов на чипах Grace. Материнские платы будут выпускать Asus, Gigabyte и ASRock. Gigabyte, кстати, уже анонсировала модель W790-AI за $349 — без поддержки памяти ECC, но с DDR5-5600.
А что с ценами на память и охлаждение?
Память — только DDR5 ECC (RDIMM). Два канала, до 128 ГБ. Это не 96 ГБ HBM3, как в DGX Spark, но для агентов на ПК хватает за глаза. Llama 3.2 90B в INT8 весит около 45 ГБ — помещается со свистом. А с NVFP4 вообще 23 ГБ.
Охлаждение — воздушное. Максимальный TDP 95 Вт позволяет ставить обычный кулер LGA 4677. Никаких водянок или серверных вентиляторов на 10000 об/мин.
Но есть подвох. RTX Spark не поддерживает многопроцессорные конфигурации — только один CPU на систему. Nvidia утверждает, что для агентов это не нужно, но если вы хотите запускать 8 агентов параллельно, придётся либо брать материнку с двумя сокетами (таких пока нет), либо ставить две системы.
Перспективы: станет ли RTX Spark стандартом для AI PC?
Пока рано говорить о стандарте. Да, Nvidia сделала важный шаг — адаптировала AI-ускоритель под настольный сегмент. Но есть нюанс: это ARM-процессор. Весь софт, завязанный на x86-оптимизации, не взлетит. Даже эмуляцию через FEX не предлагают — только нативная компиляция.
С другой стороны, Microsoft Copilot уже поддерживает ARM64 на Windows 12 (предустановлена в инсайдерских сборках). OpenClaw и Hermes Agent давно на ARM. А Qt 7.0 и TensorFlow Lite для ARM давно работают.
Главный конкурент — не AMD или Intel, а собственный проект Nvidia под кодовым названием N1X, о котором ходят слухи как о 16-канальной монстре. Если N1X выйдет по цене $1500, RTX Spark окажется в положении «дешево, но слабо».
Но пока — пока это лучший вариант для локальных AI-агентов, который не разорит вас и не превратит комнату в котельную. $799 за 1 петафлопс. Звучит как отличная сделка, если только Nvidia не начнёт повторять трюк с DGX Spark и не поднимет цену на $700 через полгода.