Что такое Tenstorrent QuietBox 2?

Это PCIe-ускоритель на архитектуре RISC-V, созданный специально для задач AI-инференса (вывода нейросетей) на домашних компьютерах.

Какие модели ИИ можно запускать на QuietBox 2?

Ускоритель поддерживает модели до 20 млрд параметров в форматах FP16/INT8, такие как Mistral Neo 12B, Qwen2.5-Coder 7B, Stable Diffusion 3 Medium через поддерживаемые фреймворки (PyTorch, ONNX Runtime).

Чем QuietBox 2 лучше видеокарты для AI?

Главное преимущество – энергоэффективность (35 Вт против 450+ у флагманских GPU) и полностью открытый софтверный стек на основе RISC-V. Это решение для тех, кто ценит контроль над железом и низкое энергопотребление.

Tenstorrent QuietBox 2: Обзор AI-ускорителя на RISC-V для ПК | 2026

Коробка, которая не хочет быть видеокартой

Tenstorrent выкатила QuietBox 2 на прошлой неделе. Это не очередной гаджет. Это принципиальный жест: маленький PCIe-девайс, который кричит «долой проприетарные ускорители!» тише, чем работает его кулер. Начинка – чип на RISC-V, заточенный исключительно под матричные умножения. Никакой графики, никаких рейтрейсингов. Только инференс.

💡

QuietBox 2 построен на обновлённом ядре Tensix второго поколения. Если в первой версии фокус был на INT8, то теперь добавили полноценную поддержку FP16 (brain float) и даже кусочки FP32 для операций слияния. Архитектура осталась пространственной – данные текут через массив простых ядер, а не монолитный шейдерный массив.

RISC-V – это не про экономию, это про контроль

Все ноют об открытости. Tenstorrent – один из немногих, кто делает на этом железо. RISC-V здесь не для дешёвых лицензий (хотя и это приятно). Весь софт-стек – от драйверов до компилятора графа – открыт. Можешь залезть и пересобрать pipeline под свою модель. Попробуй сделать это с драйвером CUDA. (Нет, не сможешь).

Но открытость имеет цену. Готовься к танцам с бубном. Установка драйвера – это не EXE-файл. Это клонирование репозитория, сборка под свой дистрибутив и молитва, что версия ядра подойдёт. Команда выпустила готовые пакеты для Ubuntu 24.10, но если ты на Arch или, не дай бог, NixOS – добро пожаловать в ад.

На что он способен? Цифры против ожиданий

Заявленные 200 TOPS для INT8. На практике, для Qwen 3.5 Plus в 14-битной квантзации (он же Qwen3.5-14B) скорость генерации – около 45 токенов в секунде. Для сравнения, RTX 5090 в том же тесте выдаёт 80-90. Но тут нюанс: QuietBox 2 жрёт 35 ватт. Пять сотен девятьдесят – под 450.

Устройство	Производительность (токены/с, Qwen3.5-14B)	Потребление (Вт)	Ориентировочная цена (март 2026)
Tenstorrent QuietBox 2	45	35	$399
NVIDIA RTX 5090	85	~450	$1999+
CPU (Ryzen 9 7950X3D, llama.cpp)	12	~120	$599 (только CPU)

Энергоэффективность бьёт все рекорды. И это ключевое. Тренд on-device AI диктует свои правила: будущее не за мегаваттными дата-центрами, а за миллиардами малых устройств. QuietBox 2 – шаг в эту сторону для десктопа.

Что в нём запускать? Список не бесконечный

Поддерживается PyTorch через плагин и ONNX Runtime. TensorFlow – через ONNX. Из коробки работают популярные форматы: GGUF (через llama.cpp с патчем), Safetensors. Модели до 20 миллиардов параметров в FP16 – комфортно. Хочешь запустить свежий BitNet b1.58? Потребуется конвертация, но драйвер справится.

Локальный ассистент: Mistral Neo 12B, Qwen2.5-Coder 7B. Отклик как у облачного сервиса двухлетней давности, но полностью у тебя в корпусе.
Генерация изображений: Stable Diffusion 3 Medium (2B параметров) – одна картинка за 3-4 секунды. Для быстрых скетчей сгодится.
Специфичные задачи: Детекция объектов в реальном времени для домашней камеры, транскрибация аудио (Whisper-large-v3). Идеально для фоновых процессов, которые не должны грузить систему.

Главный недостаток – память. Всего 16 ГБ LPDDR5 на борту. И это не видеопамять с широкой шиной. Это единая память для всего. Загрузил модель на 14B параметров в FP16 – свободно ещё гигабайта три. Для кэша контекста. Большие контексты (128K) будут проблемой. Это не AI-станция на RTX 5090 с её 32 ГБ GDDR7.

Интеграция: боль, которая может окупиться

Драйвер пока сыроват. В логах иногда всплывают ошибки выделения памяти. Команда Tenstorrent активно фиксит баги – за последний месяц выпустили три минорных обновления. Сообщество на GitHub растёт. Если ты любишь ковыряться в свежем железе и софте – тебе здесь рады. Если ждёшь plug-and-play опыт как у Nvidia – проходи мимо.

Но когда всё настроено – магия. Система вообще не реагирует на работу ускорителя. Вентиляторы не раскручиваются, температура не ползёт. Привет, пассивное охлаждение. Ты забываешь, что он есть. А он тихо делает свою работу в фоне.

Кому это надо? (Честно)

1. Энтузиасты открытого железа. Те, кому важно знать, как каждый транзистор работает. Для них QuietBox 2 – игрушка мечты.
2. Разработчики embedded систем. Прототипирование алгоритмов для будущих продуктов на RISC-V. Тот же Jetson Thor для роботов – это другая лига. Здесь – дешёвый стенд.
3. Люди с дешёвым электричеством и дорогой видеокартой. Если хочешь держать модель загруженной 24/7 для личных нужд, 35 ватт против 450 – огромная разница в счетах.

Это не убийца GPU. Это доказательство концепции. Что AI-инференс можно делать на открытой, энергоэффективной архитектуре. Что не обязательно платить дань Купертино или Санта-Кларе.

Стоит ли покупать? Если твой хобби-проект – резервуарные вычисления на аналоговых чипах или ты веришь, что будущее за децентрализованными сетями вроде Quadric – да, бери. Это инвестиция в экосистему. Если тебе просто нужен быстрый ChatGPT дома – купи RTX 5070. Не мучай себя.

QuietBox 2 – не для всех. Он для тех, кто готов мириться с сыроватым софтом ради идеи. Идеи о том, что следующий скачок в AI произойдёт не в облаке, а на краю сети. В твоём компьютере. И он будет открытым. И тихим.

Подписаться на канал

Tenstorrent QuietBox 2: AI-инференс на RISC-V для домашних ПК - что это даёт энтузиастам