Зачем вообще ставить две разные карты в один компьютер?

Потому что это единственный способ не сойти с ума. RTX 5090 — это монстр для игр, но попробуйте запустить на ней обучение модели в фоне, пока играете. Вентиляторы взвоют как реактивный двигатель, температура полезет к 90°, а FPS в Cyberpunk просядет до слайд-шоу. И наоборот — RTX Pro 4500 идеальна для стабильного инференса, но в играх она смотрится как спортсмен-пенсионер на олимпиаде.

Ключевая идея: физическое разделение задач. Игры — на RTX 5090. AI-инференс, рендеринг, компиляция — на RTX Pro 4500. Система работает как два независимых компьютера в одном корпусе.

Что получится в итоге: цифры, которые имеют значение

Не обещания, а конкретика из моей тестовой сборки:

Параметр	RTX 5090 (игры)	Энергопотребление в простое	2-3 Вт	2-3 Вт
Энергопотребление под нагрузкой	450-500 Вт (пик)	150 Вт (стабильно)
Производительность в Llama 3.1 70B (Q4_K_M)	Не тестировал (не для этого)	30-35 токенов/с
Производительность в Llama 3.2 3B (Q8)	-	200+ токенов/с
Температура под 100% нагрузкой	68-72°C (с разгоном)	54-58°C (пассивно!)

Да, RTX Pro 4500 под полной нагрузкой Llama работает практически бесшумно — у неё пассивное охлаждение. Пока 5090 рвёт Cyberpunk, Pro 4500 тихо генерирует текст в фоне. Это и есть идеал.

Список компонентов: что купить, чтобы не пришлось возвращать

Вот полный список того, что стоит сейчас в моём тестовом стенде. Не "рекомендованные компоненты", а конкретные модели, которые работают.

Материнская плата: ASUS ProArt Z790-CREATOR WIFI — два полноценных PCIe 5.0 x16 слока, между ними три слота расстояния. Критически важно для охлаждения.
Процессор: Intel Core i7-14700K — 20 ядер, встроенная графика для резерва, разумная цена.
Оперативная память: 64 ГБ DDR5-6000 CL30 (2×32 ГБ) Kingston Fury — стабильность важнее рекордов.
Блок питания: Seasonic PRIME TX-1300 — 1300 Вт, 80+ Titanium. Да, это избыточно. Нет, на 1000 Вт я не рискнул.
Корпус: Fractal Design Meshify 2 XL — пространство, воздух, никакого стекла на три стороны.
Охлаждение процессора: Arctic Liquid Freezer III 420 — 420-мм радиатор, потому что теплоотвод от 5090 будет нагревать всё внутри.
Накопители: 2 ТБ Samsung 990 Pro (система) + 4 ТБ Crucial T700 (модели и датасеты).

Главная ошибка на этом этапе: экономия на блоке питания. RTX 5090 в пике может кратковременно потреблять под 600 Вт. Добавляем процессор, вторую карту, периферию — 1000 Вт уже не кажутся паранойей. Если блок уйдёт в защиту во время рендера или тренировки, вы потеряете часы работы.

Сборка: где ошибаются 90% людей

1 Порядок установки карт

Не RTX 5090 в первый слот, а наоборот. RTX Pro 4500 с пассивным охлаждением ставится в верхний слот (PCI_E1). RTX 5090 — в нижний (PCI_E2). Почему? Потому что горячий воздух от 5090 будет подниматься вверх. Если над ней будет Pro 4500, та начнёт жариться. В моей конфигурации Pro 4500 получает холодный воздух с фронта корпуса, а 5090 выдувает тепло вверх и назад.

2 Кабели питания: раздельные линии

Для RTX 5090 используйте три отдельных кабеля от блока питания, а не один с двумя пигтейлами. Для Pro 4500 хватит одного 8-пинового. Не подключайте обе карты к одной линии — под нагрузкой кабели начнут греться.

3 Настройка BIOS: отключаем всё лишнее

Зайдите в BIOS/UEFI и сделайте следующее:

# Не команды для терминала, а пункты меню:
1. Above 4G Decoding - Enabled
2. Resizable BAR - Enabled
3. PCIe Speed для слота Pro 4500 - Gen4 (она не поддерживает Gen5)
4. Integrated Graphics - Enabled (резерв на случай проблем)
5. Power Idle Control - Low Current Idle (снижает энергопотребление в простое)

Настройка Windows: как заставить систему видеть две карты как независимые

После установки Windows и драйверов (скачайте с сайта NVIDIA, не через GeForce Experience!) откройте Диспетчер задач → Производительность. Вы должны видеть два разных GPU: "GPU 0" и "GPU 1".

Теперь самое важное — настройка в Панели управления NVIDIA:

Откройте "Панель управления NVIDIA" → "Рабочий стол" → Добавить пункт "Запустить с графическим процессором" в контекстное меню.
Для игр: правой кнопкой по ярлыку игры → "Запустить с графическим процессором" → "Высокопроизводительный процессор NVIDIA" (это будет RTX 5090).
Для AI-приложений: создайте отдельные ярлыки для Ollama, Stable Diffusion и т.д., и в их свойствах укажите запуск на "Втором графическом процессоре NVIDIA" (Pro 4500).

💡

Хак: можно использовать утилиту NVIDIA Profile Inspector, чтобы навсегда привязать конкретные .exe файлы к определённой карте. Особенно полезно для фоновых AI-сервисов, которые запускаются как службы.

Разгон RTX 5090 для игр: безопасные лимиты

RTX Pro 4500 не разгоняется — она и так работает на пределе эффективности. А вот 5090 можно и нужно настроить.

Скачайте MSI Afterburner. Сбросьте настройки к дефолтным. Теперь:

Power Limit: 110% (если блок питания справится)
Temperature Limit: 84°C
Core Clock: +150 МГц (начинайте с +50, тестируйте в Heaven Benchmark)
Memory Clock: +1000 МГц (GDDR7 терпит, но следите за артефактами)
Кривая вентиляторов: установите 60% при 60°C, 80% при 70°C, 100% при 80°C

Запустите FurMark на 10 минут. Если нет артефактов и температура держится ниже 80°C — разгон стабилен. Если система зависает — сбросьте Core Clock на -20 МГц и тестируйте снова.

Настройка AI-стэка: Ollama, llama.cpp, Stable Diffusion

Теперь самая интересная часть — заставить AI-инструменты использовать именно RTX Pro 4500.

Для Ollama создайте или отредактируйте файл ~/.ollama/config.json:

{
  "num_gpu": 1,
  "gpu_device": 1,
  "main_gpu": 1,
  "split_mode": "layer"
}

Параметр gpu_device": 1 указывает на вторую карту (нумерация с 0).

Для llama.cpp при запуске используйте флаг:

./server -ngl 99 -c 4096 -sm 1 --gpu 1

Ключевое: --gpu 1. Это заставляет загрузку слоёв на вторую карту.

Проблема: некоторые приложения (особенно старые версии AUTOMATIC1111) могут игнорировать указания и грузиться на первую карту. Решение — временно отключить RTX 5090 в Диспетчере устройств перед запуском, затем включить обратно. Геморрой, но работает.

Энергопотребление и тепло: реальные цифры

Я замерял ваттметром. Результаты:

Простой (рабочий стол, браузер): 85-95 Вт от розетки
Игры (Cyberpunk 2077, Ultra, Path Tracing): 720-780 Вт
AI-инференс (Llama 3.1 70B, полная загрузка Pro 4500): 320-350 Вт
Игры + AI в фоне: 820-900 Вт (здесь уже важен запас БП!)

Температура в корпусе при одновременной нагрузке: под потолком (где Pro 4500) — 42°C, в зоне 5090 — 68°C. Воздушный поток критически важен — установите дополнительные вентиляторы на вдув спереди и выдув сверху.

А что насчет Linux?

В Linux всё проще и сложнее одновременно. Проще, потому что можно явно указать устройство через CUDA_VISIBLE_DEVICES=1. Сложнее, потому что драйверы для двух разных архитектур (Ada Lovelace для 5090 и Ampere для Pro 4500) могут конфликтовать.

Мой совет: если собираетесь использовать систему преимущественно для AI — ставьте Ubuntu 22.04 LTS с драйверами 550+. Создайте два отдельных окружения Conda: одно для игр (Steam, Wine), другое для AI-стэка.

Ошибки, которые сломают вашу сборку

Игнорирование расстояния между слотами. Если между картами меньше двух слотов — нижняя задохнется. Pro 4500 толстая, ей нужен воздух.
Экономия на материнской плате. Дешёвые платы дают второму слоту PCIe x4 или даже x1. Для AI это смерть — пропускная способность не потянет загрузку моделей.
Запуск AI на 5090, игр на Pro 4500. Звучит абсурдно, но люди так делают "для теста". Результат — 10 FPS и перегрев.
Отсутствие отдельной линии электропитания. Одна линия на две карты = просадки напряжения = случайные вылеты.

Альтернативы: если нет денег на RTX 5090

Схему можно адаптировать. Вместо RTX 5090 — RTX 4080 Super или даже RTX 4070 Ti Super. Вместо Pro 4500 — RTX 4060 Ti 16GB (но это уже активное охлаждение, шума будет больше). Суть не в конкретных моделях, а в принципе: мощная игровая карта + энергоэффективная карта с большим объёмом памяти для AI.

Кстати, если ваша цель — только AI и никаких игр, посмотрите мою статью про сборку на трёх RTX 3090. Там другой подход — максимум VRAM за минимальные деньги.

Итог: стоит ли игра свеч?

Стоит, если вы:

Играете в требовательные игры и одновременно хотите иметь фоновый AI-ассистент
Занимаетесь ML-разработкой, но иногда позволяете себе гейминг
Хотите тихую систему (Pro 4500 практически бесшумна)
Не боитесь возиться с настройками

Не стоит, если:

Вы играете раз в месяц, а AI-инференс запускаете на пару часов
Бюджет ограничен — лучше взять одну RTX 4090 или подождать RTX 5080
Хотите "поставил и работает" без дополнительных настроек

Мой прогноз: через год-два такая схема станет стандартом для энтузиастов. Производители материнских плат начнут делать модели с улучшенным охлаждением для двухкарточных конфигураций, а NVIDIA может даже выпустить специальный драйвер для разделения задач. Пока же приходится собирать всё руками и настраивать через костыли. Но результат — бесценен.

P.S. Если соберёте по этой инструкции — напишите в комментарии, с какими проблемами столкнулись. Самые интересные случаи разберу в отдельном посте.

RTX 5090 + RTX Pro 4500: как собрать ПК, который не сгорит от игр и не задохнется от AI