Кто сказал, что монополию NVIDIA не сломать?
Ещё вчера все думали, что Дженсен Хуанг - непогрешимый король AI-железа. Сегодня Amazon тихо, но уверенно переписывает правила игры. Не тренировкой моделей - здесь NVIDIA все ещё сильна - а инференсом. Той самой частью, где модели работают на вас, отвечая на вопросы, генерируя текст и изображения.
Данные на март 2026: AWS генерирует $142 млрд доходов от AI-сервисов, в то время как NVIDIA фиксирует первое падение продаж чипов для дата-центров за последние три года. Цифры говорят сами за себя.
Разделённое железо - не роскошь, а необходимость
Идея проста: учить модель и запускать её - две разные задачи. Требуются разные чипы. NVIDIA десятилетиями продавала универсальные GPU, отлично справляющиеся с обоими задачами. Но универсальность - это компромисс. Дорогой компромисс.
Amazon, Microsoft, Google это поняли. И бросились создавать специализированные чипы для инференса. Trainium от Amazon для обучения, Inferentia 2 (актуальный на 2026 год) для инференса. Microsoft Maia 200, о котором мы уже писали, - чисто инференсный чип, оптимизированный под облако Azure.
Почему Amazon побеждает в этой гонке?
Они контролируют и железо, и облако. Чипы Trainium 2 и Inferentia 2 разработаны специально для AWS. Они интегрированы в экосистему так плотно, что перейти на другого облачного провайдера - значит потерять все преимущества.
NVIDIA пытается ответить. Их чипы Vera Rubin (анонс 2025 года), обещают быть эффективнее в инференсе. Но они по-прежнему универсальны. И дороги. Очень дороги. Ценник кусается, даже для крупных игроков.
Внимание: если вы стартап, планирующий развернуть AI-сервис, считайте не только стоимость обучения, но и инференса. Здесь облака с собственными чипами могут сэкономить до 60%.
Что это значит для рынка?
Во-первых, сегментация. Появятся компании, которые будут фокусироваться только на инференсе. Как Cerebras, которая получила $10 млрд от OpenAI именно за инференсные решения.
Во-вторых, падение цен. Специализированные чипы дешевле в производстве и эксплуатации. Это снизит стоимость AI-сервисов для конечных пользователей.
В-третьих, новая волна инноваций. Когда инференс станет дешёвым, появятся приложения, которые сегодня экономически невыгодны. Реальный AI в каждом приложении, на каждом сайте.
| Игрок | Чип для инференса (актуально на 2026) | Ключевое преимущество | Недостаток |
|---|---|---|---|
| Amazon AWS | Inferentia 2 | Глубокая интеграция с AWS, низкая стоимость запроса | Привязка к экосистеме AWS |
| Microsoft Azure | Maia 200 | Оптимизация под модели OpenAI | Ограниченная доступность |
| NVIDIA | Vera Rubin | Универсальность, поддержка CUDA | Высокая цена, энергопотребление |
| Cerebras | CS-3 | Огромная производительность для крупных моделей | Очень нишевый, дорогой |
А что с пузырём?
Некоторые кричат о AI-пузыре 2026. Падение акций NVIDIA и Oracle - признак коррекции, а не краха. Рынок просто переоценивает, кто сколько заработает на AI. И сейчас деньги начинают течь к тем, кто контролирует инференс - точку контакта с пользователем.
Nvidia пытается адаптироваться. Их инвестиции в open-weight модели на $26 млрд - попытка создать спрос на свои железо везде, даже на edge-устройствах. Но это долгая игра.
Итог: кому готовиться к переменам?
Разработчикам: учитесь оптимизировать модели под разные железки. Универсальный код на CUDA - уже не панацея.
Стартапам: считайте TCO (total cost of ownership) внимательнее. Облако с собственными чипами может быть выгоднее, даже если обучение дороже.
Инвесторам: смотрите не на тех, кто делает самые мощные чипы, а на тех, кто контролирует инфраструктуру инференса. AWS, Azure, Google Cloud - они будут забирать всё большую долю пирога.
И да, NVIDIA не умрёт. Но её доля рынка в инференсе будет сокращаться. Как говорится, король умер, да здравствует король? Нет. Просто трон теперь разделён.
P.S. Если вы до сих пор верите, что NVIDIA будет доминировать вечно, посмотрите на её политику предоплаты для Китая. Это признак отчаяния, а не силы.