NeMo Retriever: агентский пайплайн NVIDIA лидирует в семантическом поиске | 13.03.2026

Когда ретривер перестал быть просто собакой

NVIDIA снова сделала то, что все ждали, но не ожидали, что это будет так быстро. Их NeMo Retriever - не просто еще один инструмент для семантического поиска. Это агентский пайплайн, который на прошлой неделе занял первые строчки на ViDoRe и BRIGHT лидербордах. И да, это меняет правила игры.

ViDoRe (Video Document Retrieval) и BRIGHT - это два ключевых бенчмарка для оценки семантического поиска, особенно в мультимодальных и сложных запросах. Победа здесь - это как выиграть Олимпиаду для поисковых систем.

Агентский пайплайн: не просто поиск, а расследование

В отличие от традиционных RAG-систем, которые просто находят похожие куски текста, NeMo Retriever использует многоэтапный агентский подход. Он не ищет - он расследует. Сначала анализирует запрос, определяет контекст, затем итеративно уточняет поиск, используя несколько моделей и стратегий.

Если вы думали, что NeMo Agent Toolkit был крут, то Retriever - это его злая, более умная версия. Он интегрируется с последними моделями, такими как Nemotron 3, о которой мы писали здесь.

Лидерборды пали: ViDoRe и BRIGHT сдались

На ViDoRe leaderboard NeMo Retriever показал точность 94.3% в поиске по видео-документам, обогнав предыдущего лидера на 5.7%. На BRIGHT, который специализируется на сложных, многошаговых запросах, он достиг 89.1% точности. Цифры скучные, но смысл в том, что теперь семантический поиск может работать с реально сложными запросах, а не только с "найди мне похожие предложения".

Лидерборд	Точность NeMo Retriever	Предыдущий лидер
ViDoRe	94.3%	88.6% (Google's Multimodal Retriever)
BRIGHT	89.1%	84.2% (DeepMind's AlphaSearch)

Что внутри у этого монстра?

Архитектура? Многослойная. NeMo Retriever использует гибридный подход: традиционные методы поиска (вроде BM25) для начального отбора, затем нейросетевые ранкеры для уточнения, и наконец, агентский модуль, который принимает решения о том, что делать дальше. Этот агентский модуль - ключевое отличие. Он может решить, что нужно переформулировать запрос, обратиться к другому источнику, или даже сгенерировать промежуточный ответ для уточнения.

И да, он использует последние модели NVIDIA, обученные на огромных датасетах. Мы говорим о версиях, выпущенных в начале 2026 года, с оптимизациями для аппаратного ускорения на GPU NVIDIA.

💡

Агентский пайплайн в NeMo Retriever автоматически решает, когда использовать семантический поиск, а когда - ключевые слова. Это уменьшает ошибки в сложных запросах, где контекст меняется.

Зачем это вам? (Спойлер: ваш RAG плачет)

Если вы разрабатываете RAG-системы, то знаете, что они часто тупят на сложных запросах. NeMo Retriever решает эту проблему, но требует больше ресурсов. Однако, учитывая рост производительности GPU, это не такая уж и проблема.

Корпоративные ИИ-агенты, как те, что построил Яндекс, могут значительно выиграть от такого подхода. Или ваш домашний исследовательский агент, если вы используете Swarmcore.

Но самое главное - скорость. Несмотря на сложность, NeMo Retriever оптимизирован для низкой задержки. В сравнении с другими системами, он показывает время ответа около 700 мс для сложных запросов, что близко к тому, о чем мы писали в статье про поиск для AI-агентов.

Что дальше? Прогноз от инсайдеров

NVIDIA явно делает ставку на агентский ИИ. NeMo Retriever - только часть большой экосистемы. Ожидайте, что в ближайшие месяцы мы увидим интеграцию с еще более мощными моделями и, возможно, открытые версии для сообщества.

Совет? Если вы работаете в области поиска или RAG, начните экспериментировать с NeMo Retriever сейчас. Да, он требует GPU, но результаты того стоят. И не забудьте про практическое руководство по NeMo Agent Toolkit, чтобы понять основы.

А тем, кто все еще использует старые методы поиска, пора проснуться. Семантический поиск стал умнее, быстрее и агентнее. И это только начало.

Подписаться на канал

NVIDIA NeMo Retriever перевернул семантический поиск: агентский пайплайн бьет рекорды на лидербордах