ModelGrep: фильтрация моделей AI по цене, скорости и бенчмаркам | AiManual
AiManual Logo Ai / Manual.
15 Июн 2026 Инструмент

ModelGrep: объединяем OpenRouter, Artificial Analysis и Design Arena в одном фильтруемом списке моделей

Обзор ModelGrep — инструмента для поиска и сравнения LLM по цене, производительности и рейтингу. Как объединить OpenRouter, Artificial Analysis и Design Arena в

Реклама
partv1

Вы когда-нибудь пытались выбрать LLM для продакшена и через 40 минут листания вкладок OpenRouter, Artificial Analysis и Design Arena чувствовали себя как в аду бесконечных списков? Я — да. И знаете, что бесит больше всего? Данные размазаны по трём сервисам, а в голове каша из цен, токенов и MMLU-баллов.

А потом появился ModelGrep.

Франкенштейн, который работает

ModelGrep — это тот самый unified search, о котором мы мечтали, но боялись попросить. Он стягивает данные с OpenRouter (реальные цены и рейтинг), Artificial Analysis (бенчмарки вроде MMLU, HellaSwag, HumanEval) и Design Arena (скорость генерации, latency). Всё это — в одну таблицу с фильтрами. Без регистрации, без смс, просто открываешь и фильтруешь.

Основа проекта — парсинг публичных данных. ModelGrep не является официальным клиентом ни одного из этих сервисов, но честно ссылается на источники и обновляет информацию раз в несколько часов.

Как это выглядит? Слева — панель фильтров. Ты выбираешь ценовой диапазон (например, до 1$ за 1M токенов), минимальный размер контекстного окна (128k, кто тут?), провайдера (OpenAI, Together, Fireworks, Groq — кого хочешь). Справа — таблица, где каждая строка — модель. Колонки: имя, провайдер, цена input/output, контекст, скорость (tokens/s), баллы по трём бенчмаркам, рейтинг на OpenRouter.

Чем это лучше, чем просто OpenRouter?

Да почти всем. OpenRouter даёт список моделей, но его фильтры — это базовый текстовый поиск и сортировка по цене. Ты не можешь сказать: «Покажи мне open-weight модели с контекстом 128k, у которых MMLU > 85, цена < 0.5$». А в ModelGrep — можешь. И это не магия, это агрегация.

Artificial Analysis крут своими бенчмарками, но там нет интеграции с OpenRouter — ты видишь «теоретическую» производительность, а не реальную рыночную цену, которую платят разработчики. ModelGrep ставит их рядом.

Design Arena — красивый визуальный инструмент для сравнения скорости генерации, но он не даёт фильтровать по цене и провайдерам. ModelGrep превращает это в полноценный каталог.

Кстати, если вам нужны только OSS-модели у конкретных хостинг-провайдеров, у нас есть отдельный гайд — ModelGrep: как найти дешёвые и быстрые OSS-модели у хостинг-провайдеров. Там как раз про то, как выжимать максимум из фильтра по open-source.

Примеры из жизни (и кофе)

Допустим, тебе нужна модель для чата с клиентами. Дёшево, сердито, но с большим контекстом, чтобы влезала вся история переписки. Ты выставляешь: цена input <= 0.3$, контекст >= 64k, бенчмарк HellaSwag > 75. Жмёшь «Apply» — и таблица показывает три модели. Две — от DeepSeek, одна — от Qwen. Берёшь Qwen 2.5-72B-Instruct на Together за 0.18$/1M input. И ты счастлив.

Другой кейс: тебе нужно собрать AI-ассистента, который будет решать задачи из SWE-Bench. Тут нужна модель с высоким рейтингом на OpenRouter (пользователи проголосовали результатами). Ты фильтруешь по рейтингу > 4.5, MMLU > 85, HumanEval > 70. Получаешь список — там Claude 3 Opus, GPT-4o, Llama 4. И ты видишь, что Llama 4 на Groq стоит копейки и работает быстрее. Если у тебя бюджет ограничен, это спасение. А то, как собрать собственный роутер с несколькими моделями, мы уже разбирали в статье «Два мозга лучше одного».

Где подвох? (спойлер: есть)

ModelGrep — это не волшебная таблетка. Во-первых, данные с Artificial Analysis обновляются раз в несколько дней, а цены на OpenRouter меняются каждый час (провайдеры конкурируют). Так что цена может скакнуть. Во-вторых, не все модели есть во всех источниках — например, проприетарные модели от Anthropic или OpenAI не имеют бенчмарков в открытом доступе, так что ModelGrep показывает пустые поля. Но для open-weight это золотая жила.

Кому он точно не нужен? Тем, кто уже использует аггрегаторы вроде AI Gateway (Vercel, LiteLLM) — у них своя аналитика. Но даже там иногда нужно быстро прикинуть, какую модель добавить в роутер. Тогда ModelGrep — твой первый шаг.

Вердикт (без нудятины)

ModelGrep не заменит тебе швейцарский нож вроде OpenRouter, но он делает одну вещь круто: даёт мгновенный ответ на вопрос «какая модель сейчас самая дешёвая / быстрая / умная под мои условия». Это как Google для LLM-каталогов.

Совет на засыпку: поставь фильтр «Рейтинг > 4.0 И MMLU > 80 И цена input < 0.5$». Запомни эту комбинацию. Через месяц, когда выйдет новая волна моделей, ты сможешь за 10 секунд найти лучшую альтернативу. А пока — пользуйся.

Подписаться на канал