Инструменты
Подборка AI-инструментов. Только то, что работает.
Antigravity 2.0 от Google: как создавать агентные пайплайны с новым CLI, SDK и десктоп-приложением
Разбираем Antigravity 2.0: оркестрация суб-агентов, миграция с Gemini CLI, интеграция с AI Studio и десктоп-клиент. Альтернатива Cursor для сложных рабочих проц
CodeGraph: как сократить API-вызовы к LLM на 94% и не разориться на Claude
Обзор репозитория CodeGraph: локальная оптимизация запросов к LLM, снижение затрат на Claude и Cursor до 94% без потери качества. Примеры и сравнение.
Android CLI 1.0: железный занавес для AI-агентов или новая суперсила разработчика?
Разбираем Android CLI 1.0 — утилиту для интеграции AI-агентов (Claude, Codex, Gemini) в разработку Android-приложений. Команды, сравнение с альтернативами, реал
Ettin Reranker Family: дерзкий open-source, который уложил на лопатки Cohere и BGE
Обзор Ettin Reranker: 6 моделей на ModernBERT, рекорды MTEB, открытая рецептура. Примеры интеграции с Sentence Transformers, сравнение с альтернативами, кому по
ByteDance выпустила 3B open-source модель: обзор возможностей и тесты производительности
ByteDance представила 3B модель с впечатляющей производительностью для своего размера. Обзор возможностей, тесты и сравнение с аналогами.
Как маленькая модель за $1000 обходит Llama 3.2 3B: разбор HRM-Text 1B
Модель HRM-Text 1B обучена всего за $1000 на 40B токенов и превосходит Llama 3.2 3B в математике и понимании текста. Разбираем, как это стало возможным.
Как использовать Pollux: LLM-судья для оценки русских языковых моделей [открытый код от Sber AI]
Открытый инструмент Pollux от Sber AI для объективной оценки русскоязычных LLM. Разбор возможностей, примеры кода и сравнение с альтернативами.
Кастомная сборка llama.cpp для RDNA2: включаем flash attention и получаем 80 ток/с на Qwen3.6 35B
Пошаговый гайд по сборке llama.cpp с flash attention для RDNA2. Тесты на Qwen3.6 35B показали прирост с 30 до 80 ток/с. Подходит для RX 6800/6900 XT.
PaddleOCR 3.5: как запустить OCR и парсинг документов с бэкендом Transformers
Обзор PaddleOCR 3.5 с поддержкой Transformers backend. Как настроить, сравнение с EasyOCR и Tesseract, примеры парсинга документов на Python.
Google Cloud Agent Gateway: внешний контур безопасности для AI-агентов — архитектура и реальные кейсы
Разбираем архитектуру Agent Gateway от Google Cloud - внешний уровень защиты, не зависящий от промптов. Сравнение с альтернативами, примеры внедрения и советы д
ICM: Память для AI-агентов, которую можно пощупать локально и без компромиссов
Обзор открытого инструмента ICM для долговременной памяти AI-агентов. Локальные бенчмарки, сравнение с Zep и Widemem, примеры кода. Кому подойдет и как внедрить
Как построить агента, создающего агентов: разбор реализации на Python с Qwen3.6 35b
Разбор кода агента на чистом Python, который генерирует других агентов. Работа с Qwen3.6 35b в квантовании Q8_0, MTP, примеры и сравнение с альтернативами.