Инструменты для работы с AI

A

Antigravity 2.0 от Google: как создавать агентные пайплайны с новым CLI, SDK и десктоп-приложением

Разбираем Antigravity 2.0: оркестрация суб-агентов, миграция с Gemini CLI, интеграция с AI Studio и десктоп-клиент. Альтернатива Cursor для сложных рабочих проц

Обзор

C

CodeGraph: как сократить API-вызовы к LLM на 94% и не разориться на Claude

Обзор репозитория CodeGraph: локальная оптимизация запросов к LLM, снижение затрат на Claude и Cursor до 94% без потери качества. Примеры и сравнение.

Обзор

A

Android CLI 1.0: железный занавес для AI-агентов или новая суперсила разработчика?

Разбираем Android CLI 1.0 — утилиту для интеграции AI-агентов (Claude, Codex, Gemini) в разработку Android-приложений. Команды, сравнение с альтернативами, реал

Обзор

E

Ettin Reranker Family: дерзкий open-source, который уложил на лопатки Cohere и BGE

Обзор Ettin Reranker: 6 моделей на ModernBERT, рекорды MTEB, открытая рецептура. Примеры интеграции с Sentence Transformers, сравнение с альтернативами, кому по

Обзор

B

ByteDance выпустила 3B open-source модель: обзор возможностей и тесты производительности

ByteDance представила 3B модель с впечатляющей производительностью для своего размера. Обзор возможностей, тесты и сравнение с аналогами.

Обзор

К

Как маленькая модель за $1000 обходит Llama 3.2 3B: разбор HRM-Text 1B

Модель HRM-Text 1B обучена всего за $1000 на 40B токенов и превосходит Llama 3.2 3B в математике и понимании текста. Разбираем, как это стало возможным.

Обзор

К

Как использовать Pollux: LLM-судья для оценки русских языковых моделей [открытый код от Sber AI]

Открытый инструмент Pollux от Sber AI для объективной оценки русскоязычных LLM. Разбор возможностей, примеры кода и сравнение с альтернативами.

Обзор

К

Кастомная сборка llama.cpp для RDNA2: включаем flash attention и получаем 80 ток/с на Qwen3.6 35B

Пошаговый гайд по сборке llama.cpp с flash attention для RDNA2. Тесты на Qwen3.6 35B показали прирост с 30 до 80 ток/с. Подходит для RX 6800/6900 XT.

Обзор

P

PaddleOCR 3.5: как запустить OCR и парсинг документов с бэкендом Transformers

Обзор PaddleOCR 3.5 с поддержкой Transformers backend. Как настроить, сравнение с EasyOCR и Tesseract, примеры парсинга документов на Python.

Обзор

G

Google Cloud Agent Gateway: внешний контур безопасности для AI-агентов — архитектура и реальные кейсы

Разбираем архитектуру Agent Gateway от Google Cloud - внешний уровень защиты, не зависящий от промптов. Сравнение с альтернативами, примеры внедрения и советы д

Обзор

I

ICM: Память для AI-агентов, которую можно пощупать локально и без компромиссов

Обзор открытого инструмента ICM для долговременной памяти AI-агентов. Локальные бенчмарки, сравнение с Zep и Widemem, примеры кода. Кому подойдет и как внедрить

Обзор

К

Как построить агента, создающего агентов: разбор реализации на Python с Qwen3.6 35b

Разбор кода агента на чистом Python, который генерирует других агентов. Работа с Qwen3.6 35b в квантовании Q8_0, MTP, примеры и сравнение с альтернативами.

Обзор