Инструменты
Подборка AI-инструментов. Только то, что работает.
OpenSeeker-v2: открытый Deep Research агент, который выучили на 10 000 примерах без RL — и это работает
OpenSeeker-v2 — открытый агент для глубокого поиска, обученный на 10 600 синтетических примерах без RL. Сравнение с OpenAI, установка и примеры использования.
useknockout: бесплатная open-source альтернатива remove.bg и Topaz с удалением фона, апскейлом и реставрацией лиц — деплой на Modal за одну команду
Обзор бесплатного инструмента useknockout для удаления фона, апскейла и реставрации лиц. Сравнение с remove.bg и Topaz, деплой на Modal одной командой. Кому под
ZAYA1-8B: Первая крупная LLM на железе AMD — что она умеет и стоит ли качать
ZAYA1-8B — frontier 8B модель, обученная на GPU AMD. Разбираемся с возможностями, запускаем локально и сравниваем с Llama 3, Qwen 2.5 и Gemma 4.
Gemma 4 26B на двух машинах: Decoupled Attention с помощью Larql для обхода лимитов локальной памяти
Как запустить Gemma 4 26B на двух слабых GPU с помощью Larql и техники Decoupled Attention. Рабочий код, сравнение с альтернативами, пример конфигурации.
Multi-Token Prediction на Qwen3-27B: ускорение в 2.5x с Unsloth UD XL и квантованными GGUFs
Как запустить Multi-Token Prediction на Qwen3-27B с Unsloth UD XL и получить 2.5x прироста скорости. Инструкция, бенчмарки, сравнение с vLLM и llama.cpp.
FSRS для Obsidian: как забывать реже, а учиться — в своем хранилище
Обзор плагина FSRS для Obsidian: алгоритм нового поколения, до 30% меньше повторений, все данные в .md файлах. Сравнение с Anki и RemNote.
Solidity LM на основе Qwen 3.6 превзошёл Opus: как запустить модель 27B для смарт-контрактов
Новинка: Solidity LM на Qwen 3.6 - 27B модель обходит Opus. Гайд по запуску, сравнение с альтернативами и примеры для разработчиков смарт-контрактов.
SocratiCode: MCP-сервер, который научит ИИ-агента шарить в вашем коде
Обзор SocratiCode — open-source MCP-сервера для семантического поиска по коду. AST-чанкинг, гибридный search (Qdrant + Ollama), сравнение с Ragex и Code-memory.
CopilotKit и AG-UI: как интегрировать AI-агентов в UI с открытым протоколом
Разбираем CopilotKit и AG-UI — связку для встраивания AI-агентов в интерфейсы. Streaming, state sharing, человеко-в-цикле. Сравнение с альтернативами и примеры
VibeVoice.cpp: Microsoft VibeVoice на стероидах — локальный speech-to-speech без Python и облаков
Запускаем VibeVoice.cpp — порт Microsoft VibeVoice на ggml/C++ с поддержкой CPU, CUDA, Metal, Vulkan. Без Python, с квантованием и voice cloning. Сравнение с ал
MTPLX: ускорение инференса на Apple Silicon в 2.24 раза — обзор нового MTP-движка
Разбор MTPLX — нативного MTP-движка для Apple Silicon, который ускоряет инференс в 2.24 раза. Бенчмарки, сравнение с llama.cpp и mlx-lm, примеры запуска на M5 M
FastDMS: как сжать KV-cache в 6 раз и ускорить инференс — обзор открытой реализации и бенчмарков
Разбор открытой реализации Dynamic Memory Sparsification (FastDMS): сжатие KV-cache в 6 раз, ускорение инференса на 30% против vLLM. Примеры, бенчмарки, сравнен