Инструменты для работы с AI

O

OpenSeeker-v2: открытый Deep Research агент, который выучили на 10 000 примерах без RL — и это работает

OpenSeeker-v2 — открытый агент для глубокого поиска, обученный на 10 600 синтетических примерах без RL. Сравнение с OpenAI, установка и примеры использования.

Обзор

u

useknockout: бесплатная open-source альтернатива remove.bg и Topaz с удалением фона, апскейлом и реставрацией лиц — деплой на Modal за одну команду

Обзор бесплатного инструмента useknockout для удаления фона, апскейла и реставрации лиц. Сравнение с remove.bg и Topaz, деплой на Modal одной командой. Кому под

Обзор

Z

ZAYA1-8B: Первая крупная LLM на железе AMD — что она умеет и стоит ли качать

ZAYA1-8B — frontier 8B модель, обученная на GPU AMD. Разбираемся с возможностями, запускаем локально и сравниваем с Llama 3, Qwen 2.5 и Gemma 4.

Обзор

G

Gemma 4 26B на двух машинах: Decoupled Attention с помощью Larql для обхода лимитов локальной памяти

Как запустить Gemma 4 26B на двух слабых GPU с помощью Larql и техники Decoupled Attention. Рабочий код, сравнение с альтернативами, пример конфигурации.

Обзор

M

Multi-Token Prediction на Qwen3-27B: ускорение в 2.5x с Unsloth UD XL и квантованными GGUFs

Как запустить Multi-Token Prediction на Qwen3-27B с Unsloth UD XL и получить 2.5x прироста скорости. Инструкция, бенчмарки, сравнение с vLLM и llama.cpp.

Обзор

F

FSRS для Obsidian: как забывать реже, а учиться — в своем хранилище

Обзор плагина FSRS для Obsidian: алгоритм нового поколения, до 30% меньше повторений, все данные в .md файлах. Сравнение с Anki и RemNote.

Обзор

S

Solidity LM на основе Qwen 3.6 превзошёл Opus: как запустить модель 27B для смарт-контрактов

Новинка: Solidity LM на Qwen 3.6 - 27B модель обходит Opus. Гайд по запуску, сравнение с альтернативами и примеры для разработчиков смарт-контрактов.

Обзор

S

SocratiCode: MCP-сервер, который научит ИИ-агента шарить в вашем коде

Обзор SocratiCode — open-source MCP-сервера для семантического поиска по коду. AST-чанкинг, гибридный search (Qdrant + Ollama), сравнение с Ragex и Code-memory.

Обзор

C

CopilotKit и AG-UI: как интегрировать AI-агентов в UI с открытым протоколом

Разбираем CopilotKit и AG-UI — связку для встраивания AI-агентов в интерфейсы. Streaming, state sharing, человеко-в-цикле. Сравнение с альтернативами и примеры

Обзор

V

VibeVoice.cpp: Microsoft VibeVoice на стероидах — локальный speech-to-speech без Python и облаков

Запускаем VibeVoice.cpp — порт Microsoft VibeVoice на ggml/C++ с поддержкой CPU, CUDA, Metal, Vulkan. Без Python, с квантованием и voice cloning. Сравнение с ал

Обзор

M

MTPLX: ускорение инференса на Apple Silicon в 2.24 раза — обзор нового MTP-движка

Разбор MTPLX — нативного MTP-движка для Apple Silicon, который ускоряет инференс в 2.24 раза. Бенчмарки, сравнение с llama.cpp и mlx-lm, примеры запуска на M5 M

Обзор

F

FastDMS: как сжать KV-cache в 6 раз и ускорить инференс — обзор открытой реализации и бенчмарков

Разбор открытой реализации Dynamic Memory Sparsification (FastDMS): сжатие KV-cache в 6 раз, ускорение инференса на 30% против vLLM. Примеры, бенчмарки, сравнен

Обзор