Инструменты
Подборка AI-инструментов. Только то, что работает.
MiroThinker-1.7: открытый deep research агент на Qwen3 MoE (3B активных) — запуск на потребительском железе
MiroThinker-1.7 — первый открытый deep research агент с 3B активных параметров на базе Qwen3 MoE. Запускается на RTX 3090/4090 и MacBook. Обзор, сравнение, прим
Hexllama: GUI-менеджер шаблонов для llama.cpp — больше никаких простыней из флагов
Как Hexllama спасает от зубодробительных CLI-команд llama.cpp. Разбор возможностей, сравнение с аналогами, примеры настройки. Кому реально нужен этот GUI.
Abliterlitics: как сравнить 5 методов аблайтерации Qwen3.6-27B с помощью бенчмарков и анализа весов
Открытый инструмент Abliterlitics для объективного сравнения 5 методов снятия цензуры на Qwen3.6-27B: бенчмарки, тесты безопасности, анализ весов. Экономит GPU-
TRL v1.0: 75 методов пост-тренинга в одной библиотеке — как Hugging Face сломала старые шаблоны
TRL v1.0 от Hugging Face: 75+ методов пост-тренинга LLM, новая архитектура, примеры DPO/ORPO, сравнение с альтернативами. Кому подходит?
Gemma 4: почему Google наконец-то сделала open-source модель, которую стоит запускать локально
Google выпустила Gemma 4 под Apache 2.0: мультимодальная модель для аудио, изображений и текста. Интеграция с llama.cpp, MLX, WebGPU. Что умеет и кому подойдет?
OpenReader: твой личный сервер для чтения документов вслух (и это open-source)
Установи OpenReader на свой сервер: читай EPUB, PDF, DOCX с синхронной подсветкой и TTS. Скачай аудиокнигу локально. Бесплатно, без облаков.
Build your own Clawdmeter: Как я собрал десктопный дашборд для токенов Claude Code и перестал просыпаться в холодном поту
Пошаговое руководство по сборке физического дашборда для мониторинга расхода токенов Claude Code в реальном времени. Сравнение с софтверными решениями, примеры
StRuCom: датасет, который научит LLM писать докстринги по-русски (и это не шутка)
Датасет StRuCom решает проблему русскоязычной документации кода. Сравнение с CodeSearchNet, примеры дообучения модели и инструкция по применению.
MTP merging в llama.cpp: как ускорение мульти-токен предикшена изменит локальный инференс
Разбираемся, как слияние PR Multi-Token Prediction в llama.cpp ускоряет генерацию на 30-50% и меняет правила игры для локальных LLM.
Axera AX650N на стероидах: как китайский SoC за $100 уделывает Jetson в YOLO, Depth Anything и Qwen3
Полный бенчмарк платы MaiX4 Hat на Axera AX650N: 36.8 TOPS NPU, YOLOv12 (140 fps), Depth Anything v3 (87 fps), Qwen3-1.8B (23 tok/s). Сравнение с Jetson Orin Na
Waypoint-1.5: интерактивные миры на обычных GPU – обзор и запуск на RTX 3090-5090
Полный обзор Waypoint-1.5 — модели, превращающей текст в интерактивные 3D-миры на потребительских GPU. Тесты на RTX 3090, 4090, 5090, сравнение с аналогами, инс
Grapheteria и другие: обзор опенсорсных GUI для управления AI-агентами
Обзор Grapheteria — визуального конструктора агентов с MCP-серверами. Сравнение с Agno, AgentCommander, OpenAgent и UI-TARS. Кому подойдут и как упрощают жизнь.