Инструменты для работы с AI

M

MiroThinker-1.7: открытый deep research агент на Qwen3 MoE (3B активных) — запуск на потребительском железе

MiroThinker-1.7 — первый открытый deep research агент с 3B активных параметров на базе Qwen3 MoE. Запускается на RTX 3090/4090 и MacBook. Обзор, сравнение, прим

Обзор

H

Hexllama: GUI-менеджер шаблонов для llama.cpp — больше никаких простыней из флагов

Как Hexllama спасает от зубодробительных CLI-команд llama.cpp. Разбор возможностей, сравнение с аналогами, примеры настройки. Кому реально нужен этот GUI.

Обзор

A

Abliterlitics: как сравнить 5 методов аблайтерации Qwen3.6-27B с помощью бенчмарков и анализа весов

Открытый инструмент Abliterlitics для объективного сравнения 5 методов снятия цензуры на Qwen3.6-27B: бенчмарки, тесты безопасности, анализ весов. Экономит GPU-

Обзор

T

TRL v1.0: 75 методов пост-тренинга в одной библиотеке — как Hugging Face сломала старые шаблоны

TRL v1.0 от Hugging Face: 75+ методов пост-тренинга LLM, новая архитектура, примеры DPO/ORPO, сравнение с альтернативами. Кому подходит?

Обзор

G

Gemma 4: почему Google наконец-то сделала open-source модель, которую стоит запускать локально

Google выпустила Gemma 4 под Apache 2.0: мультимодальная модель для аудио, изображений и текста. Интеграция с llama.cpp, MLX, WebGPU. Что умеет и кому подойдет?

Обзор

O

OpenReader: твой личный сервер для чтения документов вслух (и это open-source)

Установи OpenReader на свой сервер: читай EPUB, PDF, DOCX с синхронной подсветкой и TTS. Скачай аудиокнигу локально. Бесплатно, без облаков.

Обзор

B

Build your own Clawdmeter: Как я собрал десктопный дашборд для токенов Claude Code и перестал просыпаться в холодном поту

Пошаговое руководство по сборке физического дашборда для мониторинга расхода токенов Claude Code в реальном времени. Сравнение с софтверными решениями, примеры

Обзор

S

StRuCom: датасет, который научит LLM писать докстринги по-русски (и это не шутка)

Датасет StRuCom решает проблему русскоязычной документации кода. Сравнение с CodeSearchNet, примеры дообучения модели и инструкция по применению.

Обзор

M

MTP merging в llama.cpp: как ускорение мульти-токен предикшена изменит локальный инференс

Разбираемся, как слияние PR Multi-Token Prediction в llama.cpp ускоряет генерацию на 30-50% и меняет правила игры для локальных LLM.

Обзор

A

Axera AX650N на стероидах: как китайский SoC за $100 уделывает Jetson в YOLO, Depth Anything и Qwen3

Полный бенчмарк платы MaiX4 Hat на Axera AX650N: 36.8 TOPS NPU, YOLOv12 (140 fps), Depth Anything v3 (87 fps), Qwen3-1.8B (23 tok/s). Сравнение с Jetson Orin Na

Обзор

W

Waypoint-1.5: интерактивные миры на обычных GPU – обзор и запуск на RTX 3090-5090

Полный обзор Waypoint-1.5 — модели, превращающей текст в интерактивные 3D-миры на потребительских GPU. Тесты на RTX 3090, 4090, 5090, сравнение с аналогами, инс

Обзор

G

Grapheteria и другие: обзор опенсорсных GUI для управления AI-агентами

Обзор Grapheteria — визуального конструктора агентов с MCP-серверами. Сравнение с Agno, AgentCommander, OpenAgent и UI-TARS. Кому подойдут и как упрощают жизнь.

Обзор