Инструменты для работы с AI

R

RTX PRO 4000 Blackwell в SFF-корпусе: как запихнуть 48 ГБ VRAM в коробку из-под обуви и не сжечь квартиру

Практический гайд по установке RTX PRO 4000 Blackwell в SFF-ПК, настройка llama-server с CUDA и Vulkan, оптимизация VRAM под большие LLM модели.

Обзор

F

FP8 на RTX 3090: самодельный Torch-экстеншен для экономии VRAM

Как заставить RTX 3090 работать с FP8 без аппаратной поддержки. Самодельный Torch-экстеншен, экономия VRAM и ускорение инференса LLM на старом железе.

Обзор

C

CompactAI: Автоматический fine-tuning LLM за 5 минут или пустая трата времени?

Как работает CompactAI для автоматического fine-tuning моделей, сравнение с альтернативами и стоит ли использовать в 2026 году.

Обзор

P

PassLLM: когда нейросеть угадывает ваш пароль с первой попытки

Обзор PassLLM - самого точного AI-угадывателя паролей. Как установить локально, примеры работы, сравнение с альтернативами и этические границы использования в 2

Обзор

К

Как сделать автоматические субтитры для видео локально в браузере: Parakeet и SileroVAD

Автоматические субтитры для видео в браузере: Parakeet и SileroVAD

Обзор

R

R3-Engine: 1.58-битный LLM-движок на Rust, который ломает мозг и AVX-512

Технический разбор R3-Engine: как работает 1.58-битное квантование BitNet b1.58 на Rust с AVX-512, проблема активации SiLU и сравнение с llama.cpp.

Обзор

V

Vallignus: как создать супервизор для локальных AI-агентов (CrewAI/AutoGen) и остановить бесконечные циклы

Инструмент Vallignus решает проблему бесконечных циклов локальных AI-агентов. Настройка мониторинга, ограничение времени выполнения, безопасное завершение проце

Обзор

C

ClaraVerse vs n8n/Zapier: как создать локальную AI-автоматизацию с 50+ интеграциями

Сравнение ClaraVerse с n8n и Zapier. Создаем локальные AI-воркфлоу с 50+ интеграциями. CLI, API из workflow, приватность данных.

Обзор

Л

Локальный AI-агент для автотестирования чат-ботов: собираем стенд на GPT-OSS 20B и Agno

Пошаговое руководство по настройке 100% локального AI-агента для автотестирования чат-ботов. GPT-OSS 20B, фреймворк Agno и llama.cpp сервер.

Обзор

M

Multi-Head Latent Attention: как DeepSeek переизобрела механизм внимания и почему это работает быстрее

Полный разбор Multi-Head Latent Attention от DeepSeek с кодом на PyTorch. Оптимизации KV-cache, сравнение с MHA/GQA/MQA и практическая реализация.

Обзор

Z

Zerotap: Android превращается в автономный AI-ассистент с контролем экрана

Обзор Zerotap: как превратить Android в приватного AI-ассистента с поддержкой Ollama, контролем экрана и MCP серверами. Полная автономность и приватность.

Обзор

T

TrustifAI: как оценить доверие к ответам LLM и отладить галлюцинации в RAG-системах

Глубокий разбор TrustifAI: метрики Evidence Coverage, Semantic Drift, Trust Score и визуализации Reasoning Graphs для отладки RAG-систем. Сравнение с альтернати

Обзор