Инструменты для работы с AI

M

Mistral 3: когда французы перестали скромничать

Полный разбор Mistral 3 от Mistral AI: где скачать модели на HuggingFace, как работает архитектура, сравнение с Llama 3.3 и Gemini.

Обзор

S

Step-Audio-R1.1: модель, которая слышит и думает как человек (и обходит Grok)

Как использовать Step-Audio-R1.1 — open-source модель, которая установила рекорд на Speech Reasoning бенчмарке. Полный код на HuggingFace.

Обзор

M

Mistral Ministral 3: обзор компактных моделей 3B, 8B, 14B и инструкция по запуску

Разбираем новое семейство компактных LLM от Mistral AI. Характеристики, сравнение с аналогами и пошаговая инструкция по локальному запуску на слабом железе.

Обзор

U

Unslopper-30B: как отмыть AI-текст от штампов и сделать его человеческим

Как использовать модель Unslopper-30B для удаления AI-сленга и штампов из сгенерированного текста. Установка, примеры, сравнение с альтернативами.

Обзор

A

AI Model Tracker: Когда моделей слишком много и все они забываются

Обзор и установка AI Model Tracker - инструмента для отслеживания локальных LLM моделей. Управляйте версиями, сравнивайте производительность и не теряйте файлы.

Обзор

S

Soprano 1.1-80M: как новая TTS модель победила галлюцинации и улучшила качество звука — обзор и сравнение

Soprano 1.1-80M сократила галлюцинации на 95% и получила +63% предпочтений. Обзор возможностей, сравнение с другими TTS и тест на Hugging Face.

Обзор

N

NeuTTS Nano: голос для робота, который помещается в карман

Обзор NeuTTS Nano — сверхкомпактной TTS модели на Llama3. Тесты на Raspberry Pi 5 и Jetson Nano, сравнение с Pocket TTS и Sonya TTS, клонирование голоса.

Обзор

К

Клонируем Claude Cowork: open-source альтернатива на MiniMax M2.1 для локального запуска

Полный гайд по созданию бесплатной локальной версии Claude Cowork на базе MiniMax M2.1 с оптимизацией для Apple Silicon

Обзор

T

Train LoRA поверх GGUF: инструкция по экономии VRAM и обходу bnb

Гайд по тонкой настройке LoRA поверх квантованных GGUF моделей. Экономия VRAM, обучение Qwen-30B на 16 ГБ вместо 24 ГБ. Альтернатива стандартному подходу.

Обзор

R

Real-Time Bidding для AI: открытый репозиторий с датасетом, симулятором и RL-агентами

Обзор открытого инструмента для Real-Time Bidding с reinforcement learning: датасет, симулятор аукционов и готовые RL-агенты для онлайн-рекламы

Обзор

Z

ZLUDA для llama.cpp: ускорение LLM на AMD GPU без переписывания кода

ZLUDA позволяет запускать оптимизированный под CUDA код llama.cpp на видеокартах AMD. Обзор, сравнение с Vulkan и ROCm, примеры использования.

Обзор

P

Pocket TTS: легкая 100M-параметровая модель, которая помещается в карман и работает без GPU

Обзор Pocket TTS - 100M-параметровой модели для локального синтеза речи. Сравнение с Coqui TTS, установка через Hugging Face и примеры использования.

Обзор