Инструменты для работы с AI

U

Unsloth для эмбеддингов: инструкция по тонкой настройке EmbeddingGemma и Qwen3 в 3 раза быстрее

Практическое руководство по тонкой настройке EmbeddingGemma, Qwen3 Embedding и BGE M3 с ускорением до 3.3x и экономией VRAM через Unsloth. Готовые ноутбуки, инт

Обзор

Q

Qwen3-TTS: полный гайд по запуску открытых моделей для синтеза, дизайна и клонирования голоса на 10 языках

Полное руководство по Qwen3-TTS. Установка, сравнение моделей VoiceDesign и CustomVoice, примеры кода для синтеза и клонирования голоса на русском и других язык

Обзор

A

ABC-Bench: первый бенчмарк, где AI-агенты терпят крах на Docker и pip install

Обзор ABC-Bench — первого бенчмарка для оценки AI-агентов в полном цикле backend-разработки. Код на GitHub, датасет на Hugging Face. Результаты шокируют: 50% пр

Обзор

P

Pocket-TTS и VibeVoice-ASR: ваш локальный голосовой ассистент на минималках

Пошаговый гайд по созданию полностью локального голосового ассистента на базе Pocket-TTS и VibeVoice-ASR. Работает без интернета и видеокарты.

Обзор

П

Параллельный inference со structured outputs в MLX: Outlines, vLLM-mlx и PydanticAI в 2026 году

Технический обзор инструментов для параллельного inference со structured outputs на Apple Silicon в 2026 году: Outlines, vLLM-mlx и PydanticAI с JIT-компиляцией

Обзор

F

Faramesh: Как защитить AI-агентов от самих себя (и злоумышленников)

Обзор Faramesh - библиотеки для детерминированного контроля инструментов AI-агентов. Защитите API, базы данных и системы от prompt injection и несанкционированн

Обзор

V

VIBEE: как язык для вайбкодеров стал спецификацией для квантовых вычислений на кутритах

Обзор VIBEE — от нишевого языка для вайбкодеров до спецификации для квантовых вычислений на кутритах с троичной логикой и компилятором на Zig.

Обзор

M

Marble World Labs: Fei-Fei Li превращает Gaussian Splatting в конструктор 3D-миров

Как Fei-Fei Li и Marble World Labs используют Gaussian Splatting и NeRF для мгновенной генерации 3D-миров. Экспорт в Unity, VR, сравнение с альтернативами.

Обзор

Л

Лаборатория в коде: как когнитивная ОС превращает LLM из чат-игрушки в думающего коллегу

Обзор TypeScript-фреймворка с многослойным мышлением, реляционным графом памяти и интеграцией LM Studio. Замена векторным базам и статусным чатам.

Обзор

T

Todoist Ramble: Как работает голосовой AI на Gemini 2.5 Flash Live и можно ли его повторить

Разбираем архитектуру Todoist Ramble: как Gemini 2.5 Flash Live через Vertex AI превращает бормотание в структурированные задачи. Промпты, стоимость и можно ли

Обзор

L

Lemonade vs Ollama: кто победит в битве локальных LLM-серверов в 2026?

Полный обзор Lemonade и Ollama: поддержка GLM-4.7-Flash, ROCm, Vulkan, интеграция с LM Studio. Какой сервер выбрать в 2026 году для локального запуска LLM.

Обзор

K

KVzap: NVIDIA разогнала LLM в 4 раза, выкинув половину памяти

NVIDIA KVzap ускоряет инференс Llama 3.1 и Qwen3 в 2-4 раза через динамическое сжатие KV-кэша. Открытый код, установка, сравнение с альтернативами.

Обзор