Инструменты для работы с AI

L

LFM 2.5 1.2B: языковая модель, которая обгоняет мысль

Обзор модели LFM 2.5 1.2B: 578 токенов в секунду на десктопе, потенциал для Raspberry Pi, сравнение с альтернативами и примеры использования.

Обзор

A

AgentCPM-Explore: 4B параметра на вашем ноутбуке. Как SOTA-агент бьет рекорды без облаков

Запустите AgentCPM-Explore локально – 4B SOTA-агент с открытым кодом. Используйте AgentRL, AgentDock, AgentToLeaP для обучения и оценки. Полное руководство.

Обзор

К

Как использовать и дообучить 500Мб NER-модель tanaos-NER-v1 локально на CPU с помощью Artifex

Пошаговый гайд по использованию и дообучению легкой NER-модели tanaos-NER-v1 локально на CPU с библиотекой Artifex. Примеры кода на Python.

Обзор

К

Как работает Confer: первый по-настоящему приватный AI-ассистент с шифрованием в TEE

Как Moxie Marlinspike создал приватный AI-ассистент с шифрованием в Trusted Execution Environment. Сравнение с локальными альтернативами.

Обзор

F

FrogBoss и FrogMini: как Microsoft создала AI-агентов для автоматического исправления багов в коде

Как Microsoft создала FrogBoss и FrogMini - AI-агентов для автоматического исправления багов в коде. Технические детали, сравнение с альтернативами и примеры ис

Обзор

E

EAFT в бою: тест на uncensor-задаче против обычного fine-tuning

Практический эксперимент: сравниваем Entropy Adaptive Fine Tuning с обычным fine-tuning на задаче uncensor. Результаты, код, модели.

Обзор

T

Tencent WeDLM-8B в chatllm.cpp: декодирование на грани и почему GPU иногда проигрывает

Подробный обзор запуска модели WeDLM-8B в chatllm.cpp: настройка параметров block_size, accept_algo, сравнение производительности CPU и GPU.

Обзор

G

Gemma 3 1B Q4_0 GGUF: как правильно квантовать QAT-модель без imatrix

Пошаговая инструкция по правильному квантованию Gemma 3 1B в формат GGUF без использования imatrix. Исправление метаданных и токенизатора.

Обзор

B

Baichuan-M3-235B: как медицинская LLM превзошла GPT-5.2 и какие техники снижают галлюцинации

Китайская модель Baichuan-M3-235B превзошла GPT-5.2 в медицинских тестах HealthBench. Как Fact-Aware RL и W4 квантование снижают галлюцинации.

Обзор

К

Как превратить любое видео в книжку-раскладушку для ребёнка: туториал по Vid2BedtimeStory

Полный туториал по превращению видео в книжку-раскладушку для детей. Скриншоты, генерация текста, создание PDF. Локальные LLM и Google Play Books.

Обзор

S

SurfSense: локальный ассистент, который не сливает ваши документы в облако

Как развернуть SurfSense - приватный RAG-ассистент с поддержкой 100+ LLM через Ollama. Полная инструкция по Docker-установке.

Обзор

С

Сжатие вывода инструментов для AI-агентов: как сократить контекст на 70% и снизить стоимость

Открытая библиотека ToolTrim сжимает вывод инструментов AI-агентов на 60-70%, снижая стоимость inference. Статистическая фильтрация и удаление избыточных данных

Обзор