Какие модели поддерживает репозиторий?

Любые локальные LLM: Llama 4, Qwen 3, Gemma 3, Mistral, DeepSeek и другие через Ollama, llama.cpp или vLLM.

Сложно ли запустить?

Достаточно склонировать репозиторий и запустить docker-compose up. Всё остальное настраивается автоматически.

Как перенести артефакты Claude на локальные модели: репозиторий и гайд

Claude крут. Артефакты Claude — это вообще космос. Ты просишь нейронку нарисовать график, сверстать страницу или собрать дашборд, и она тебе тут же показывает результат в интерактивном окне. Без переключения между вкладками, без копипаста, без «ой, я сломалось». Красота.

Но есть нюанс. Каждый такой вызов жрёт токены, а твой кошелёк — деньги. Если работаешь с AI регулярно, счёт за Claude может перевалить за сотню баксов в месяц. И вот ты уже задумываешься: «А что, если локально?»

Кстати, мы уже писали, почему переходить на локальные модели выгодно — Claude дорожает? Берите локальные модели и MCP. Там подробно про экономику.

Раньше локальные LLM не умели делать артефакты. Сидели в терминале, плевались текстом. Но эпоха изменилась. На GitHub появился репозиторий, который эмулирует работу артефактов Claude на любой локальной модели. Больше никаких проприетарных замков. Всё открыто, бесплатно, и работает на твоём железе.

Что это за зверь и как он работает

Проект — это по сути веб-интерфейс + бэкенд-прокси, который перехватывает ответ модели, распознаёт в нём куски кода (HTML/JS/SVG/CSS) и рендерит их прямо в браузере. Никакой магии. Только регулярки и немного хитрости.

Но ключевая фишка — модель не нужно специально дообучать. Она просто генерирует ответ с разметкой, а фронтенд превращает этот текст в интерактив. То есть работает с любой LLM: Llama 4, Qwen 3, Gemma 3, Mistral Large 2, DeepSeek V3 — да хоть с твоей кастомной сборкой.

Компонент	Что делает
AI-провайдер	Любая локальная LLM через Ollama, llama.cpp, vLLM
Парсер артефактов	Вырезает код из ответа, определяет язык
Рендерер	Если JS — запускает в iframe, если SVG — встраивает
RAG-слой	Дополнительный контекст из документов (опционально)

Всё это — готовый репозиторий. Клонируешь, запускаешь, пользуешься. Никаких «собери 20 зависимостей руками». Всё в docker-compose.

А что, есть альтернативы?

Да, пара проектов пытались делать то же самое. Например, Openscore — хороший, но заточен под скрипты и музыку, не универсален. Lobe Chat умеет плагины, но артефакты там бледная тень Claude. А вот этот репозиторий — первая попытка перетащить именно интерактивный предпросмотр целиком.

Да, он пока не дотягивает до Claude по красоте UI. Но функционально — то же самое: ты просишь построить график — он рисует, просишь сделать таймер — он тикает. И главное — абсолютно бесплатно.

Как это выглядит на практике (спойлер: за 5 минут)

Допустим, ты хочешь сгенерировать интерактивную карту с маршрутами на основе данных из CSV. Промпт:

Построй интерактивную карту с маршрутами из приложенного файла. Используй Leaflet.js.

Локальная модель (скажем, Qwen 3-72B через Ollama) выдаёт HTML + JS. Фронтенд перехватывает, запихивает в iframe. Вуаля — карта с точками и линиями открывается прямо в чате. Ты можешь зумить, кликать по маркерам.

💡

Совет: для сложных артефактов лучше использовать модели с контекстом ≥32K. Иначе нейронка может «забыть» код посередине. Статья Как заставить Claude Code помнить и слушаться — про то же, но для Claude, а у нас локальная магия.

Второй пример: ты разработчик и хочешь прототипировать UI-компоненты на React. Промпт:

Напиши компонент кастомного селекта с автокомплитом на React + Tailwind. Покажи пример работы.

Модель возвращает код React-компонента, а интерфейс автоматически подключает Babel и рендерит его в реальном времени. Меняешь промпт — перерендеривается. Для фронтендера это заменяет CodeSandbox в офлайне.

Кому это реально нужно

Разработчикам, которые хотят быстро прототипировать не выходя из чата, но при этом не сливать код в облако.
Аналитикам, которым нужны интерактивные графики и дашборды на локальных данных.
Энтузиастам AI, у кого стоит своя «железка» (например, 2× RTX 5090) и кто не хочет платить за токены.
Всем, кто работает с конфиденциальной информацией — локальный AI не шлёт данные наружу.

Предупреждение: если у тебя 8 ГБ видеопамяти, не гонись за 70B-моделями. Llama 4-8B или Qwen 3-14B справятся с простыми виджетами, но сложные анимации могут глючить. Для серьёзных артефактов нужно от 24 ГБ.

Проект не стоит на месте. В планах — поддержка TypeScript, live-редактирование сгенерированного кода и RAG на лету по твоим документам. Уже сейчас это рабочая лошадка, которая закрывает главную боль локальных LLM — отсутствие интерактива.

Так что если тебя бесит платить за Claude или просто хочется поиграться с AI без интернета — бери репозиторий, запускай, и тащи артефакты к себе. Контролируй свой гений.

Подписаться на канал

Не жди, пока Claude подорожает: тащим артефакты на локальные модели — готовый репозиторий и инструкция

Что это за зверь и как он работает

А что, есть альтернативы?

Как это выглядит на практике (спойлер: за 5 минут)

Кому это реально нужно

Подписывайтесь на наш канал!