Вы обновили llama.cpp до версии b9680. Запустили контейнер Docker с server-cuda13. В браузере – пустая страница. Ни чата, ни интерфейса. Только молчаливый чёрный экран и логи сервера, которые ничего не объясняют. Знакомо?
Добро пожаловать в баг версии b9680 – разработчики случайно отключили Web UI. Фронтенд не собирается при билде, либо не копируется в образ. В issue #3748 уже есть жалобы, но официального патча пока нет. И это не первый сбой стабильности – недавний кризис стабильности llama.cpp показал, что даже минорные релизы могут быть опасными.
Важно: проблема проявляется только при использовании Docker-образов с тегом server-cuda13 для b9680. Если вы собирали из сорцов с флагом LLAMA_WEBUI=1 – скорее всего, не затронуты. Но большинство использует официальные образы.
Как это выглядит на практике
Типичный сценарий: вы пулите последний образ llama.cpp, запускаете контейнер, передаёте модель. Сервер стартует, API отвечает (вызовы curl работают), но Web UI по порту 8080 отдаёт только пустой ответ. Логи не содержат ошибок – просто не загружается JS-бандл. Судя по коммитам, в b9680 сломали скрипт сборки фронтенда для CUDA-образов. Если вы тоже столкнулись с молчаливыми ошибками, загляните в наш разбор тихих убийц llama.cpp – там собраны похожие сценарии.
Временное решение – откат на b9664
Разработчики ещё не выпустили патч. Ждать неделями не хочется – запускать локальный AI без UI неудобно. Рабочий вариант: откатиться до версии b9664. Она стабильна, Web UI работает, все фичи на месте.
Если вы используете Docker
Просто смените тег образа на b9664-server-cuda13 (или аналогичный для вашей платформы):
docker pull ghcr.io/ggml-org/llama.cpp:b9664-server-cuda13
docker run -p 8080:8080 -v /models:/models ghcr.io/ggml-org/llama.cpp:b9664-server-cuda13 ...Обратите внимание: тег b9664 может быть без суффикса -server-cuda13 – проверьте на Docker Hub. Если используете server с другим бэкендом (OpenCL, Vulkan, Metal), аналогично выберите старый тег.
Если вы собираете из исходников
Откатите репозиторий до коммита b9664 и пересоберите:
git checkout tags/b9664
mkdir build && cd build
cmake .. -DLLAMA_WEBUI=ON
make -jПосле сборки Web UI появится снова.
Почему это произошло и когда починят
Судя по истории коммитов, в b9680 разработчики рефакторили структуру фронтенда, но забыли включить webui в конфигурацию сборки для CUDA-образов. Это не первый подобный косяк – ранее в баге с повторной обработкой промптов для Qwen 3.5 тоже пришлось откатывать. Похоже, тестирование образов на разных платформах оставляет желать лучшего.
Патч уже на подходе – в issue #3748 разработчик пообещал исправить в ближайшие дни. До выхода фикса мы рекомендуем зафиксироваться на b9664 и не спешить с обновлениями. И заодно подписаться на уведомления в репозитории, чтобы не пропустить следующую «бомбу».
А пока – пользуйтесь проверенной версией и не стесняйтесь написать в комментариях, сталкивались ли с багом. Может, вы нашли обходной путь интереснее отката?