Оригинальный Microsoft VibeVoice — штука мощная. Speech-to-speech с voice cloning, низкая задержка, эмпатия в голосе. Но есть нюанс: он требует Python, тяжелые зависимости, и на инференсе тащит за собой весь PyTorch. На слабых GPU — ад. На CPU — просто боль. Энтузиасты из комьюнити сделали то, чего ждали все: порт vibevoice.cpp на чистый C++ с ggml. Никакого Python на инференсе. Поддержка CPU, CUDA, Metal и Vulkan. Квантование. В два раза меньше RAM. Реальная работа на Raspberry Pi (ну, почти).
05 Май 2026
•
Инструмент
VibeVoice.cpp: Microsoft VibeVoice на стероидах — локальный speech-to-speech без Python и облаков
Запускаем VibeVoice.cpp — порт Microsoft VibeVoice на ggml/C++ с поддержкой CPU, CUDA, Metal, Vulkan. Без Python, с квантованием и voice cloning. Сравнение с ал