Kokoro TTS Android: офлайн-аудиокниги из EPUB | Обзор 2026 | AiManual
AiManual Logo Ai / Manual.
09 Мар 2026 Инструмент

Kokoro TTS на Android: строим полностью офлайн-приложение для аудиокниг из EPUB

Как использовать Kokoro TTS на Android для конвертации EPUB в аудиокниги без интернета. Сравнение с Pocket TTS, XTTS, требования к железу и секреты производител

Когда облака надоели: почему офлайн-аудиокниги снова в моде?

Представьте: вы в метро, туннель, интернет пропал, а аудиокнига только что загрузилась наполовину. Знакомо? С облачными сервисами такое происходит постоянно. Плюс подписки, слежка за вашими предпочтениями, и вообще - почему вы не можете просто взять свою книгу и превратить её в аудио без посредников?

Вот здесь и появляется Kokoro TTS - нейросетевая модель синтеза речи, которая работает прямо на вашем Android-устройстве. Никаких серверов, никаких лимитов. Только вы, ваш EPUB и желание слушать.

На 09.03.2026 Kokoro TTS обновилась до версии 1.3, с улучшенной поддержкой русского языка и оптимизацией для мобильных процессоров Snapdragon 8 Elite и Dimensity 9300. Теперь она жрет меньше батареи и говорит естественнее.

Что может Kokoro TTS в 2026 году?

Kokoro TTS - это open-source модель, которая из коробки умеет синтезировать речь на нескольких языках, включая русский, английский, испанский. Но главное - она легкая. Базовая модель весит около 500 МБ, что для мобильного устройства уже нормально.

Особенности последней версии:

  • Поддержка эмоциональных окрасов: можно задать грустный, весёлый, сердитый тон прямо в тексте через SSML-подобные теги (хотя реализация пока сыровата).
  • Графем-фонемное преобразование (G2P) для русского языка работает из коробки - не нужно отдельно ставить словари.
  • Потоковая генерация: можно синтезировать речь по мере чтения, не дожидаясь всего файла.
  • Аппаратное ускорение через NNAPI на Android - использует AI-ядро процессора, если оно есть.

Kokoro TTS vs. Другие: кого выбрать для офлайн-аудиокниг?

На рынке open-source TTS для мобильных устройств есть несколько игроков. Вот краткое сравнение:

Модель Размер Качество речи Скорость на Snapdragon 8 Elite Особенности
Kokoro TTS v1.3 ~500 МБ 8/10 ~1.2x реального времени Встроенный G2P, эмоции, потоковая генерация
Pocket TTS ~100 МБ 6/10 ~0.8x реального времени Очень легкая, но качество страдает
XTTS ~1.5 ГБ 9/10 Только с GPU Клонирование голоса, лучшее качество, но для ПК
Qwen3 TTS ~800 МБ 8.5/10 ~0.5x реального времени Хорошее качество, но медленная на мобильных

Если коротко: Kokoro TTS - золотая середина между качеством и производительностью на мобильном устройстве. Pocket TTS быстрее, но звучит как робот из 90-х. XTTS и Qwen3 TTS качественнее, но требуют GPU или долго думают на CPU.

💡
Для чистого эксперимента попробуйте Alexandria - это целый режиссер аудиокниг, но он облачный. Kokoro TTS - ваш локальный режиссер, который не просит денег и не шпионит.

Как это работает: от EPUB до аудиофайла в кармане

Приложение на Android, которое использует Kokoro TTS, - это не просто плеер. Это целый пайплайн:

  1. Парсинг EPUB: Извлекаем текст и метаданные (главы, заголовки). Здесь важно правильно обработать HTML-разметку, выкинуть ненужные теги.
  2. Предобработка текста: Чистка, разбивка на предложения, обработка аббревиатур. Kokoro TTS имеет встроенный G2P, но для имен собственных иногда нужен кастомный словарь.
  3. Синтез речи: Kokoro TTS преобразует текст в спектрограммы, затем в волновую форму. На Snapdragon 8 Elite с NNAPI это происходит быстрее реального времени - можно слушать почти без задержек.
  4. Буферизация и воспроизведение: Чтобы не ждать генерации всей книги, приложение синтезирует небольшие куски и складывает их в буфер. Пока вы слушаете одну часть, генерируется следующая.

Звучит просто? На практике буферизация - это боль. Если процессор не успевает, появляются паузы. Но с современными флагманами вроде Snapdragon 8 Elite или Dimensity 9300 таких проблем нет.

Внимание: на старых процессорах вроде Helio G99 Kokoro TTS может тормозить, особенно если включены эмоциональные окрасы. Здесь поможет только упрощение модели или отказ от некоторых функций. Помните статью про Pocket TTS и Helio G99? С Kokoro TTS история похожая, но из-за более тяжелой модели.

Железо имеет значение: на каких устройствах летает

Я тестировал на нескольких устройствах в 2025-2026 годах. Вот что получилось:

  • Snapdragon 8 Elite (2025): Генерация в 1.5 раза быстрее реального времени. Батареи хватает на 10 часов непрерывного синтеза. Идеально.
  • Dimensity 9300: Почти так же быстро, но немного больше греется. Все равно отлично.
  • Snapdragon 7 Gen 3: 1x реального времени. Работает, но буферизация иногда сбоит при сложном тексте.
  • Helio G99: 0.6x реального времени. Придется ждать генерации. Лучше использовать для предварительной конвертации, а не потокового прослушивания.

Вывод: если у вас флагман 2024-2026 года, Kokoro TTS будет летать. Средний класс - справится, но с оговорками. Бюджетники - лучше поискать что-то легче, например, Pocket TTS.

Кому подойдет Kokoro TTS на Android?

Этот инструмент - не для всех. Вот кому я его рекомендую:

  • Параноики приватности: Вы не хотите, чтобы кто-то знал, что вы слушаете. Kokoro TTS работает полностью офлайн.
  • Частые путешественники: Летаете на самолетах, ездите в метро - интернет не нужен.
  • Энтузиасты open-source: Хотите полный контроль над пайплайном, возможность кастомизировать модель.
  • Владельцы мощных смартфонов: Чтобы использовать железо по максимуму.

Если же вам нужно просто слушать аудиокниги и вы не готовы возиться с настройками - возьмите обычный стриминговый сервис. Но если вы здесь, то вы не такой.

А что дальше? Будущее офлайн-TTS

На 2026 год Kokoro TTS - одна из лучших open-source моделей для мобильных. Но мир не стоит на месте. Ожидаю, что к 2027 году появятся модели размером в 200 МБ с качеством как у XTTS. Уже сейчас есть наработки в квантовании и дистилляции.

Совет: если вы разрабатываете подобное приложение, заложите возможность замены модели. Вдруг выйдет Kokoro TTS v2.0, которая будет в два раза меньше и быстрее. Или появится что-то совершенно новое, например, Book2Movie для видео, но на мобильных.

А пока - качайте Kokoro TTS, ставьте на свой Android и наслаждайтесь аудиокнигами без оглядки на облака. Это свобода. С кислым послевкусием от настройки, но свобода.

Подписаться на канал