Тег: #text-processing — Hacker News Digest

Форматы: EPUB, PDF, TXT.
TTS-движки: Coqui TTS, OpenAI TTS, Edge TTS, Google TTS.
Субтитры: SRT/VTT, привязанные к словам.
Языки: 40+, включая русский.
CLI: abogen book.epub --voice en-US-AriaNeural --output book.m4b .

Abogen – Generate audiobooks from EPUBs, PDFs and text (github.com) 🔥 Горячее

abogen — консольный инструмент, превращающий EPUB, PDF и обычный текст в аудиокниги с синхронными субтитрами.

pip install abogen

abogen mybook.pdf --voice ru-RU-SvetlanaNeural --format m4b

by mzehrer • 10 августа 2025 г. в 05:56 • 315 points

Пользователи обсуждают Abogen — GUI-обёртку над Kokoro TTS для генерации аудиокниг из текста.
Качество голоса признаётся «ровным», но без эмоций и актёрской игры; для художественных книг это критично.
Отмечены проблемы: долгие предложения обрезаются, «Mr.» читается с лишней паузой, видео-демо без звука в Firefox.
Кто-то хочет API и автоматический пайплайн Calibre-Web → Abogen → Audiobookshelf, другие — формат DAISY и «голос Моргана Фримена».
Итог: инструмент годен для личного использования и доступности, но пока не дотягивает до коммерческих аудиокниг.