CorentinJ: Real-Time Voice Cloning (2021)
Real-Time-Voice-Cloning
Клонирование голоса за 5 секунд и синтез любой речи онлайн.
- Архитектура: encoder → synthesizer → vocoder.
- Датасет: 1–2 минуты чистой речи на диктофон.
- GPU: ≥6 ГБ VRAM, CPU тоже работает.
- Установка: клонируй репо, поставь зависимости, скачай веса.
- GUI: запусти
demo_toolbox.py, выбери wav, вводь текст. - API:
python demo_cli.py <wav> "<текст>".