Show HN: Whispering – Open-source, local-first dictation you can trust 🔥 Горячее
Whispering — микросервис в репозитории epicenter-so/epicenter
, каталог apps/whispering
.
Предназначен для быстрого распознавания речи через OpenAI Whisper: принимает аудио-файл, возвращает текст.
Ключевые файлы
main.py
— FastAPI-endpoint/transcribe
(POST, multipart/form-data).requirements.txt
—fastapi
,uvicorn
,openai-whisper
.Dockerfile
— лёгкий образ наpython:3.11-slim
, порт 8000.
Запуск
docker build -t whispering .
docker run -p 8000:8000 whispering
или
pip install -r requirements.txt
uvicorn main:app --host 0.0.0.0 --port 8000
Использование
curl -F "file=@audio.mp3" http://localhost:8000/transcribe
Ответ: {"text": "распознанный текст"}
.
Комментарии (114)
- Пользователи делятся «джанковыми», но рабочими схемами диктовки на Linux и обсуждают проблему отсутствия визуальной обратной связи в реальном времени.
- Основной фокус — локальные open-source решения: Whisper, Parakeet, MacWhisper, VoiceInk, Whishper; многие просят добавить Parakeet в Epicenter.
- Волнует приватность: люди отказываются от облачных API и ищут полностью офлайн-варианты, но жалуются на недостаток документации «как запустить без ключа».
- Появляются запросы о дополнительных фичах: распознавание детской речи, определение говорящего, семантическое исправление, TTS, голосовые команды «run/code».
- Автор проекта (braden-w) подтверждает: сначала стабилизируем whisper.cpp, затем добавим Parakeet; PR и идеи приветствуются.