Тег: #openai-whisper — Hacker News Digest

Show HN: Whispering – Open-source, local-first dictation you can trust (github.com) 🔥 Горячее

Whispering — микросервис в репозитории epicenter-so/epicenter, каталог apps/whispering.
Предназначен для быстрого распознавания речи через OpenAI Whisper: принимает аудио-файл, возвращает текст.

Ключевые файлы

main.py — FastAPI-endpoint /transcribe (POST, multipart/form-data).
requirements.txt — fastapi, uvicorn, openai-whisper.
Dockerfile — лёгкий образ на python:3.11-slim, порт 8000.

Запуск

docker build -t whispering .
docker run -p 8000:8000 whispering

или

pip install -r requirements.txt
uvicorn main:app --host 0.0.0.0 --port 8000

Использование

curl -F "file=@audio.mp3" http://localhost:8000/transcribe

Ответ: {"text": "распознанный текст"}.

by braden-w • 18 августа 2025 г. в 16:52 • 385 points

Оригинал • HN

#openai-whisper #fastapi #python #docker #speech-recognition #local-first #microservice #open-source #github

Комментарии (114)

Пользователи делятся «джанковыми», но рабочими схемами диктовки на Linux и обсуждают проблему отсутствия визуальной обратной связи в реальном времени.
Основной фокус — локальные open-source решения: Whisper, Parakeet, MacWhisper, VoiceInk, Whishper; многие просят добавить Parakeet в Epicenter.
Волнует приватность: люди отказываются от облачных API и ищут полностью офлайн-варианты, но жалуются на недостаток документации «как запустить без ключа».
Появляются запросы о дополнительных фичах: распознавание детской речи, определение говорящего, семантическое исправление, TTS, голосовые команды «run/code».
Автор проекта (braden-w) подтверждает: сначала стабилизируем whisper.cpp, затем добавим Parakeet; PR и идеи приветствуются.