Hacker News Digest

Тег: #openai-whisper

Постов: 1

Show HN: Whispering – Open-source, local-first dictation you can trust (github.com) 🔥 Горячее

Whispering — микросервис в репозитории epicenter-so/epicenter, каталог apps/whispering.
Предназначен для быстрого распознавания речи через OpenAI Whisper: принимает аудио-файл, возвращает текст.

Ключевые файлы

  • main.py — FastAPI-endpoint /transcribe (POST, multipart/form-data).
  • requirements.txtfastapi, uvicorn, openai-whisper.
  • Dockerfile — лёгкий образ на python:3.11-slim, порт 8000.

Запуск

docker build -t whispering .
docker run -p 8000:8000 whispering

или

pip install -r requirements.txt
uvicorn main:app --host 0.0.0.0 --port 8000

Использование

curl -F "file=@audio.mp3" http://localhost:8000/transcribe

Ответ: {"text": "распознанный текст"}.

by braden-w • 18 августа 2025 г. в 16:52 • 385 points

ОригиналHN

#openai-whisper#fastapi#python#docker#speech-recognition#local-first#microservice#open-source#github

Комментарии (114)

  • Пользователи делятся «джанковыми», но рабочими схемами диктовки на Linux и обсуждают проблему отсутствия визуальной обратной связи в реальном времени.
  • Основной фокус — локальные open-source решения: Whisper, Parakeet, MacWhisper, VoiceInk, Whishper; многие просят добавить Parakeet в Epicenter.
  • Волнует приватность: люди отказываются от облачных API и ищут полностью офлайн-варианты, но жалуются на недостаток документации «как запустить без ключа».
  • Появляются запросы о дополнительных фичах: распознавание детской речи, определение говорящего, семантическое исправление, TTS, голосовые команды «run/code».
  • Автор проекта (braden-w) подтверждает: сначала стабилизируем whisper.cpp, затем добавим Parakeet; PR и идеи приветствуются.