Hacker News Digest

22 сентября 2025 г. в 18:18 • pavlinbg.com • ⭐ 85 • 💬 24

OriginalHN

#python#whisper#openai#ffmpeg#speech-to-text#audio-processing#machine-learning#assemblyai

Show HN: Python Audio Transcription: Convert Speech to Text Locally

Локальная транскрипция аудио в текст на Python с помощью Whisper от OpenAI решает проблему приватности и затрат. Модель обрабатывает записи офлайн с точностью до 96%, поддерживает множество языков и шумовых условий. Ключевой шаг — установка FFmpeg для обработки аудио, без которой скрипт не заработает.

Доступно пять версий модели: от «tiny» (39 МБ, для тестов) до «large» (1.5 ГБ, максимальная точность). Для большинства задач подходит «base» — баланс скорости и качества. Код включает класс для транскрипции с выводом языка, времени обработки и сохранением результата в файл.