Hacker News Digest

19 сентября 2025 г. в 18:36 • github.com • ⭐ 92 • 💬 10

OriginalHN

#ollama#llama#mistral#large-language-models#quantization#apple-silicon#gpu#mlx-lm#github

Show HN: Run Qwen3-Next-80B on 8GB GPU at 1tok/2s throughput

Проект ollm представляет собой инструмент для локального запуска больших языковых моделей через Ollama, позволяя пользователям взаимодействовать с ними напрямую из терминала. Он поддерживает различные модели, включая Llama 3 и Mistral, и предлагает простой интерфейс для отправки запросов и получения ответов без необходимости веб-интерфейса или API.

Ключевые возможности включают настройку параметров модели, таких как температура и контекстное окно, а также сохранение истории диалогов. Это упрощает тестирование и использование LLM для разработчиков и исследователей, работающих в командной строке. Инструмент особенно полезен для быстрого прототипирования и экспериментов с разными моделями.