Llama-Scan: Convert PDFs to Text W Local LLMs
llama-scan — локальный инструмент для транскрибирования PDF с помощью LLM.
Полностью работает на вашем ПК: данные не уходят в облако.
Поддерживает модели Llama 3.2 3B/1B, работает без GPU.
Возможности
- Конвертация PDF → Markdown
- Пакетная обработка папок
- Параллельные задачи
- Подсчёт токенов и стоимости
- Плагины для Obsidian и Zotero
Установка
pip install llamascan
Использование
CLI:
llamascan input.pdf --output out.md
Python:
from llamascan import transcribe
transcribe("file.pdf", model="llama3.2:3b")
Требования
- Python ≥ 3.9
- Ollama (для локальных моделей)
Лицензия
MIT