Hacker News Digest

30 сентября 2025 г. в 16:31 • arxiv.org • ⭐ 168 • 💬 40

OriginalHN

#machine-learning#natural-language-processing#reinforcement-learning#language-models#low-rank-adaptation#fine-tuning#arxiv

Extract-0: A specialized language model for document information extraction

Представлена модель Extract-0 с 7 миллиардами параметров, оптимизированная для извлечения информации из документов и превосходящая по эффективности более крупные модели, включая GPT-4.1. Она достигает среднего показателя вознаграждения 0.573 на тестовом наборе из 1000 задач, обходя конкурентов с результатами около 0.46.

Обучение включает генерацию синтетических данных, тонкую настройку с LoRA, затрагивающую лишь 0.53% весов, и reinforcement learning с новой функцией вознаграждения на основе семантического сходства. Это демонстрирует, что специализированные модели могут превзойти универсальные системы при значительно меньших вычислительных затратах.