Hacker News Digest

03 октября 2025 г. в 02:59 • improvingagents.com • ⭐ 181 • 💬 83

OriginalHN

#markdown#csv#jsonl#xml#ini#python#sql#llm#gpt-4

Which table format do LLMs understand best?

Эксперимент показал, что формат данных существенно влияет на точность понимания таблиц LLM. Лучший результат показал Markdown-KV (key-value пары в markdown) с точностью 60,7%, но он потребовал в 2,7 раза больше токенов, чем самый экономный CSV. XML и INI также показали высокую точность (56% и 55,7%), тогда как CSV и JSONL оказались наихудшими — около 44%. Это указывает на возможность улучшения RAG-пайплайнов простой сменой формата данных, хотя эффективность часто требует компромисса с количеством токенов.