Hacker News Digest

10 октября 2025 г. в 04:40 • arxiv.org • ⭐ 84 • 💬 79

OriginalHN

#large-language-models#llm#artificial-intelligence#machine-learning#google-deepmind#university-of-montreal#chain-of-thought#explainable-ai#arxiv

Reasoning LLMs are wandering solution explorers

Исследователи из Google DeepMind и Университета Монреаля показали, что современные LLM не используют формальное рассуждение, а вместо этого ищут решение в пространстве возможных решений. Это открытие ставит под сомнение саму идею, что масштабные языковые модели "рассуждают" как люди.

Команда обучила модель, которая решает задачи, используя цепочку мыслей, и другую, которая не использует. Оказалось, что вторая модель достигает такой же точности, как и первая. Это показывает, что LLM не используют формальное рассуждение, а вместо этого ищут решение в пространстве возможных решений. Исследование также показало, что модели становятся менее уверенными в своих ответах, когда задачи становятся сложнее.