Тег: #inference — Hacker News Digest

Token growth indicates future AI spend per dev (blog.kilocode.ai)

Kilo превысил 1 трлн токенов/мес в OpenRouter; Cline, Roo, Kilo растут из-за дросселирования Cursor и Claude.
Стартапы рассчитывали: себестоимость токенов упадёт на 90 % за год, маржа станет +80 %.
Вместо этого цена токенов фронтир-моделей не упала, а расход токенов на задачу вырос.
Причины: модели стали крупнее, появились «длинные мысли» и агенты, которые запускают цепочки вызовов.
Итог: расход на разработчика уже $20–40 к/мес и стремится к $100 к/год.

by twapi • 11 августа 2025 г. в 17:59 • 167 points

Почти все участники считают цифру в $100 000/год на разработчика безосновательной и преувеличенной.
Основной аргумент: стоимость инференса либо быстро упадёт, либо станет дешевле запускать opensource-модели локально.
Многие отмечают, что уже сейчас $100–200/мес хватает большинству, а при росте нагрузки выгоднее купить железо, чем платить за облако.
Поднимается тема «токеномики»: расходы растут из-за параллельных агентов и увеличения контекста, но это пока не дотягивает до $100 000.
Часть комментаторов указывает, что крупные компании вряд ли вернутся к on-prem, а будут торговаться за долгосрочные контракты у дешёвых провайдеров.