Hacker News Digest

Тег: #inference

Постов: 1

Token growth indicates future AI spend per dev (blog.kilocode.ai)

  • Kilo превысил 1 трлн токенов/мес в OpenRouter; Cline, Roo, Kilo растут из-за дросселирования Cursor и Claude.
  • Стартапы рассчитывали: себестоимость токенов упадёт на 90 % за год, маржа станет +80 %.
  • Вместо этого цена токенов фронтир-моделей не упала, а расход токенов на задачу вырос.
  • Причины: модели стали крупнее, появились «длинные мысли» и агенты, которые запускают цепочки вызовов.
  • Итог: расход на разработчика уже $20–40 к/мес и стремится к $100 к/год.

by twapi • 11 августа 2025 г. в 17:59 • 167 points

ОригиналHN

#openrouter#llm#cloud#cost#development#agents#inference#opensource

Комментарии (132)

  • Почти все участники считают цифру в $100 000/год на разработчика безосновательной и преувеличенной.
  • Основной аргумент: стоимость инференса либо быстро упадёт, либо станет дешевле запускать opensource-модели локально.
  • Многие отмечают, что уже сейчас $100–200/мес хватает большинству, а при росте нагрузки выгоднее купить железо, чем платить за облако.
  • Поднимается тема «токеномики»: расходы растут из-за параллельных агентов и увеличения контекста, но это пока не дотягивает до $100 000.
  • Часть комментаторов указывает, что крупные компании вряд ли вернутся к on-prem, а будут торговаться за долгосрочные контракты у дешёвых провайдеров.