Hacker News Digest

Тег: #developer-tools

Постов: 4

Context is the bottleneck for coding agents now (runnercode.com)

Современные модели ИИ демонстрируют сверхчеловеческие способности в решении абстрактных задач, как показал недавний успех GPT-5 на ICPC, но автономные кодирующие агенты всё ещё не могут заменить разработчиков. Основное ограничение — не интеллект, а контекст: агентам не хватает глубокого понимания кодовой базы, её архитектурных паттернов и скрытых знаний, которые есть у людей.

Контекст включает не только код, но и документацию, историю решений, неформальные соглашения и причины прошлых изменений. Без доступа к Slack-тредам, постмортемам инцидентов и организационным практикам агенты работают лишь на 20% от возможного уровня, справляясь в основном с мелкими задачами. Чтобы двигаться дальше, нужны системы, способные усваивать и применять этот скрытый контекст так же, как это делают люди.

by zmccormick7 • 26 сентября 2025 г. в 15:06 • 146 points

ОригиналHN

#llm#coding-agents#codebases#context-management#documentation#software-development#large-language-models#artificial-intelligence#developer-tools#machine-learning

Комментарии (149)

  • Основным ограничением для кодирующих агентов на основе ИИ является не размер контекстного окна, а неспособность эффективно фокусироваться на актуальных задачах и отбрасывать нерелевантную информацию.
  • Многие участники отмечают, что ИИ-агенты демонстрируют уровень понимания, сравнимый с начинающим разработчиком, и не способны заменить senior-специалистов, которые могут интерпретировать бизнес-требования и принимать ответственные решения.
  • Существует скептицизм относительно бесконечного увеличения "интеллекта" моделей, так как даже с большим контекстом они допускают ошибки и галлюцинации, а фундаментальные ограничения вероятностной генерации остаются.
  • Предлагаются решения для улучшения работы агентов: лучше структурированные кодобазы, иерархическая документация, инструменты для управления контекстом и памятью, а также человеческий контроль для курирования процесса.
  • Подчёркивается, что ключевая проблема — не технический контекст, а понимание intent (намерения) стоящего за кодом, что требует более глубокого осмысления, чем простое прогнозирование токенов.

What happens when coding agents stop feeling like dialup? (martinalderson.com)

Сейчас кодирующие агенты вроде Claude Code работают медленно и ненадёжно, напоминая dialup-модемы 90-х: частые сбои, необходимость перезапусков, скорость генерации всего 30-60 токенов в секунду. Это связано с взрывным ростом потребления токенов — по данным OpenRouter, объёмы выросли в 50 раз за короткий период, а агентные workflows требуют в 1000 раз больше ресурсов, чем обычные чаты.

Более высокая скорость, например 2000 токенов в секунду (как у Cerebras Code), кардинально меняет опыт: разработчик становится узким местом, а не модель. Это открывает путь к новому этапу — параллельным независящим агентам, которые предлагают несколько вариантов решения задачи с автоматической оценкой качества. Однако рост скорости лишь разгоняет спрос, создавая бесконечный цикл: чем лучше модели, тем сложнее задачи, которые мы им ставим.

by martinald • 21 сентября 2025 г. в 12:11 • 128 points

ОригиналHN

#llm#machine-learning#code-generation#productivity#developer-tools#ide#openrouter

Комментарии (133)

  • Скептицизм относительно реального повышения продуктивности из-за LLM: AI может создавать иллюзию продуктивности, снижая когнитивную вовлеченность и порождая проблемы с качеством и сопровождением кода.
  • Ключевая проблема — скорость и контекст: Медленная генерация токенов и постоянное переключение контекста нарушают состояние потока (flow), а ограничения контекста приводят к ошибкам и галлюцинациям.
  • Сдвиг роли разработчика: Инструмент меняет фокус с написания кода на проверку, редактирование и управление AI-агентами, что требует постоянной бдительности и новых навыков.
  • Зависимость от надежности провайдеров: Сбои в работе AI-сервисов сравнимы с остановкой производства, что создает риски для рабочего процесса.
  • Разные стратегии и предпочтения в использовании: Одни разработчики ценят интегрированные в IDE решения (Cursor), другие предпочитают сторонних агентов (Claude, Codex) или используют LLM как «калькулятор» для рутинных задач и обучения.

Survey: a third of senior developers say over half their code is AI-generated (fastly.com) 💬 Длинная дискуссия

  • GitHub опросил 2 тыс. разработчиков в США, Индии, Бразилии и Германии: 97 % используют AI-инструменты, 59 % ежедневно.
  • Возрастной парадокс: 82 % разрабов 55+ лет применяют AI, тогда как среди 18–24 лет — 62 %.
  • Опыт важнее возраста: 81 % специалистов с >20-летним стажем используют AI, против 57 % у новичков.
  • Причины: старшие хотят быстрее писать код и учиться, младшие боятся ошибок и не доверяют качеству.
  • Эффекты: 55 % считают AI «значительно» улучшает качество, 41 % отмечают меньше багов.
  • Риски: 81 % считают, что AI-генерированный код нуждается в дополнительной проверке.

by Brajeshwar • 31 августа 2025 г. в 14:55 • 195 points

ОригиналHN

#github#llm#developer-tools#software-development#fastly

Комментарии (318)

  • Опытные разработчики (10+ лет) чаще пользуются AI-инструментами, но используют их как «умелого джуна» для рутины, а не как полноценного автора.
  • Многие подчеркивают: важно самому проверять и править результат, иначе качество и поддерживаемость страдают.
  • Часть участников считает, что новички перегружены AI и теряют навыки решения задач «вручную».
  • Опрос всего 791 человека вызывает сомнение в статистической значимости; к тому же Fastly сам продаёт AI-решения.
  • В итоге AI хорош для boilerplate, прототипов и мелких фрагментов, но не для сложной архитектуры без человеческого контроля.

Dev Compass – Programming Philosophy Quiz (treeform.github.io)

Dev Compass — тест философии программирования
Ответь на 20 вопросов и узнай, где ты на оси «абстракция ↔ конкретика» и «удобно человеку ↔ удобно машине».

Вопрос 1 из 20
Далее

Твоя позиция
Абстракция ↔ Конкретика
Человеку ↔ Машине

Пройти заново

by todsacerdoti • 16 августа 2025 г. в 22:04 • 198 points

ОригиналHN

#programming#software-development#developer-tools#quiz

Комментарии (97)

  • Пользователи жалуются: почти каждый вопрос «зависит от контекста», приходится выбирать произвольно.
  • Многие получают центральные значения и считают результат неточным; кто-то видит в этом «MBTI для разработчиков».
  • Просят ранжировать ответы, а не выбирать один, и показывать, как каждый ответ влияет на итог.
  • Некоторые любят идею «фракций» и просят добавить статистику по другим участникам.
  • Автору советуют скрывать измерения во время прохождения, чтобы не искажать ответы.