Тег: #prompt-engineering — Hacker News Digest

How to build a coding agent (ghuntley.com) 🔥 Горячее

Как собрать код-агента: бесплатный воркшоп

Материалы и исходники: GitHub

Суть

Агент — это 300 строк кода, работающие в цикле, которому просто подаются токены LLM.
Поняв принцип, вы перестанете быть потребителем ИИ и станете его продюсером, автоматизируя свою работу.

Зачем

В 2025 г. знание, как создать агента, стало фундаментальным навыком, как понимание primary key.
Работодатели ищут тех, кто может оркестрировать ИИ внутри компании.
Во время Zoom-звонка ваш агент может уже писать код, который вы только обсуждаете.

Что будет на воркшопе

Live-сборка агента прямо во время доклада.
Объяснение внутреннего устройства: цикл, токены, промпты.
Практика: агент строит агента под диктовку.

Дальше

Если хотите, чтобы я провёл такой воркшоп у вас в компании — пишите.

by ghuntley • 24 августа 2025 г. в 03:21 • 402 points

Оригинал • HN

#python #llm #bash #automation #prompt-engineering #swe-bench

Комментарии (110)

Команда Princeton SWE-bench выложила компактный (~100 строк) агент для SWE-bench.
Пользователи жалуются на перегруженный AI-слайд-стиль и избыточные картинки, которые мешают чтению.
Спор о необходимости отдельных инструментов: многие действия можно делать через bash, но специализированные утилиты экономят токены и повышают надёжность.
Обсуждают, что «токены = деньги» и что локальные модели могут изменить ситуацию.
Критика: пост показывает лишь базовый подход, не раскрывая продвинутые темы (sandbox, snapshot, prompt-инженерия).

Building AI products in the probabilistic era (giansegato.com)

Строим продукты ИИ в эпоху вероятностей

Мы живём в момент, когда инструменты обогнали наши модели их понимания. ИИ изменил саму природу софта: вместо детерминированной функции F: X → Y мы получаем статистическое распределение.

Классическая эра

До ИИ продукты были предсказуемы: нажал «отправить» — сообщение ушло. Именно поэтому вся отрасль строилась на 100 % надёжности: SLO-дэшборды, тесты, аккуратные рефакторинги. PM и дизайн тоже сводились к прокачке воронок с заранее заданными входами и целями.

Новая реальность

С ИИ выход y стал вероятностным: один и тот же промпт может дать разные ответы. Это ломает привычные процессы:

Инженерия перестаёт быть «написать код → проверить тесты». Теперь нужно управлять распределениями, подбирать промпты, валидировать выборки.
Продукт больше не сводится к фиксированному набору фич. Модель сама генерирует новые пути ценности, а цели могут меняться по ходу использования.
Организация требует новых ролей: «prompt engineer», «eval lead», «AI safety analyst».

Что делать

Отказаться от 100 % SLO. Достаточно 95 % качества при 10× скорости релизов.
Оценивать не функцию, а распределение. A/B тесты уступают место оценке статистических хвостов.
Строить обратную связь в цикл. Пользовательские данные теперь не просто метрика, а способ «дообучать» поведение модели на лету.

Точно так же, как раньше победили те, кто принял «нулевую себестоимость» интернета, теперь выиграют команды, которые освоят вероятностное мышление.

by sdan • 21 августа 2025 г. в 18:42 • 175 points

Оригинал • HN

#llm #machine-learning #probabilistic-programming #slo #prompt-engineering #ab-testing

Комментарии (97)

Критики считают статью псевдонаучной: излишнее математическое оформление, «LinkedIn-философия» и игнорирование необходимости детерминизма в критичных системах.
Автору вменяют ошибку: вероятностная система не является функцией, а «переход к квантовой теории» называют переходом к недетерминизму, а не «вероятностному детерминизму».
Многие напоминают, что человечество всегда строило гибкие инструменты; жёсткая детерминированность ПО — скорее исключение, и будущее, вероятно, объединит детерминированные обвязки с вероятностными ядрами.
Ряд участников подчёркивает: текущие LLM-агенты ненадёжны, «GPU-powered bullshit engine» не заменит проверенную инженерную практику, а «переписывать всё каждые три недели» — нереалистично.