Hacker News Digest

Тег: #diffusion-models

Постов: 1

Diffusion language models are super data learners (jinjieni.notion.site)

Notion — это универсальный инструмент для заметок, задач, баз знаний и совместной работы. Объединяет блоки текста, таблицы, календари, доски Kanban, базы данных и встраиваемые медиа в единое пространство. Поддерживает шаблоны, автоматизацию, API и интеграции (Slack, GitHub, Figma и др.). Работает в браузере, на macOS, Windows, iOS и Android. Бесплатный план для личного использования; платные тарифы для команд и расширенных функций.

by babelfish • 10 августа 2025 г. в 16:04 • 202 points

ОригиналHN

#notion#kanban#api#slack#github#figma#autoregressive-models#diffusion-models#flops#chain-of-thought

Комментарии (14)

  • Участники спорят, почему диффузионные модели проигрывают авторегрессии: BarakWidawsky связывает это с меньшей способностью к запоминанию, а ckjellqv — с невозможностью KV-кеширования.
  • Woadwarrior01 удивлён росту FLOPs при генерации длинных последовательностей (×16–4700) и отмечает нелинейную зависимость.
  • Godelski критикует неясность терминов «in/out-of-distribution» без описания обучающих данных.
  • Bicsi предлагает «закрыть» диффузионные модели, считая цепочку мыслей (CoT) быстрым и мощным заменителем; против выступают fancyfredbot и SalmoShalazar, призывая не отвергать подход преждевременно.