Hacker News Digest

Тег: #hip

Постов: 2

AMD GPUs Go Brrr (hazyresearch.stanford.edu)

AMD GPU теперь предлагают передовые показатели производительности, но их потенциал не раскрыт из-за отсутствия зрелого программного обеспечения. Авторы представляют HipKittens - коллекцию программных примитивов для раскрытия возможностей AMD GPU. MI355X имеет 256 вычислительных блоков против 160 у B200, а в некоторых тестах показывает до 10.1 PFLOPS против 9.0 PFLOPS у конкурента. AMD использует чиплетную архитектуру (8 XCD по 32 CU), что создает новые возможности и вызовы для разработчиков.

Оптимизация работы на AMD GPU требует нового подхода: эффективного доступа к памяти, учета особенностей регистрового файла и использования мелкоматричных инструкций. В отличие от NVIDIA, где доминирует специализация волн, на AMD предпочтительны 8-волновые и 4-волновые паттерны ядер. Также необходимо учитывать эффекты NUMA на уровне кэша при планировании работы между блоками потоков.

by vinhnx • 15 ноября 2025 г. в 02:06 • 216 points

ОригиналHN

#amd#gpu#hip#parallel-computing#high-performance-computing#numa#compute-units#chiplet-architecture#go

Комментарии (70)

  • @homarp предоставил ссылку на обсуждение HipKittens на Hacker News.
  • @alex1138 прокомментировал использование мема "go brr" в контексте Стэнфорда, выразив лёгкую иронию.
  • @microtonal указал, что аналогичный термин ("went brr") уже использовался при анонсе ThunderKittens год назад.

Optimizing Datalog for the GPU (danglingpointers.substack.com)

by blakepelton • 04 ноября 2025 г. в 14:31 • 107 points

ОригиналHN

#datalog#cuda#hip#spir-v#cozodb#codeql#souffle#datomic

Комментарии (20)

  • Использование Datalog-подобных систем в разных контекстах: от CozoDB до CodeQL и от Rust до GPU-фреймворков.
  • Обсуждение того, какие именно технологии используются в продакшене: от Datomic до CozoDB и от Soufflé до CodeQL.
  • Разговор о том, какие технологии используются для запросов к данным: от SQL-подобных до Datalog-подобных.
  • Обсуждение того, какие технологии используются для запросов к данным в контексте GPU: CUDA, HIP и SPIR-V.