Hacker News Digest

Тег: #apu

Постов: 2

AMD's Chiplet APU: An Overview of Strix Halo (chipsandcheese.com)

AMD представила Strix Halo — свой самый крупный клиентский APU на сегодняшний день. Это универсальный мобильный процессор, способный обрабатывать высокопроизводительные CPU и GPU задачи без необходимости в дискретной графике. TDI чипа варьируется от 55W до 120W, что значительно выше, чем у стандартного Strix Point. Strix Halo стал первым чиплетным APU AMD для потребительского рынка, анонсированным на CES 2025.

Чип может оснащаться двумя 8-ядерными CCD Zen 5 (всего 16 ядер) с 512-битным FPU, как у настольных процессоров. Максимальная тактовая частота — 5.1 ГГц (на 600 МГц ниже, чем у Ryzen 9 9950X). Третий кристалл — это RDNA 3.5 iGPU с 40 вычислительными блоками, 32 МБ Infinity Cache и частотой до 2.9 ГГц, что производительности между RX 7600 XT и RX 7700. Для питания чипа используется 256-битная шина LPDDR5X-8000 с пропускной способностью до 256 ГБ/с, что значительно выше, чем у других APU.

by zdw • 18 октября 2025 г. в 04:26 • 186 points

ОригиналHN

#amd#apu#zen-5#rdna-3.5#lpddr5x#infinity-cache#ces-2025#apple-silicon

Комментарии (67)

  • Пользователи обсуждают доступность и ценообразование устройств на базе Strix Halo, отмечая, что в ЕС они либо стоят как за золото, либо их просто нет в продаже.
  • Сравнение с Apple Silicon идёт по всем фронтам: объём оперативной памяти, пропускная способность памяти, энергопотребление и цена.
  • Обсуждается, что AMD-версия «объединённой» памяти пока не реализована для внешних GPU, и это влияет на выбор покупателей.
  • Участники спора задаются вопросом, насколько Strix Halo может быть доступен в виде настольного процессора, и какие ограничения это наложит на сборку ПК с дискретной видеокартой.
  • Поднимается вопрос о том, что если AMD не сможет предложить адекватную цену и доступность, то рынок может быть потерян для потребителей, которые ищут ноутбук с приличной производительностью и при этом не на Apple.

The G in GPU is for Graphics damnit (ut21.github.io)

Автор делится опытом оптимизации модели Physarum polycephalum (слизевика) на GPU с использованием Triton. Модель имитирует поведение агентов, оставляющих феромонные следы и реагирующих на их концентрацию. Изначальная реализация на PyTorch страдала от накладных расходов на инициализацию и низкой утилизации GPU из-за мелких операций.

Профилирование выявило, что основные узкие места — этапы сенсоров, движения и диффузии. Автор переписал ключевые части на Triton, объединив сенсорный и двигательный этапы в один ядро и используя атомарные операции для депозиции феромонов. Это позволило добиться 10-кратного ускорения и полной загрузки GPU, подтвердив, что Triton эффективен для задач с мелкозернистым параллелизмом.

by sebg • 02 октября 2025 г. в 11:46 • 186 points

ОригиналHN

#gpu#pytorch#triton#llm#machine-learning#parallel-computing#nvidia#h100#apu#rendering

Комментарии (75)

  • Обсуждается переименование GPU в MPU (Matrix Processing Units) из-за их доминирующего использования в AI, а не графике.
  • Поднимается вопрос о том, имеют ли современные AI-ускорители (например, NVIDIA H100) графические выходы и функциональность, поскольку она им не нужна.
  • Утверждается, что специализированные GPU для игр теряют актуальность из-за роста мощности интегрированных графических решений (APU) от многих вендоров.
  • Обсуждается, что название (GPU) не ограничивает функциональность инструмента, который эволюционирует и находит новое применение (майнинг, AI).
  • Высказывается мнение, что CPUs могут обеспечивать лучшее качество рендеринга изображений (прецизионность), хотя и значительно медленнее, чем GPU.