Тег: #apu — Hacker News Digest

AMD's Chiplet APU: An Overview of Strix Halo (chipsandcheese.com)

AMD представила Strix Halo — свой самый крупный клиентский APU на сегодняшний день. Это универсальный мобильный процессор, способный обрабатывать высокопроизводительные CPU и GPU задачи без необходимости в дискретной графике. TDI чипа варьируется от 55W до 120W, что значительно выше, чем у стандартного Strix Point. Strix Halo стал первым чиплетным APU AMD для потребительского рынка, анонсированным на CES 2025.

Чип может оснащаться двумя 8-ядерными CCD Zen 5 (всего 16 ядер) с 512-битным FPU, как у настольных процессоров. Максимальная тактовая частота — 5.1 ГГц (на 600 МГц ниже, чем у Ryzen 9 9950X). Третий кристалл — это RDNA 3.5 iGPU с 40 вычислительными блоками, 32 МБ Infinity Cache и частотой до 2.9 ГГц, что производительности между RX 7600 XT и RX 7700. Для питания чипа используется 256-битная шина LPDDR5X-8000 с пропускной способностью до 256 ГБ/с, что значительно выше, чем у других APU.

by zdw • 18 октября 2025 г. в 04:26 • 186 points

Оригинал • HN

#amd #apu #zen-5 #rdna-3.5 #lpddr5x #infinity-cache #ces-2025 #apple-silicon

Комментарии (67)

Пользователи обсуждают доступность и ценообразование устройств на базе Strix Halo, отмечая, что в ЕС они либо стоят как за золото, либо их просто нет в продаже.
Сравнение с Apple Silicon идёт по всем фронтам: объём оперативной памяти, пропускная способность памяти, энергопотребление и цена.
Обсуждается, что AMD-версия «объединённой» памяти пока не реализована для внешних GPU, и это влияет на выбор покупателей.
Участники спора задаются вопросом, насколько Strix Halo может быть доступен в виде настольного процессора, и какие ограничения это наложит на сборку ПК с дискретной видеокартой.
Поднимается вопрос о том, что если AMD не сможет предложить адекватную цену и доступность, то рынок может быть потерян для потребителей, которые ищут ноутбук с приличной производительностью и при этом не на Apple.

The G in GPU is for Graphics damnit (ut21.github.io)

Автор делится опытом оптимизации модели Physarum polycephalum (слизевика) на GPU с использованием Triton. Модель имитирует поведение агентов, оставляющих феромонные следы и реагирующих на их концентрацию. Изначальная реализация на PyTorch страдала от накладных расходов на инициализацию и низкой утилизации GPU из-за мелких операций.

Профилирование выявило, что основные узкие места — этапы сенсоров, движения и диффузии. Автор переписал ключевые части на Triton, объединив сенсорный и двигательный этапы в один ядро и используя атомарные операции для депозиции феромонов. Это позволило добиться 10-кратного ускорения и полной загрузки GPU, подтвердив, что Triton эффективен для задач с мелкозернистым параллелизмом.

by sebg • 02 октября 2025 г. в 11:46 • 186 points

Оригинал • HN

#gpu #pytorch #triton #llm #machine-learning #parallel-computing #nvidia #h100 #apu #rendering

Комментарии (75)

Обсуждается переименование GPU в MPU (Matrix Processing Units) из-за их доминирующего использования в AI, а не графике.
Поднимается вопрос о том, имеют ли современные AI-ускорители (например, NVIDIA H100) графические выходы и функциональность, поскольку она им не нужна.
Утверждается, что специализированные GPU для игр теряют актуальность из-за роста мощности интегрированных графических решений (APU) от многих вендоров.
Обсуждается, что название (GPU) не ограничивает функциональность инструмента, который эволюционирует и находит новое применение (майнинг, AI).
Высказывается мнение, что CPUs могут обеспечивать лучшее качество рендеринга изображений (прецизионность), хотя и значительно медленнее, чем GPU.