AMD's Chiplet APU: An Overview of Strix Halo
AMD представила Strix Halo — свой самый крупный клиентский APU на сегодняшний день. Это универсальный мобильный процессор, способный обрабатывать высокопроизводительные CPU и GPU задачи без необходимости в дискретной графике. TDI чипа варьируется от 55W до 120W, что значительно выше, чем у стандартного Strix Point. Strix Halo стал первым чиплетным APU AMD для потребительского рынка, анонсированным на CES 2025.
Чип может оснащаться двумя 8-ядерными CCD Zen 5 (всего 16 ядер) с 512-битным FPU, как у настольных процессоров. Максимальная тактовая частота — 5.1 ГГц (на 600 МГц ниже, чем у Ryzen 9 9950X). Третий кристалл — это RDNA 3.5 iGPU с 40 вычислительными блоками, 32 МБ Infinity Cache и частотой до 2.9 ГГц, что производительности между RX 7600 XT и RX 7700. Для питания чипа используется 256-битная шина LPDDR5X-8000 с пропускной способностью до 256 ГБ/с, что значительно выше, чем у других APU.
Комментарии (67)
- Пользователи обсуждают доступность и ценообразование устройств на базе Strix Halo, отмечая, что в ЕС они либо стоят как за золото, либо их просто нет в продаже.
- Сравнение с Apple Silicon идёт по всем фронтам: объём оперативной памяти, пропускная способность памяти, энергопотребление и цена.
- Обсуждается, что AMD-версия «объединённой» памяти пока не реализована для внешних GPU, и это влияет на выбор покупателей.
- Участники спора задаются вопросом, насколько Strix Halo может быть доступен в виде настольного процессора, и какие ограничения это наложит на сборку ПК с дискретной видеокартой.
- Поднимается вопрос о том, что если AMD не сможет предложить адекватную цену и доступность, то рынок может быть потерян для потребителей, которые ищут ноутбук с приличной производительностью и при этом не на Apple.
The G in GPU is for Graphics damnit
Автор делится опытом оптимизации модели Physarum polycephalum (слизевика) на GPU с использованием Triton. Модель имитирует поведение агентов, оставляющих феромонные следы и реагирующих на их концентрацию. Изначальная реализация на PyTorch страдала от накладных расходов на инициализацию и низкой утилизации GPU из-за мелких операций.
Профилирование выявило, что основные узкие места — этапы сенсоров, движения и диффузии. Автор переписал ключевые части на Triton, объединив сенсорный и двигательный этапы в один ядро и используя атомарные операции для депозиции феромонов. Это позволило добиться 10-кратного ускорения и полной загрузки GPU, подтвердив, что Triton эффективен для задач с мелкозернистым параллелизмом.
Комментарии (75)
- Обсуждается переименование GPU в MPU (Matrix Processing Units) из-за их доминирующего использования в AI, а не графике.
- Поднимается вопрос о том, имеют ли современные AI-ускорители (например, NVIDIA H100) графические выходы и функциональность, поскольку она им не нужна.
- Утверждается, что специализированные GPU для игр теряют актуальность из-за роста мощности интегрированных графических решений (APU) от многих вендоров.
- Обсуждается, что название (GPU) не ограничивает функциональность инструмента, который эволюционирует и находит новое применение (майнинг, AI).
- Высказывается мнение, что CPUs могут обеспечивать лучшее качество рендеринга изображений (прецизионность), хотя и значительно медленнее, чем GPU.