NextSilicon reveals new processor chip in challenge to Intel, AMD
NextSilicon представила новый процессорный чип, бросающий прямой вызов доминированию Intel и AMD на рынке процессоров. Компания, ранее не известная как крупный игрок в этом сегменте, теперь позиционирует себя как серьезного конкурента технологических гигантов. Хотя конкретные технические детали чипа в статье не раскрываются, это событие знаменует собой важный сдвиг в конкурентной ландшафте процессорной индустрии.
Появление NextSilicon на рынке может привести к усилению конкуренции и потенциальному снижению цен для потребителей. Компания, судя по всему, стремится занять нишу в сегменте, где до сих пор доминировали два основных игрока. Это развитие может стимулировать инновации как со стороны NextSilicon, так и со стороны Intel и AMD в ответ на новую угрозу.
Комментарии (41)
- СервисеHome подчеркнул, что Maverick-2 — это не векторный, а data-flow процессор, что важно для понимания его позиционирования.
- Дискуссия показала, что сравнение с Anton, A64FX и другими архитектурами неуместно, так как они решают разные задачи.
- Участники отметили, что для Maverick-2 нужен JIT-подход к софту, а не переписывание существующего кода.
- Было отмечено, что в отличии от GPGPU, Maverick-2 не требует переписывания кода под CUDA/OpenCL модель, но вместо этого требует компиляции под его нативную модель.
- В конце обсуждение сошлось на то, что если рынок действительно нуждается в таком процессоре, то NEC или другой вендор мог бы его сделать, но это не делаеться, потому что это не их фокус.
Evaluating the Infinity Cache in AMD Strix Halo
AMD Strix Halo — флагманский мобильный чип AMD из серии Ryzen AI MAX, сочетающий 16 ядер Zen 5 с мощной iGPU на 20 RDNA 3.5 Workgroup Processors. Особенностью чипа является 32 МБ Infinity Cache (MALL), который работает с 256-битным интерфейсом LPDDR5X-8000. Эта технология, представленная ещё в RDNA2, ранее была сложно оценить из-за ограниченных инструментов мониторинга производительности AMD, которые не предоставляли данных выше L2 кэша.
Strix Halo уникален тем, что предоставляет доступный программный счётчик производительности DATA_BW, позволяющий отслеживать трафик на различных уровнях. Автору, благодаря предоставленному ASUS ROG Flow Z13, удалось определить идентификаторы экземпляров Infinity Fabric, которые AMD не документировала. Сравнение трафика на уровнях Coherent Stations (CS) и Unified Memory Controllers (UMC) позволил создать методику оценки эффективности Infinity Cache — разница между этими показателями служит индикатором хитов в кэш-памяти.
Комментарии (54)
- AMD представляет Strix Halo как игровой чип, но в дискуссии подчеркивается, что у него нет поддержки CUDA и ROCm, что делает его непригодным для локального ИИ.
- Пользователи жалуются на отсутствие документации, отсутствие поддержки и отсутствие программного обеспечения, что делает его непригодным для разработки ИИ.
- В то же время, AMD продолжает позиционировать его как "первый процессор для ИИ ПК", хотя в реальности он не может запускать большинство моделей из-за отсутствия CUDA и ROCm.
- Обсуждение также поднимает вопрос о том, что AMD не предоставляет никаких инструментов для разработки ИИ, в отличие от Nvidia, которая предоставляет CUDA и cuDNN.
AMD's Chiplet APU: An Overview of Strix Halo
AMD представила Strix Halo — свой самый крупный клиентский APU на сегодняшний день. Это универсальный мобильный процессор, способный обрабатывать высокопроизводительные CPU и GPU задачи без необходимости в дискретной графике. TDI чипа варьируется от 55W до 120W, что значительно выше, чем у стандартного Strix Point. Strix Halo стал первым чиплетным APU AMD для потребительского рынка, анонсированным на CES 2025.
Чип может оснащаться двумя 8-ядерными CCD Zen 5 (всего 16 ядер) с 512-битным FPU, как у настольных процессоров. Максимальная тактовая частота — 5.1 ГГц (на 600 МГц ниже, чем у Ryzen 9 9950X). Третий кристалл — это RDNA 3.5 iGPU с 40 вычислительными блоками, 32 МБ Infinity Cache и частотой до 2.9 ГГц, что производительности между RX 7600 XT и RX 7700. Для питания чипа используется 256-битная шина LPDDR5X-8000 с пропускной способностью до 256 ГБ/с, что значительно выше, чем у других APU.
Комментарии (67)
- Пользователи обсуждают доступность и ценообразование устройств на базе Strix Halo, отмечая, что в ЕС они либо стоят как за золото, либо их просто нет в продаже.
- Сравнение с Apple Silicon идёт по всем фронтам: объём оперативной памяти, пропускная способность памяти, энергопотребление и цена.
- Обсуждается, что AMD-версия «объединённой» памяти пока не реализована для внешних GPU, и это влияет на выбор покупателей.
- Участники спора задаются вопросом, насколько Strix Halo может быть доступен в виде настольного процессора, и какие ограничения это наложит на сборку ПК с дискретной видеокартой.
- Поднимается вопрос о том, что если AMD не сможет предложить адекватную цену и доступность, то рынок может быть потерян для потребителей, которые ищут ноутбук с приличной производительностью и при этом не на Apple.
Mysterious Intrigue Around an x86 "Corporate Entity Other Than Intel/AMD"
В Linux-сообществе появился интригующий вопрос о новом игроке на рынке x86-совместимых процессоров. Известный эксперт Кристиан Лудлофф сообщил, что некая "корпоративная организация, не являющаяся Intel или AMD", активно использует ряд специфических x86-инструкций и регистров — тех, что десятилетиями не использовались в мейнстриме. Это заставляет задуматься, кто же этот новый игрок. Возможно, это китайская компания Zhaoxin, разрабатывающая собственные процессоры, или же что-то более экзотическое, вроде проекта от Google или другого техногиганта.
Особенно интересно, что Лудлофф упомянул о необходимости избегать конфликтов с этим новым игроком — это намекает, что речь идет о серьезном проекте, а не просто об академическом эксперименте. Ведь если бы это была просто исследовательская группа, вряд ли бы они стали беспокоиться о конфликтах инструкций с существующими продуктами. Также примечательно, что запрос пришел через надежные источники (Лудлофф известен в сообществе) и касается именно production-использования, а не эксперимента.
Сам факт, что новая сущность работает с такими низкоуровневыми компонентами, как управление памятью (MSR — модель-специфичные регистры) и расширениями набора инструкций (opcode), говорит о серьезности проекта. Это не просто какое-то приложение; это что-то, что требует глубокой интеграции с оборудованием. Возможно, это новый тип ускорителя для AI или что-то вроде того, что делает Apple со своими M-чипами, но для x86.
В любом случае, это напоминание о том, что x86 — это не только Intel и AMD. Архитектура продолжает развиваться, и новые игроки могут приносить инновации. Возможно, мы на пороге нового витка в "войне процессоров", как это было в 90-х. Только время покажет, но интрига определенно захватывает.
Комментарии (66)
- Патенты и лицензии на x86 архитектуру всё ещё действуют, несмотря на то, что они обсуждаются как устаревшие.
- VIA, AMD и Intel имеют перекрёстные лицензии, что делает невозможным для других компаний легально производить процессоры совместимые с x86.
- Существуют ли другие компании, кроме AMD и Intel, которые могут легально производить x86 процессоры? Возможно, что нет.
- Cyrix и National Semiconductor были приобретены в 1999 году, и их технологии стали частью AMD и VIA соответственно.
- Существуют ли другие компании, которые могут производить x86 процессоры?
AMD and Sony's PS6 chipset aims to rethink the current graphics pipeline 🔥 Горячее 💬 Длинная дискуссия
AMD и Sony в рамках проекта Amethyst разрабатывают чипсет для PlayStation 6, который отказывается от классического конвейера рендеринга в пользу машинного обучения. Вместо того чтобы гнаться за полигонами, новая архитектура сфокусирована на эффективном запуске нейросетей, которые обрабатывают сцену и апскейлят изображение. Это позволит в будущем отказаться от дорогих и прожорливых GPU, а вместо этого полагаться на более дешёвые и компактные чипы с машинным обучением.
Комментарии (362)
- Сомневается, что PS6 принесёт значимый прирост производительности из-за дорожающих чипов и фокуса на апскейл/фреймген.
- Считает, что PS5-генерация оказалась худшей за всю историю PlayStation из-за отсутствия игр и дороговизны.
- Указывает, что вместо новых консолей вендоры и разработчики игр вступают в порочный круг: не выгодно делать эксклюзивы под слабое железо, а без эксклюзивов никто не покупает консоль.
- Подчеркивает, что в то время как рынок ПК-видеокарт и консолей соревнуются в том, кто лучше умеет апскейлить старые игры, в то время как игры всё более требовательны к железу и всё меньше игр выходят вовремя.
OpenGL: Mesh shaders in the current year
Khronos одобрила расширение GL_EXT_mesh_shader для OpenGL, и это первый шаг к полному Mesh Shaders в линейке Mesa. Реализация уже влили в mesa, а вот драйвер RadeonSI ждёт своей очереди. Релиз ожидается в ближайшие дни.
Это первая крупная фича для OpenGL за долгое время, и она привнесёт геометрические шейдеры в core Mesa. Работа велась под эгидой AMD, при поддержке Qiang Yu и Shihao Wang.
Комментарии (118)
- Обсуждение в основном вращается вокруг будущего OpenGL и его расширений, включая GL_EXT_mesh_shader и GL_EXT_descriptor_buffer, а также их влияние на Minecraft и другие проекты.
- Участники обсуждают, что новые расширения делают возможным использование шейдеров накладки и дескрипторов буферов, что может быть полезно для таких проектов, как Minecraft.
- Также обсуждается, что OpenGL всё ещё используется в Minecraft и других проектах, и что новые расширения могут помочь в разработке игр.
- Некоторые участники выражают обеспокоенность по поводу того, что OpenGL может быть вытеснен Vulkan и другими API, и что поддержка OpenGL может быть прекращена в будущем.
- В обсуждении также затрагиваются такие темы, как эволюция графических API и их влияние на разработку игр и будущее OpenGL.
A beginner's guide to deploying LLMs with AMD on Windows using PyTorch
AMD и GPUOpen опубликовали практическое руководство, как запустить LLM на Windows с GPU AMD и PyTorch. Самое важное — это не требует ROCm, а использует DirectML, что делает процесс доступным для большинства геймерских видеокарт Radeon. Поддерживаются модели Llama 3.2, Mistral и Gemma, а также Q4 и FP16 квантизация. Подготовка включает установку ROCm и PyTorch, но ROCm не используется; вместо этого используется DirectML. Процесс включает скачивание модели, конвертацию в GGUF с помощью llama.cpp, и запуск через веб-интерфейс Gradio. Важно, что весь процесс происходит на Windows без виртуализации или WSL2.
Комментарии (26)
I have a philosophy for which I have mixed feelings because I like it in principle despite it making me worse off in some other ways: Devs should punish companies that clearly don't give a shit about them. When I see AMD, I think of a firm that heavily prioritized their B2B busin
AMD signs AI chip-supply deal with OpenAI, gives it option to take a 10% stake 🔥 Горячее 💬 Длинная дискуссия
AMD заключила сделку с OpenAI о поставках чипов для искусственного интеллекта, предоставив также опцион на приобретение 10% доли в компании. Это стратегическое партнёрство усиливает позиции AMD на рынке AI-чипов, где доминирует NVIDIA, и обеспечивает OpenAI доступ к передовым аппаратным решениям для разработки и масштабирования своих моделей.
Опцион на долю демонстрирует глубокую интеграцию интересов: AMD получает ключевого клиента и потенциального инвестора, а OpenAI — влияние на поставщика и приоритетный доступ к технологиям. Это может ускорить инновации в области аппаратного обеспечения для ИИ и снизить зависимость от единственного поставщика.
Комментарии (309)
- AMD предоставила OpenAI опцион на покупку 10% своих акций по цене $0.01 за акцию при выполнении определенных условий
- Сделка призвана стимулировать OpenAI к закупкам GPU AMD на сумму до $100 млрд и совместной разработке ПО для AI-чипов
- Рыночная капитализация AMD выросла примерно на $100 млрд после анонса, что частично компенсирует стоимость опциона
- Многие участники обсуждения расценивают сделку как признак финансового пузыря и циркулярных денежных потоков в AI-индустрии
- Партнерство рассматривается как стратегический ход для создания альтернативы доминированию NVIDIA и CUDA
AMD's EPYC 9355P: Inside a 32 Core Zen 5 Server Chip
AMD представила серверный процессор EPYC 9355P на архитектуре Zen 5 с 32 ядрами, который фокусируется не на максимальном количестве ядер, а на повышении производительности каждого из них. Чип работает на частоте до 4,4 ГГц, что выше, чем у моделей с 128 или 192 ядрами (3,7–4,1 ГГц). Для размещения ядер используются восемь кристаллов (CCD), в каждом из которых активировано только четыре из восьми физических ядер, но доступен полный объём кэша L3 — 32 МБ на CCD. Это обеспечивает высокое соотношение кэш-памяти к количеству ядер. Кроме того, каждый CCD подключён к IO-чипу через два канала GMI-Wide, что даёт 64 байта/цикл пропускной способности в каждом направлении и полностью использует возможности IO-чипа.
Система Dell PowerEdge R6715 с этим процессором и 768 ГБ DDR5-5200 демонстрирует теоретическую пропускную способность памяти около 500 ГБ/с. В режиме NPS1 запросы к памяти распределяются по всем 12 контроллерам, обеспечивая единое адресное пространство, но с несколько повышенной задержкой по сравнению с десктопными решениями, например Ryzen 9 9900X. Задержка DRAM в этом режиме немного лучше, чем у Intel Xeon 6 в конфигурации SNC3. Архитектура серверных чипов AMD, с необходимостью связывать множество компонентов через Infinity Fabric, закономерно приводит к более высокой латентности, но кэш-производительность Zen 5 в серверном и десктопном вариантах схожа, отличаясь в основном из-за разницы в тактовых частотах.
Комментарии (31)
- Обсуждаются технические характеристики серверных процессоров AMD EPYC: 768 ГБ оперативной памяти DDR5-5200, 12 контроллеров памяти и высокая пропускная способность.
- Участники делятся опытом использования больших объемов RAM в качестве диска (RAM disk) для ускорения сборки проектов и запуска моделей ИИ.
- Ведутся споры о влиянии архитектуры NUMA на производительность и о том, стоит ли оптимизировать код под нее в рамках одного сокета.
- Обсуждаются возможные опечатки в спецификациях и корректность работы программы счетчика (program counter) в архитектуре EPYC.
- Сравнивается заявленная пропускная способность памяти с другими системами (например, Apple M1 Ultra) и обсуждаются перспективы её роста.
Microsoft CTO says he wants to swap most AMD and Nvidia GPUs for homemade chips
Microsoft планирует постепенно заменить графические процессоры AMD и Nvidia, используемые в своих AI-сервисах, на собственные чипы Maia. Это часть стратегии по снижению зависимости от внешних поставщиков и сокращению затрат на инфраструктуру для машинного обучения. Компания уже тестирует свои чипы в дата-центрах и планирует масштабировать их использование в Azure и других cloud-сервисах.
Переход на собственные решения может значительно сократить расходы на hardware и дать Microsoft больше контроля над производительностью и энергоэффективностью систем. Это также усилит конкуренцию на рынке AI-чипов, где доминируют Nvidia и AMD.
Комментарии (118)
- Microsoft разрабатывает собственные AI-чипы (например, Maia 100) для снижения зависимости от NVIDIA и затрат, хотя и с опозданием по сравнению с Google и Amazon.
- Участники обсуждают, что создание собственного "кремния" — логичный шаг для крупных дата-центров, но для успеха критически важны разработка ПО и инфраструктуры (как у CUDA от NVIDIA).
- Высказываются опасения, что уход крупных игроков на собственные чипы может усилить монополию NVIDIA на рынке для остальных или, наоборот, снизить цены на GPU.
- Поднимается вопрос, является ли производственная мощность (например, TSMC) основным ограничением, а не дизайном чипов.
- Обсуждаются альтернативные архитектуры для AI, включая аналоговые чипы и специализированные решения для inference.
Fp8 runs ~100 tflops faster when the kernel name has "cutlass" in it 🔥 Горячее
В пул-реквесте к Triton представлена реализация механизма persistent attention для ускорения работы с большими контекстами в трансформерах. Вместо пересчета ключей и значений для каждого токена механизм сохраняет их в глобальной памяти, что значительно снижает вычислительную нагрузку при обработке длинных последовательностей.
Автор демонстрирует, как это позволяет эффективно работать с контекстами до 128K токенов, избегая квадратичной сложности традиционного внимания. Практический вывод: такой подход открывает путь к более масштабным моделям без пропорционального роста затрат на вычисления.
Комментарии (141)
- NVIDIA использует хардкод для оптимизации кода, содержащего "cutlass" в названии, что может быть нестабильным и приводить к скрытым багам.
- Подобные практики (оптимизации по именам функций или приложений) исторически распространены среди производителей железа и софта (ATI/AMD, Intel, Microsoft) для улучшения бенчмарков, иногда в ущерб качеству.
- Мотивация таких оптимизаций часто не злонамеренна, а связана с снижением рисков и фокусом на стабильности собственных библиотек, но создаёт новые барьеры.
- В индустрии существуют разногласия по поводу этичности таких практик, но для графических драйверов тюнинг под конкретные игры стал нормой.
- Обсуждаются проблемы проприетарного кода (драйверы, прошивки) и затраты общества на обратную разработку вместо сотрудничества.
Not all OCuLink eGPU docks are created equal
Эксперименты с док-станциями OCuLink для внешних видеокарт на Raspberry Pi 500+ выявили ключевую проблему: совместимость зависит не только от самого дока, но и от кабеля. Один кабель от Minisforum DEG1 с дополнительными проводами заработал с AMD RX 6500 XT и Intel Arc B580, но не с более мощной RX 7900 XT, которая отлично функционировала на более дешёвом доке JMT.
При этом на форумах есть сообщения о успешной работе 7900 XT в DEG1, что указывает на возможные вариации в партиях кабелей или скрытые нюансы конфигурации. Проблема усугубляется тем, что спецификации кабелей OCuLink редко чётко указаны при продаже, а их распиновка может критично влиять на поддержку высокопроизводительных карт.
Комментарии (27)
- Обсуждается совместимость eGPU через OCuLink и Thunderbolt, включая проблемы с подключением и стабильностью работы на разных платформах (x86, ARM, Linux, macOS).
- Критикуется качество и совместимость оборудования от Minisforum, особенно под Linux, отмечаются проблемы с BIOS и случайные сбои.
- Рассматриваются технические детали подключения (адаптеры M.2 to OCuLink, изоляция линий PCIe) и необходимость специального оборудования для диагностики.
- Упоминается возможность запуска x86-игр на ARM (например, Raspberry Pi) через эмуляцию (box86/box64) или вычисления на GPU.
- Отмечается специфика OCuLink, требующего подключения при загрузке, в отличие от горячего подключения Thunderbolt.
Windows ML is generally available
Windows ML теперь общедоступна, позволяя разработчикам внедрять локальный ИИ на устройствах с Windows. Это решение поддерживает аппаратное ускорение через DirectML, обеспечивая высокую производительность на CPU, GPU и NPU. Разработчики могут использовать предварительно обученные модели или создавать собственные, интегрируя их в приложения без облачной зависимости.
Ключевые преимущества включают снижение задержек, повышение конфиденциальности данных и работу в офлайн-режиме. Windows ML совместима с популярными фреймворками, такими как ONNX, и упрощает развёртывание на миллиардах устройств. Это открывает новые возможности для сценариев вроде обработки изображений, распознавания речи и генеративного ИИ прямо на устройстве пользователя.
Комментарии (28)
- Критика подхода Ollama к веб-поиску и его влияния на open-source, в сравнении с глубокой интеграцией Windows ML в экосистему Microsoft.
- Обсуждение технических проблем с бэкендами AMD (ROCm, MIGraphX, Vitis) и надежд на улучшение поддержки оборудования в Windows ML.
- Вопросы о приватности данных при использовании Windows ML и сравнение с локальным запуском моделей через Ollama.
- Сравнение Windows ML с решением Apple для доступа к локальным моделям и обсуждение его как абстракции для аппаратного обеспечения (аналог DirectX для ML).
- Обсуждение поддержки ONNX как стандарта и проблем с совместимостью пользовательских слоев моделей (например, flash attention) в Windows ML.
Athlon 64: How AMD turned the tables on Intel 🔥 Горячее 💬 Длинная дискуссия
AMD совершила стратегический прорыв в 2003 году, выпустив Athlon 64 — первый 64-битный процессор x86, который заставил Intel отказаться от собственного проекта Itanium и последовать за конкурентом. Intel изначально не хотела расширять x86 до 64 бит из-за архитектурного наследия и предпочла бы начать с чистого листа, создав более эффективный Itanium, но он провалился из-за отсутствия обратной совместимости и слабой поддержки софта.
AMD пошла на риск, понимая, что Itanium угрожает её существованию, и предложила рынку плавный переход: пользователи могли работать с 32-битными приложениями на полной скорости, а позже перейти на 64-битные ОС без потери совместимости. Это сработало — Microsoft поддержала архитектуру, а рынок оценил удобство. Athlon 64 не только выжил, но и заставил Intel лицензировать технологию AMD, что изменило расстановку сил в индустрии.
Комментарии (221)
- Intel разработала собственные 64-битные расширения для x86 (Yamhill) ещё до AMD64, но отказалась от их внедрения из-за опасений конкуренции с Itanium (IA-64).
- Ключевым фактором успеха AMD64 стала обратная совместимость с существующим x86-софтом, в отличие от радикально новой и несовместимой архитектуры Itanium.
- Переломным моментом стало доминирование AMD с Athlon 64, однако Intel позже вернула лидерство с архитектурой Core, а затем вновь уступила с приходом AMD Zen.
- Решение Microsoft отказаться от поддержки 16-битного кода в 64-битных Windows было технически обосновано ограничениями AMD64, а не маркетинговым выбором.
- Разработка AMD64 велась с учётом опыта других архитектур (например, DEC Alpha) и включала устранение ряда недостатков x86, таких как малое количество регистров.
AMD claims Arm ISA doesn't offer efficiency advantage over x86 💬 Длинная дискуссия
- AMD на IFA-2025: «x86 уже не менее экономичен, чем Arm»
- Компания уверена, что ноутбуки на Ryzen и Core живут столько же, сколько Arm-решения, при этом сохраняют совместимость с огромной экосистемой x86
- AMD считает, что энергоэффективность определяется не архитектурой, а всей платформой: ядро, GPU, память, ПО
- Проект K12 на Arm был закрыт: выгоды от перехода на другой ISA оказались несоразмерны потерям совместимости
Комментарии (366)
- Эксперты сходятся: ISA (x86, ARM, RISC-V) почти не влияет на энергоэффективность; решают микроархитектура, техпроцесс, uncore, PMIC и ОС.
- Apple M — лидер не из-за ARM, а благодаря интеграции памяти, тонкому управлению питанием и приоритету эффективности.
- Современные x86 (Lunar Lake, Strix Halo) подтянулись по idle, но при нагрузке всё ещё уступают M4 в производительности/Вт.
- ARM-системы всё ещё страдают от хаоса загрузки (no UEFI, vendor-kernel), тогда как x86/PC стандартизированы с BIOS/UEFI.
- Для мелких ядер (MCU) простой ISA важен; для высокопроизводительных ядер декодер «съедает» <1 % площади и энергии.
- Всё сводится к реализации: тот же GCC на x86 генерирует RISC-подобные инструкции, а различия даёт предсказатель, кэши, техпроцесс.
I am giving up on Intel and have bought an AMD Ryzen 9950X3D 🔥 Горячее 💬 Длинная дискуссия
- Второй за год умер Intel Core Ultra 9 285K: после 4-часовой нагрузки (100 °C, 300 Вт) ПК не проснулся из suspend, кнопка питания мертва.
- Первый экземпляр сдох в марте; в отзывах магазина полно аналогичных случаев — больше не верю Intel.
- Комната была под кондиционером (25–28 °C), температура ядра 100 °C в пределе 110 °C, так что дело не в жаре.
- Взял Ryzen 9 9950X3D: быстрее 285K в многопотоке, ~100 Вт меньше под полной нагрузкой, температура 75 °C.
- Плата ASUS X670E-E, 96 ГБ DDR5-6000, остальное железо без изменений.
- Вывод: Intel пока ненадёжен, AMD даёт ту же скорость с меньшим нагревом и расходом.
Комментарии (318)
- Пользователи жалуются на нестабильность современных Intel и AMD: «виснут» в idle, падают под нагрузкой, греются до 100 °C и выгорают.
- Виной всему: заводской разгон «на грани», плохое охлаждение, BIOS-«усилялки» и, возможно, софт-ошибки, проявляющиеся только на новых CPU.
- ECC-память помогает отлавливать тихие ошибки ОЗУ, но на десктопе почти не рекламируется, матплаты поддерживают её «тихо», а модули стоят в 2 раза дороже.
- AMD даёт больше ядер и AVX-512, Intel — стабильнее iGPU и меньше жрёт в простое; выбор чаще делается по цене, политике или просто «что есть в продаже».
- Общий вывод: современные настольные CPU превратились в «лотерею» — нужен тщательный подбор питания, охлаждения и BIOS, иначе рискуете получить дорогой нагреватель.
io_uring is faster than mmap 🔥 Горячее
TL;DR
Чтение напрямую с диска быстрее, чем из кеша в памяти: пропускная способность SSD растёт, а латентность памяти стоит на месте. Нужны новые инструменты.
Эксперимент
- Задача: подсчитать количество десяток в 50 ГБ псевдослучайных
int. - Железо: AMD EPYC 7551P, 96 ГБ DDR4-2133, два Samsung PM983a PCIe 3.0 SSD (3,1 ГБ/с каждый) в RAID-0.
- Ограничения:
- Память: 13 ГБ/с на поток (3 канала × 2133 МТ/с × 8 Б / 4 NUMA-домена).
- Диски: 6,2 ГБ/с суммарно.
Код
int* data = mmap(..., size, PROT_READ, MAP_SHARED, fd, 0);
for (...) if (data[i] == 10) count++;
Результаты
- Первый запуск (с диска): 0,61 ГБ/с — ограничение диск.
- Второй запуск (из кеша): 3,71 ГБ/с — всё ещё ниже пропускной способности памяти.
- Бутылочное горлышко: не векторизованный цикл, ~3–4,5 млрд инструкций/с.
Комментарии (120)
- mmap тормозит из-за последовательных page-fault и 4 Кб страниц; io_uring на 6 потоках читает буферы заранее и просто отдаёт готовые.
- Пропущены MAP_POPULATE / MADV_SEQUENTIAL / hugepages — без них сравнение «mmap vs io_uring» нечестое.
- Автор признаёт кликбейтное название «Memory is slow, Disk is fast»; суть: «RAID-0 NVMe даёт больше пропускной канала, чем DDR5-каналов на тестовой машине».
- Под капотом io_uring + O_DIRECT сам управляет кэшем, mmap же полагается на page-cache ядра.
- PCIe-5 ×128 линий серверных CPU уже >1 ТБ/с, что выше DDR5-6400 12-канального узла (~600 ГБ/с), но данные всё равно идут в RAM перед CPU.
Use One Big Server (2022) 🔥 Горячее 💬 Длинная дискуссия
Один большой сервер вместо оркестра микросервисов
Современный сервер Azure с двумя AMD EPYC 3-го поколения даёт:
- 128 физических ядер / 256 потоков
- до 8 ТБ ОЗУ, 200 ГБ/с пропускная способность
- 128 линий PCIe 4.0 → 30 NVMe + 100 Гбит/с сеть
- 4 TFLOPS — в 2000 г. хватило бы для первой строчки Top500
Что он умеет
- 800 Гбит/с видео (Netflix)
- 1 млн IOPS в NoSQL, 70 k IOPS в PostgreSQL
- 500 k RPS nginx, компиляция ядра Linux за 20 с, кодирование 4K-видео 75 fps
Сколько стоит
- Аренда:
– OVH: 128 ядер, 512 ГБ ОЗУ, 50 Гбит/с — $1 318/мес.
– Hetzner: 32 ядра, 128 ГБ — €140/мес.
– AWS m6a.metal: 96 ядер, 768 ГБ — $6 055/мес. - Покупка: ~$40 000 за аналогичную конфигурацию у Dell.
Вывод
Для большинства задач один такой сервер перекрывает потребности всей компании. Распределённые системы нужны редко; чаще достаточно «одного большого сервера» и простого деплоя.
Комментарии (250)
- «Облачный налог» заставляет инженеров выбирать только дорогие облачные решения, хотя за $200/мес. у Hetzner можно взять 48 ядер и 128 ГБ ОЗУ, тогда как AWS даёт лишь 4 vCPU и 16 ГБ.
- Многие участники подтверждают: при стабильной нагрузке гибрид «colo + VPS» или одна большая машина дешевле и проще, чем микросервисы и K8s.
- Ключевые риски: единая точка отказа, необходимость админов и железных рук; зато нет «meta-слоёв» Docker-proxy-nginx и можно выжимать максимум из железа.
- Часть команд тратит годы на «cloud-native» пайплайны и закрывается, не успев выйти на рынок; проще начать с PaaS/Hetzner и переезжать, когда счёт действительно больно.
- Для критичных задач достаточно двух физических серверов (active/backup) и CDN; 99,9 % доступности хватает большинству бизнесов, которым на деле не нужен 100 % uptime.
With AI Boom, Dell's Datacenter Biz Is Finally Bigger Than Its PC Biz
- Два варианта у OEM: продавать стек Nvidia (рост выручки, снижение маржи) или остаться без AI-заказов, довольствуясь лишь периодическими продажами серверов Intel/AMD.
- Dell выбрал первый путь и стал ключевым поставщиком крупнейших AI-кластеров (xAI, CoreWeave), используя «покупай американское» и собственный масштаб.
Комментарии (65)
- Пользователи обсуждают, что Dell выигрывает на всплеске спроса на AI-серверы, несмотря на более высокую цену и «энтерпрайз-поддержку».
- Ключевые причины выбора Dell: быстрая поставка, надёжные цепочки поставок, гарантия, удобный iDRAC и «не мой кошелёк — моя голова».
- Некоторые считают, что это очередной пузырь: «графокард-максимизаторы» поглощают ресурсы, а в будущем рынок окажется завален дешёвыми бывшими AI-серверами.
- Участники спорят, когда лопнет пузырь: прогнозы варьируются от «в любой момент» до «держится до 2026 года и дальше».
- Есть надежда, что после взрыва спроса появится дешёвая «железка» для домашних лаб и конкуренция для AWS.
GMP damaging Zen 5 CPUs? 💬 Длинная дискуссия
Краткая сводка проблемы
Два Ryzen 9950X вышли из строя за несколько месяцев при запуске тестов GMP. На обратной стороне процессоров появилось пятно ≈25 мм². Оба случая при низкой температуре окружающей среды (<20 °C).
Конфигурации
- Ubuntu, Asus B650M-K, 64 ГБ DDR5-4800 ECC, SF450, NH-U9S.
- Gentoo 6.12.31, Asus B650M-A WIFI II, 96 ГБ DDR5-5600 ECC, RM650, NH-U9S.
Возможные причины
- TDP 170 Вт, радиатор рассчитан на 165 Вт.
- Смещённое крепление радиатора (по рекомендации Noctua) выдавило термопасту, возможно, образовались пустоты при термоциклах.
- Процессоры работали под полной нагрузкой: цикл MULX каждый такт.
- Ни разгона, ни повышенного напряжения не было.
Наблюдения
- Оба процессора вышли из строя не сразу, а через пару месяцев максимальной нагрузки.
- Система на 7950X при аналогичной нагрузке стабильна и даже горячее.
Комментарии (196)
- Пользователи массово сообщают о смерти процессоров Ryzen 9 9950X/9950X3D даже без разгона.
- Основные подозрения: слабое охлаждение (NH-U9S на 140 Вт при реальных 200–240 Вт), агрессивные настройки питания/матплаты (PBO, LLC), возможные локальные перегревы, не отлавливаемые датчиками.
- TDP 170 Вт назван маркетинговым; реальное потребление доходит до 235–240 Вт, поэтому «кулер на 165 Вт» изначально недостаточен.
- Некоторые добавляют проблемы с напряжением/питанием от конкретных плат ASRock/ASUS и «рваными» нагрузками вроде GMP или FFT.
- Общий вывод: железо должно само защищаться, но при несоответствии СО, BIOS-настроек и реальных нагрузок защита может не успеть.
Intel's "Clearwater Forest" Xeon 7 E-Core CPU Will Be a Beast
- Clearwater Forest — будущий Xeon 7 с энергоэффективными E-ядрами на техпроцессе Intel 18A (≈1,8 нм).
- Clearwater Rapids — параллельная версия с производительными P-ядрами.
- Процессоры полагаются на 2,5D EMIB и 3D Foveros, впервые опробованные в Ponte Vecchio.
- AMD уже контролирует >40 % выручки и >27 % поставок серверных CPU x86; Intel сохраняет 60 % выручки и 72 % поставок.
- Гиперскейлеры активно внедряют собственные Arm-чипы, поэтому каждый x86-сокет ценен.
- E-вариант поможет Intel отладить 18A и 3D-упаковку перед массовым запуском P-ядер.
Комментарии (69)
- Clearwater Forest: 288 E-ядер Xeon 7 на 18A, преемник 144-ядерного Sierra Forest-SP.
- Производительность Darkmont-сore ≈ Neoverse V3/Cortex-X4, уступает Zen 5c.
- 12 каналов памяти вызывают опасения по пропускной способности; для LLM-задач может не хватить.
- Поддержка 2P-систем → до 576 физических ядер в одном сервере, цена vCPU резко падает.
- Пользователи скептичны: Intel «спала» десятилетие, не доверяют свежим заявлениям и микрокоду.
Framework Laptop 16 🔥 Горячее 💬 Длинная дискуссия
- Framework Laptop 16 — предзаказы открыты
- Desktop — обзор, запчасти, документация, конфигуратор
- Laptop 12 — обзор, запчасти, документация, конфигуратор
- Laptop 13 — обзор, запчасти, документация, конфигуратор
- Laptop 16 — обзор, запчасти, документация, конфигуратор
Магазин
- Всё
- Outlet
- Ноутбуки
- Десктопы
- Материнки
- Модули расширения
- Память и накопители
- Клавиатуры
- Запчасти
- Инструменты
- ПО
- Мерч
Поддержка
О компании
Комментарии (282)
- Пользователи жалуются на отсутствие WWAN-модуля, мелкие стрелки и нехватку клавиш Home/End.
- Радуются AMD-видеокартам как более «линуксовским», но спорят о проблемах NVIDIA.
- Цена новой сборки (≈ $4000) вызывает шок: «дороже, чем игровой ROG с RTX 3080».
- Вопрошают о реальной экономике модульности, сроках поставки в Японию и о OLED-экранах.
- Любители Linux спрашивают о «из коробки» и просят ThinkPad-стильный trackpoint.
Ask HN: Why hasn't x86 caught up with Apple M series? 🔥 Горячее 💬 Длинная дискуссия
—
Комментарии (418)
- Apple опережает благодаря вертикальной интеграции: единое ядро macOS/iOS, SoC-архитектура, память на подложке, отсутствие легаси-инструкций и тонкая настройка всего стека «железо-ОС-приложения».
- x86-платформе мешают обратная совместимость, разные OEM-вендоры, сменные модули памяти (DDR вместо LPDDR) и необходимость оптимизировать под сотни конфигураций.
- AMD уже приблизилась: Ryzen AI Max 395+ в Framework Desktop почти догоняет M4 Pro по производительности и энергоэффективности, но пока не вышла в лэптопах.
- На практике большую роль играет ОС: Linux-ноутбуки часто теряют до 2× времени автономности из-за драйверов, Chrome, GPU-ускорения и отсутствия агрессивных профилей энергосбережения.
- Итог: догнать M1/M4 «на бумаге» уже почти возможно, но сопоставимый реальный опыт потребует либо закрытой экосистемы, либо множества доработок в прошивке, драйверах и ПО.
Looking back at my transition from Windows to Linux
Итоги моего ухода с Windows на Linux в эпоху анти-клиента
Профессионал с 25-летним стажем, я окончательно перешёл на Linux в 2023 г. и уже два года не возвращаюсь.
Windows 11 стал рекламной площадкой: Copilot, Recall, OneDrive навязываются и крадут данные без спроса.
Подписки вместо покупки, «облачные» файлы без согласия — всё это разрушает доверие.
Технически Linux сложнее, но свобода стоит усилий.
Европа (Digital Markets Act) и движения вроде StopKillingGames и RightToRepair дают надежду.
Ключевой вывод: контроль над купленным — основа личной свободы.
Комментарии (114)
- Пользователи массово переходят на Linux из-за разочарования Windows 10/11 и улучшений десктоп-опыта.
- В семьях и малых бизнесах Linux уже заменяет Windows на ноутбуках и POS-терминалах, несмотря на «налог Microsoft» за предустановку.
- Среди оставшихся препятствий: игры с античитом, Adobe Creative Suite, Citrix, управление питанием/тачпадом, «виснут» при нехватке RAM.
- На работе Linux-доступен по запросу, но Word/Excel/PowerPoint и их форматы всё ещё тормозят миграцию SMB.
- Сообщество делится лайфхаками: Bee-link-мини-ПК вместо dual-boot, earlyoom/OOM-kill, AMD-видеокарты для игр, KVM-переключатели.
It is worth it to buy the fast CPU 💬 Длинная дискуссия
Купи быстрый процессор
Современные CPU стали шокирующе быстрыми, но большинство по-прежнему используют старые мобильные чипы, теряя продуктивность.
Подписка на AI-инструменты вроде Cursor стоит $480/год, а топовый Ryzen 9 9950X — всего $500. Амортизация за 3 года = $170/год: дешевле, чем AI, и выгода очевидна.
Бенчмарки
- Корпоративный ноутбук 2024 (i7-1165G7, 2020 г.)
- Лучший ThinkPad 2024 (Ryzen 7840U)
- Десктоп 2025 (Ryzen 9950X)
Разница — >10× на компиляции ядра Linux и TLS-операциях. 3 с против 30 с или 300 мс — это кардинально меняет опыт.
Правило:
- Десктоп ≈ 3× быстрее ноутбука
- Топ-CPU 2025 ≈ 3× быстрее топа 2022
- Новые облачные VM тоже 2-3× быстрее за ту же цену
Если вы оправдываете AI-подписку, оправдайте и лучший инструмент — быстрый CPU.
Комментарии (371)
- Почти все согласны: «быстрый процессор = меньше ожидания компиляции → выше продуктивность», и ROI для старших разработчиков окупается за недели.
- Но выгода сильно зависит от задач: многие уже компилят в облаке/сервере, а фронтенд-сборки всё равно тормозят из-за однопоточных инструментов.
- Некоторые 10-летние CPU (i7-4770, Phenom II) всё ещё «достаточно быстры», если добавить RAM и SSD; апгрейд не всегда оправдан.
- Ноутбуки ограничены теплопакетом: «топ-чип в лэптопе ≠ тот же чип в десктопе».
- Итог: берите максимально быстрый десктоп, если компилируете локально; если работаете в облаке — экономьте деньги и нервы.
U.S. government takes 10% stake in Intel 🔥 Горячее 💬 Длинная дискуссия
- Государство США купило 10 % акций Intel за 8,9 млрд долл. (433,3 млн шт. по 20,47 $ за штуку).
- Сделка — часть усилий администрации Трампа по усилению контроля над частным сектором.
- На фоне новости акции Intel подскочили на 6 %.
- Ранее на этой неделе SoftBank пообещал вложить в компанию ещё 2 млрд долл.
Комментарии (591)
- Правительство США получило 10 % акций Intel без вложения новых денег, переоформив уже выделенные гранты CHIPS Act.
- У государства не будет места в совете директоров и управленческих прав, но сделка выглядит как политизированная вымогательская «договорённость».
- Критики называют это национализацией «à la carte»: прибыль — частным инвесторам, убытки — налогоплательщикам.
- Участники обсуждения сравнивают происходящее с китайской моделью госвлияния на бизнес и предрекают судебные иски акционеров.
- Вопросы: почему именно Intel, кто следующий (AMD, Nvidia, Micron?) и действительно ли это поможет догнать TSMC.
Show HN: Play Pokémon to unlock your Wayland session
wlgblock — экран-блокировка в стиле Game Boy для Wayland.
Проект AdoPi: простой скрипт на Bash, который запускает «игру»-заставку и требует пароль для разблокировки.
- Зависимости:
swaylock,grim,slurp,wl-clipboard,imagemagick,fzf,bash. - Установка: клонировать репозиторий, выполнить
make install. - Использование:
wlgblockили горячая клавиша в Sway/i3.
Скрипт делает снимок экрана, накладывает пиксель-фильтр «Game Boy», запускает swaylock с этим изображением и ожидает ввода пароля.
Комментарии (41)
- Пользователи радуются, что проект-игра на Wayland показывает, что экосистема уже способна на «тяжёлую» кастомизацию и работает лучше, чем споры последних пяти лет.
- Многие удивлены, что «игра-скринсейвер» появилась раньше обычного нормального screensaver'а для Wayland.
- Скептик признал: блокировка экрана в Wayland действительно работает лучше и логичнее, чем в X.
- Разработчик anajimi уже обещает попробовать сделать полноценный screensaver на ext-session-lock.
- В KDE 82 % сессий уже Wayland; Sway и labwc активно используются, но NVIDIA всё ещё вызывает проблемы — «переходи на AMD».
The Framework Desktop is a beast 🔥 Горячее 💬 Длинная дискуссия
Framework Desktop — компактный 4,5-литровый ПК, который почти не шумит даже под полной нагрузкой. Внутри — мобильный AMD Ryzen AI Max 395+ (16 ядер Zen5, 5,1 ГГц), и он оказывается быстрее старого Ryzen 9 7950X в большом корпусе.
Корпус разукрашивается 21 сменной плиткой, можно печатать свои. Внешне — свежий минимализм вместо алюминия и RGB.
По производительности:
- Docker-тест HEY: почти вдвое быстрее Beelink SER8 и на 40 % опережает M4 Max.
- Geekbench 6 multi-core: на уровне M4 Max, заметно выше M4 Pro и Core i9-14900K.
- Одноядерка уступает Apple ≈20 %, но для многопоточных задач это лидер.
Цена выше, чем у Beelink, но пока это единственный безвентиляторный 395+ на рынке.
Комментарии (353)
- Framework Desktop с Ryzen AI Max+ 395 даёт 64–128 ГБ единой памяти, позволяя запускать крупные LLM без дискретной видеокарты и дешевле, чем Mac Studio, но дороже Mini.
- Производительность ниже CUDA-карт Nvidia и M4 Max, зато выше, чем у iGPU Intel и старых решений.
- Многие сомневаются в цене и форм-факторе: за те же деньги можно взять Minisforum, Beelink, HP Z2 Mini или собрать полноценный десктоп.
- Пока CUDA-стека нет, AMD-совместимость с популярными AI-фреймворками ограничена.
- Ремонтопригодность и модульность Framework оценили, но в десктоп-сегменте это не уникально.