Intel's E2200 "Mount Morgan" IPU at Hot Chips 2025
- Назначение: IPU E2200 «Mount Morgan» выгружает из хост-сервера инфраструктурные задачи (SDN, оркестрация, сбор метрик), освобождая ядра для аренды и повышая изоляцию.
- Ядра: 24× Arm Neoverse N2 (было 16× N1), 2 МБ L2 на ядро, 2,5 ГГц; производительности хватает для полноценных серверных нагрузок.
- Память: 4× LPDDR5-6400, 64 ГБ, 51 ГБ/с (vs 25 ГБ/с у предшественника); 32 МБ общего кэша уменьшает нагрузку на контроллеры.
- Гибкость: может выглядеть как сетевой адаптер для 4 хостов или работать автономно как мини-сервер.
Комментарии (29)
- Intel выпустил PCIe-карту «Mount Morgan» с 24-ядерным ARM Neoverse N2 от TSMC — не своим процессом, не своей архитектурой, не своим ISA.
- Устройство позиционируется как «Nitro на палке»: сетевой контроллер с ARM-ядрами для оффлоада управления, а не полноценный сервер.
- 4-хостовый MR-IOV-режим повторяет идею AWS Nitro, но вызывает вопросы о необходимости писать под это ПО и боязни, что Intel рано или поздно свернёт проект.
- Гиперскейлеры вроде Google уже используют предыдущее поколение, поэтому новинка может жить за счёт одного-двух крупных заказчиков или даже продажи IP.
- Участники сомневаются в долгосрочной стратегии Intel: все производятся на TSMC, собственные 10 nm только разошлись, а гос-структуры США вряд ли позволят компании обанкротиться — «слишком важна для нацбезопасности».
You’re a slow thinker. Now what? 🔥 Горячее 💬 Длинная дискуссия
—
Комментарии (199)
- Медленное мышление — не дефект: оно даёт глубокое понимание и надёжные решения, особенно в R&D и сложной разработке.
- Быстрые собеседования, «звонки налету» и групповые чаты вытесняют таких людей; им нужно время и асинхронный формат.
- Некоторые «медленные» на деле просто не болтают без фильтра; под маской «туповатости» часто скрываются ADHD, аутизм или просто низкая обработка скорости, а не интеллект.
- Команды теряют сильнейших инженеров, если оценивают только скорость ответа; лучшее — комбинировать «быстрых» и «глубоких».
- Выход: писать вместо говорить, брать тайм-аут на обдумывание, искать роли с асинхронной коммуникацией и не измерять мысли секундомером.
KDE launches its own distribution 🔥 Горячее 💬 Длинная дискуссия
KDE Linux — новая неизменяемая ОС от KDE на базе Arch, но без pacman.
Корень — Btrfs, /usr — только для чтения (EROFS), обновления атомарные, откат до 5 версий.
Wayland-only, UEFI-only, X11 и BIOS не поддерживаются.
Собирается через KDE Builder, приложения — Flatpak.
Цель: показать «идеальный» KDE-стек без ограничений сторонних дистрибутивов.
Альфа представлена на Akademy 2025; KDE neon пока жив, но будущее не решено.
Комментарии (449)
- KDE Linux — неизменяемая, Wayland-only система на базе пакетов Arch, но без pacman; всё ПО ставится Flatpak-ом или собирается KDE Builder.
- Пользователи делятся: кому-то нравится стабильное «железное» ядро и UX-first подход, других пугает отсутствие X11, невозможность докинуть модули в базу и зависимость от «багового» Flatpak.
- Критики считают проект «еще одним дистрибутивом ради дистрибутива», отвлекающим силы от самой KDE, и предлагают использовать готовые immutable-решения (Fedora Kinoite, Aeon, Arkane).
Fraudulent Publishing in the Mathematical Sciences
Фальшивые публикации в математике: краткий пересказ
Авторы анализируют «хищные» журналы и конференции, публикующие математические статьи без рецензии.
- Масштаб: 50–80 % «математических» журналов в некоторых списках оказались фейковыми.
- Признаки: отсутствие рецензии, плата за публикацию, поддельные ISSN, имена редакторов, импакт-факторы.
- Последствия: засорение научометрии, потеря доверия к результатам, трудности при проверке грантов и аттестации.
- Решения: белые списки (DOAJ, zbMATH open), проверка через ISSN, SCImago, Web of Science; отказ учитывать публикации в сомнительных журналах при найме и продвижении.
Комментарии (37)
- Участники обсуждают, как метрики публикаций (impact factor, цитирования) превратились в главную цель, а не в инструмент: «когда мера становится целью, она перестаёт быть хорошей мерой» (Goodhart).
- В математике это особенно заметно: топ-журналы имеют IF ~5, а специализированные — <1, поэтому «рейтинговые» Q1-журналы типа MDPI Mathematics (IF>2) вытесняют медленные, но качественные издания.
- Процветают фабрики статей, «брокеры цитат» и чёрный PR: авторы покупают тексты, цитаты и даже используют «пушистую логику» вместо fuzzy logic, чтобы обойти антиплагиат.
- Проблема усилилась после 1990-х, когда базовое финансирование сменили грантами «по метрикам», а развивающиеся страны начали требовать «международных» публикаций для продвижения по службе.
- В итоге математика, где работа и так медленная и трудоёмкая, всё больше подвержена игре системой, что подрывает доверие и даёт аргументы сторонникам сокращения финансирования.
Minerals represent potential biosignatures in the search for life on Mars
Краткий перевод на русский (в 2 раза сокращён, markdown):
- В кратере Джезеро Марса Perseverance обнаружил тонкие слои сульфидов и органики, перемежающиеся с оксидами.
- Такие «красно-окислительные» пары формировались при колебаниях уровня воды и кислорода 3–3,5 млрд лет назад.
- Сера и железо acted как «батарейки»: при затоплении восстанавливались, при высыхании – окислялись, фиксируя углерод.
- Процесс аналогичен земным микробным сообществам в периодически затопляемых почвах.
- Найденные молекулы (бензол-, карбоксиль-, нитриль-функции) устойчивы к радиации и могут сохранять биосигнатуры.
- Результат указывает на длительное существование воды, активное вещественное круговорот и повышенную астробиологическую перспективу кратера.
Комментарии (42)
- NASA сообщила, что в кратере Джезеро найдены органические структуры, которые «не удаётся объяснить без участия жизни», но это пока не «курок» — остаются и abiotic-альтернативы.
- Учёные подчёркивают: для окончательного вердикта нужен возврат образцов, а перспективы миссии MSR туманны.
- Комментаторы опасаются «еще один Great Filter пройден»: если жизнь зародилась и на Марсе, и на Земле, значит, дальнейший переход к многоклеточным формам или разуму может быть редким.
- Обсуждается panspermia: материал мог переноситься между соседними планетами, поэтому происхождение жизни могло быть единым для обоих миров.
- NASA специально выбирает древние, а не современные водные участки, чтобы не заразить возможную марсианскую биосферу земными микробами.
Charlie Kirk killed at event in Utah 🔥 Горячее 💬 Длинная дискуссия
- Консерватор Чарли Кирк ранен на мероприятии в Университете Юты; стрельба началась во время выступления.
- Полиция эвакуировала зал, задержан один подозреваемый; состояние Кирка стабильное.
Комментарии (1476)
- @dang призвал воздерживаться от насилия и агрессии в комментариях.
- Участники сравнивают происходящее с «свинцовыми годами» в Италии и убийством Франца Фердинанда.
- Многие считают, что насилие стало следствием поляризации и «командной» политики.
- Подчёркивают: убийство — это атака на саму возможность дебатов, а не проблема оружия.
- Пользователи призывают снизить градус, прекратить оправдание насилия и соблюдать закон.
Defeating Nondeterminism in LLM Inference 🔥 Горячее
Почему LLM неповторяемы и как это исправить
Проблема
Даже при temperature=0 и одном железе выводы моделей различаются от запуска к запуску. Популярное объяснение: «параллельные GPU-ядра + погрешности float = недетерминизм». Это не вся правда.
Что на самом деле происходит
- Все «математические» ядра (matmul, softmax и т.д.) внутри одного forward-прохода детерминированы — бит-в-бит.
- Недетерминизм появляется между forward-проходами:
- динамическое разбиение работы на потоки (different thread blocks);
- неупорядоченные редукции при вычислении
softmax/layernorm; - разные стратегии
cudnn/cublasв зависимости от загрузки GPU; - кэш-промахи и
atomicAddв attention.
Как убедиться
A = torch.randn(2048, 2048, device='cuda', dtype=torch.bfloat16)
B = torch.randn(2048, 2048, device='cuda', dtype=torch.bfloat16)
ref = A @ B
for _ in range(1000):
assert (A @ B == ref).all() # всегда True
Матричное умножение повторяется, а вот softmax(A @ B) — уже нет.
Побеждаем за 3 шага
-
Фиксируем редукции
torch.use_deterministic_algorithms(True)CUBLAS_WORKSPACE_CONFIG=:4096:8(для CUDA ≥10.2)export CUDA_LAUNCH_BLOCKING=1(медленно, но зато стабильно).
-
Отключаем динамические алгоритмы
torch.backends.cudnn.deterministic = Truetorch.backends.cudnn.benchmark = False- в vLLM:
--disable-custom-all-reduce,--enforce-eager.
-
Контролируем параллелизм
- фиксированный батч и длина последовательности;
- один GPU-поток (
tensor_parallel_size=1); - один и тот же порядок запросов (queuing seed).
Результат
На Llama-3-8B с vLLM + указанными флагами 1000 прогонов дают идентичные токены вплоть до последнего бита. Стоимость: ≈8 % к throughput.
TL;DR
Недетерминизм — не «float плавает», а race-conditions вне математического ядра. Убери их, и LLM станет строго воспроизводимым.
Комментарии (117)
- Корень проблемы: «один и тот же» запуск LLM выдаёт разные токены из-за race-конкуренции ядер, неассоциативности float и недетерминированных GPU-ядёр; авторы показали, как зафиксировать порядок операций и получить бит-в-бит повтор.
- Практика: temperature=0 ≠ гарантия: во-первых, библиотеки всё равно подкладывают ε>0, во-вторых, MoE-модели выбирают экспертов в зависимости от состава батча, поэтому даже «одинаковый» запуск в API почти никогда не повторяется.
- Зачем нужна детерминированность: CI-тесты, отладка багов, шеринг промптов между разработчиками, валидация через LLM, агентские цепочки и RL-обучение требуют, чтобы «один и тот же вход = один и тот же выход».
- Ограничения: статья решает только замкнутую задачу inference-ядер; контекст, семантически эквивалентные формулировки и много-нодовые коллективы остаются источником разброса; при temperature>0 нужен фиксированный PRNG-сид.
'Block Everything' protests sweep across France, scores arrested
- Франция: акции «Блокировать всё» охватили страну, десятки задержаны.
- Протесты против правительства и экономики, перекрыты дороги, порты, нефтебазы.
- Полиция применила слезоточивый газ и водомёты; в Париже и Руане — столкновения.
Комментарии (90)
- Франция бунтует из-за пенсионной реформы и неравенства: молодёжь (Gen Z) видит, как богатые «непобедимые» демонстрируют роскошь, пока бедные теряют последнее.
- Парадокс: избиратели голосуют «за реформы», но выходят на баррикады, как только реформа касается их кармана; сокращать соцвыплаты — бунт, повышать налоги — тоже бунт.
- Участники спора сравнивают долг и дефицит Франции с американскими и приходят к выводу: проблема не цифрах, а культуре — во Франции народ считает себя сувереном, а не парламентом.
- Демографический тупик: пенсионеров всё больше, работников меньше, иммиграция непопулярна, значит молодым придётся платить всё больше за чужую старость.
- Итог: пока власть не предложит справедливую формулу «кому платить и кто будет работать», уличные пожары и забастовки остаются национальным спортом.
Introduction to GrapheneOS 💬 Длинная дискуссия
Что такое GrapheneOS
Android для Google Pixel, заточенный под безопасность и приватность. Работает только на Pixel 8/9 (7 лет обновлений).
Профили
- Разные пользователи = изолированные шифрованные контейнеры.
- Можно полностью выключить профиль, тогда его приложения не работают в фоне.
- Переключение: тянем шторку → иконка внизу → PIN.
Google
Play Services ставятся в 1 клик из собственного магазина GOS; можно жить без Google вообще.
Установка
С браузера за 15 минут с Linux/Win/Mac; проверка образа после загрузки через TPM. OTA-обновления автоматом.
Разрешения
Сеть, камера, микрофон и т.д. – отдельно для каждого приложения и профиля. Удобно ставить апп в «владельца» без сети, потом клонировать туда, где нужно.
Производительность
Без графического shell, чистый AOSP + hardened ядро: быстрее stock-Pixel и без рекламы.
Безопасность
- Песочницы приложений, отключение метаданных Bluetooth/Wi-Fi, эксплойт-защита памяти, авто-перезагрузка если загрузчик разблокирован.
- Возможность показать «proof of boot» – что прошивка не тронута.
Мой сценарий
1 профиль – без сети, 2 – VPN+FIDO, 3 – SIM+Signal, 4 – камера. Переключаюсь по мере надобности.
Девайс
Pixel 8a, 8 ГБ ОЗУ, 256 ГБ ПЗУ, цена ~500 €, заряд 1-2 дня, камера отличная.
Итог
GrapheneOS = Pixel + годы обновлений + контроль над каждым приложением. Если нужен безопасный Android – бери Pixel и ставь GOS.
Комментарии (200)
- GrapheneOS вызывает споры: кто-то хвалит «без-глючность» и песочницы, кто-то ругает отказ от root и «кастрюлю» с профилями.
- Покупка Pixel для GOS в США часто сопровождается требованием персональных данных; часть пользователей платит наличными и вводит фейки.
- Главные плюсы: сильное разграничение прав приложений, отключение Google Play, обновления без глюков, возможность мульти-профилей и VPN-наблюдения.
- Главные минусы: нет автозаписи звонков, сложность переключения профилей, проблемы с RCS/Fi/банковскими и платёжными приложениями, отсутствие root «из коробки».
- Часть комментаторов считает, что GOS всё-таки уменьшает утечки к Google, даже если сервисы Google всё же нужны; альтернативы — /e/OS, рут-образы или полный отказ от смартфона.
Anthropic Services Down
- 16:28 UTC – API, Console и Claude.ai недоступны; идёт восстановление
- 16:37–17:15 UTC – исправление применено, наблюдаем за стабильностью
Комментарии (72)
- Пользователи массово жалуются на постоянные падения Anthropic: и API, и консоль, и claude.ai лежат одновременно.
- Европейцы замечают: пока США спит, Claude работает стабильно; как только начинаются американские часы — 503-ошибки и деградация модели.
- Кто-то шутит, что придётся «писать код мозгом», как в каменном веке, и копипастить со Stack Overflow.
- Платящие клиенты недовольны: за 20 $/мес Anthropic падает почти каждую неделю, тогда как Gemini и OpenAI редко.
- Популярный совет — не полагаться на прямой API, а подключаться к Claude через AWS Bedrock, Vertex AI или мультипровайдерские шлюзы вроде OpenRouter.