When O3 is 2x slower than O2 (cat-solstice.github.io)

При оптимизации кастомной ограниченной приоритетной очереди автор столкнулся с парадоксальным случаем, когда уровень оптимизации O3 работал на 123% медленнее, чем O2. Этот результат был подтверждён на процессорах Intel Haswell и AMD Zen 3, что указывает на системную проблему, а не на специфичную для архитектуры. Бенчмарки проводились с использованием criterion, а результаты демонстрировали устойчивую регрессию производительности при повышении уровня оптимизации.

Реализация использует отсортированный Vec с бинарным поиском вместо бинарной кучи, что эффективнее для данного случая из-за требования уникальности id элементов. Ключевую роль играет функция сравнения, работающая с числами с плавающей запятой, которые известны своей сложностью в сравнении. Для анализа производительности автор использовал flamegraph, чтобы выявить разницу в поведении между уровнями оптимизации.

by keyle • 28 октября 2025 г. в 23:29 • 84 points

When O3 is 2x slower than O2 (cat-solstice.github.io)

Why SSA Compilers? (mcyoung.xyz)

SATisfying Solutions to Difficult Problems (vaibhavsagar.com)

Unpacking Cloudflare Workers CPU Performance Benchmarks (blog.cloudflare.com) 🔥 Горячее

JIT: So you want to be faster than an interpreter on modern CPUs (pinaraf.info)

How does gradient descent work? (centralflows.github.io) 🔥 Горячее

Modular Manifolds (thinkingmachines.ai)

Effect Systems vs. Print Debugging: A Pragmatic Solution (blog.flix.dev)

A dumb introduction to z3 (asibahi.github.io)

Простое введение в z3

Что такое решатели?

Терминология

Простое уравнение

Many hard LeetCode problems are easy constraint problems (buttondown.com) 🔥 Горячее 💬 Длинная дискуссия

Meschers: Geometry Processing of Impossible Objects (anadodik.github.io)

Quirks of Common Lisp Types (fosskers.ca)

Типы — это небеса

Типы для корректности

Типы для оптимизации

Классы — это земля

Сердце машины

Итог

Important machine learning equations (chizkidd.github.io) 🔥 Горячее

Байес

Энтропия

KL-дивергенция

Кросс-энтропия

Линейная алгебра

Линейное преобразование

Собственные значения и векторы

SVD

Оптимизация

Градиентный спуск

Backprop

Функции потерь

MSE

Кросс-энтропия

Продвинутые темы

Диффузия

Свертка

Softmax

Attention

How to slow down a program and why it can be useful (stefan-marr.de)

Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing (arxiv.org)

Derivatives, Gradients, Jacobians and Hessians (blog.demofox.org) 🔥 Горячее

What's the strongest AI model you can train on a laptop in five minutes? (seangoedecke.com) 🔥 Горячее 💬 Длинная дискуссия

Ограничение времени

Скорость

Датасет