High-performance 2D graphics rendering on the CPU using sparse strips [pdf] (github.com) 🔥 Горячее

—

by PaulHoule • 10 ноября 2025 г. в 22:05 • 267 points

#graphics-rendering #2d-rendering #cpu #performance-optimization #benchmarking #false-sharing #uma #github

Комментарии (34)

Структура Strip занимает 8 байт, но автор утверждает, что 259×64+7296 ≈ 24 КБ, что вызывает сомнения в правильности подсчёта памяти.
Участники обсуждения предполагают, что речь идёт о кэш-линии в 64 байта и false-sharing, а не о фактическом размере структуры.
Появился вопрос о том, какие именно бенчмарки корректности используются, и как можно было бы проверить корректность рендеров.
Также обсуждалось, что вывод рендерера является растровое изображение, что требует копирования на GPU, что может быть не нужно на UMA-системах.

Benchmarking leading AI agents against Google reCAPTCHA v2 (research.roundtable.ai)

Исследователи протестировали три ведущие AI-модели на способность решать Google reCAPTCHA v2. Claude Sonnet 4.5 показал лучший результат с 60% успешных решений, немного обогнав Gemini 2.5 Pro (56%). GPT-5 значительно отстал с результатом всего 28%, что связано с его долгим и медленным процессом рассуждений, приводящим к постоянным тайм-аутам. Тесты показали, что производительность сильно зависит от типа CAPTCHA: все модели лучше справлялись со статичными заданиями и хуже всего — с кросс-тайл задачами.

Анализ выявил, что GPT-5 страдал от избыточных и навязчивых рассуждений, генерируя больше "мыслительных" токенов и постоянно редактируя свои решения. Эта проблема усугублялась плохим планированием и верификацией. В отличие от этого, Claude и Gemini демонстрировали более сбалансированный подход. Исследование подчеркивает, что в агрессивных средах с реальным временем выполнения скорость принятия решений так же важна, как и глубина рассуждений — иногда переосмысление приводит к такому же провалу, как и недостаток анализа.

by mdahardy • 10 ноября 2025 г. в 16:38 • 101 points

драйвер	вставка	чтение	обновление
modernc	2.3 s	0.8 s	2.5 s
mattn	1.1 s	0.4 s	1.2 s
ncruces	1.9 s	0.7 s	2.1 s

High-performance 2D graphics rendering on the CPU using sparse strips [pdf] (github.com) 🔥 Горячее

Benchmarking leading AI agents against Google reCAPTCHA v2 (research.roundtable.ai)

Study identifies weaknesses in how AI systems are evaluated (oii.ox.ac.uk) 🔥 Горячее 💬 Длинная дискуссия

Introducing architecture variants (discourse.ubuntu.com)

When O3 is 2x slower than O2 (cat-solstice.github.io)

Are-we-fast-yet implementations in Oberon, C++, C, Pascal, Micron and Luon (github.com)

Python 3.14 is here. How fast is it? (blog.miguelgrinberg.com) 🔥 Горячее 💬 Длинная дискуссия

Redis is fast – I'll cache in Postgres (dizzy.zone) 🔥 Горячее 💬 Длинная дискуссия

SWE-Bench Pro (github.com)

CompileBench: Can AI Compile 22-year-old Code? (quesma.com)

Tau² benchmark: How a prompt rewrite boosted GPT-5-mini by 22% (quesma.com)

Как переписывание промта повысило эффективность GPT-5-mini на 22%

Тестирование LLM с Tau²

Базовые результаты: 45% провалов

Решение: переписывание промтов с помощью Claude

In-Memory Filesystems in Rust (andre.arko.net)

Benchmarks for Golang SQLite Drivers (github.com)

OpenBSD is so fast, I had to modify the program slightly to measure itself (flak.tedunangst.com) 💬 Длинная дискуссия

Qodo CLI agent scores 71.2% on SWE-bench Verified (qodo.ai)

Qwen3-4B-Thinking-2507 (huggingface.co)