AI's Dial-Up Era (wreflection.com) 🔥 Горячее 💬 Длинная дискуссия

Мы сейчас находимся в "эпоху модема" для искусственного интеллекта, аналогичной раннему интернету 1995 года. Тогда существовало лишь около 2000 сайтов, большинство из которых представляли собой текст на сером фоне, а загрузка изображения занимала минуту. Люди разделились на оптимистов, предсказывавших революционные изменения, и скептиков, называвших интернет временной модой. Сегодня в дебатах об ИИ повторяются те же ошибки: одни предрекают массовую безработицу, другие — автоматизацию всех интеллектуальных задач.

Парадоксально, но ИИ не заменяет специалистов, как предсказывали. Например, радиологи, несмотря на предупреждения Джеффри Хинтона о скорой замене, процветают: в 2025 году количество вакансий достигло рекордных 1208, а средняя зарплата составила $520,000 — на 48% выше, чем в 2015 году. Это показывает, что влияние ИИ будет более избирательным и зависящим от отрасли, чем экстремалистские прогнозы обеих сторон допускают.

by nowflux • 03 ноября 2025 г. в 21:01 • 440 points

AI's Dial-Up Era (wreflection.com) 🔥 Горячее 💬 Длинная дискуссия

Generative AI Image Editing Showdown (genai-showdown.specr.net) 🔥 Горячее

Nvidia takes $1B stake in Nokia (cnbc.com) 🔥 Горячее 💬 Длинная дискуссия

'Attention is all you need' coauthor says he's 'sick' of transformers (venturebeat.com) 🔥 Горячее 💬 Длинная дискуссия

Starcloud (blogs.nvidia.com) 💬 Длинная дискуссия

Alibaba Cloud says it cut Nvidia AI GPU use by 82% with new pooling system (tomshardware.com) 🔥 Горячее 💬 Длинная дискуссия

The case for the return of fine-tuning (welovesota.com)

When you opened a screen shot of a video in Paint, the video was playing in it (devblogs.microsoft.com) 🔥 Горячее

A kernel stack use-after-free: Exploiting Nvidia's GPU Linux drivers (blog.quarkslab.com)

iPad Pro with M5 chip (apple.com) 💬 Длинная дискуссия

Apple M5 chip (apple.com) 🔥 Горячее 💬 Длинная дискуссия

Pixnapping Attack (pixnapping.com) 🔥 Горячее

Nvidia DGX Spark: great hardware, early days for the ecosystem (simonwillison.net)

Prefix sum: 20 GB/s (2.6x baseline) (github.com)

AMD signs AI chip-supply deal with OpenAI, gives it option to take a 10% stake (reuters.com) 🔥 Горячее 💬 Длинная дискуссия

Circular Financing: Does Nvidia's $110B Bet Echo the Telecom Bubble? (tomtunguz.com)

New antibiotic targets IBD and AI predicted how it would work (healthsci.mcmaster.ca)

Track which Electron apps slow down macOS 26 Tahoe (avarayr.github.io)

Fp8 runs ~100 tflops faster when the kernel name has "cutlass" in it (github.com) 🔥 Горячее

The G in GPU is for Graphics damnit (ut21.github.io)

Newton: physics simulation engine built upon NVIDIA Warp (github.com)

Cerebras systems raises $1.1B Series G (cerebras.ai)

We bought the whole GPU, so we're damn well going to use the whole GPU (hazyresearch.stanford.edu) 🔥 Горячее

We reverse-engineered Flash Attention 4 (modal.com)

Handy – Free open-source speech-to-text app written in Rust (handy.computer)

SimpleFold: Folding proteins is simpler than you think (github.com) 🔥 Горячее

Qwen3-Omni: Native Omni AI model for text, image and video (github.com) 🔥 Горячее

OpenAI and Nvidia announce partnership to deploy 10GW of Nvidia systems (openai.com) 🔥 Горячее 💬 Длинная дискуссия

Show HN: Run Qwen3-Next-80B on 8GB GPU at 1tok/2s throughput (github.com)

Processing Strings 109x Faster Than Nvidia on H100 (ashvardanian.com)

An untidy history of AI across four books (hedgehogreview.com)

Intel Arc Celestial dGPU seems to be first casualty of Nvidia partnership (notebookcheck.net)

I built a dual RTX 3090 rig for local AI in 2025 (and lessons learned) (llamabuilds.ai)

Llama-Factory: Unified, Efficient Fine-Tuning for 100 Open LLMs (github.com)

Were RNNs all we needed? A GPU programming perspective (dhruvmsheth.github.io)

Nvidia buys $5B in Intel (tomshardware.com) 🔥 Горячее 💬 Длинная дискуссия

Gluon: a GPU programming language based on the same compiler stack as Triton (github.com)

Alibaba's new AI chip: Key specifications comparable to H20 (news.futunn.com) 🔥 Горячее 💬 Длинная дискуссия

RustGPT: A pure-Rust transformer LLM built from scratch (github.com) 🔥 Горячее 💬 Длинная дискуссия

RustGPT

AMD’s RDNA4 GPU architecture (chipsandcheese.com)

Qwen3-Next (qwen.ai) 🔥 Горячее 💬 Длинная дискуссия

Spiral (spiraldb.com)

Defeating Nondeterminism in LLM Inference (thinkingmachines.ai) 🔥 Горячее

Почему LLM неповторяемы и как это исправить

Intel Arc Pro B50 GPU Launched at $349 for Compact Workstations (guru3d.com) 💬 Длинная дискуссия

Shipping textures as PNGs is suboptimal (gamesbymason.com)

Why is Japan still investing in custom floating point accelerators? (nextplatform.com)

ML needs a new programming language – Interview with Chris Lattner (signalsandthreads.com) 🔥 Горячее 💬 Длинная дискуссия

LLM Visualization (bbycroft.net) 🔥 Горячее

Video Game Blurs (and how the best one works) (blog.frost.kiwi) 🔥 Горячее

Box Blur

Ядро (kernel)

Gaussian Blur

Частоты

Оптимизации

Kawase Blur

Dual Kawase Blur

Итог

Anthropic raises $13B Series F (anthropic.com) 🔥 Горячее 💬 Длинная дискуссия

Rasterizer: A GPU-accelerated 2D vector graphics engine in ~4k LOC (github.com)

Deploying DeepSeek on 96 H100 GPUs (lmsys.org) 🔥 Горячее

Are OpenAI and Anthropic losing money on inference? (martinalderson.com) 🔥 Горячее 💬 Длинная дискуссия

Пропускная способность

Цена за токен

Почему ограничивают контекст

Пользовательская экономика

Show HN: An ncurses CUDA-based fluid simulation (github.com)

Dissecting the Apple M1 GPU, the end (rosenzweig.io) 🔥 Горячее 💬 Длинная дискуссия

A bubble that knows it's a bubble (craigmccaskill.com)

Железнодорожный пузырь 1840-х

Дот-ком 1995–2000

Deep Think with Confidence (arxiviq.substack.com)

The issue of anti-cheat on Linux (2024) (tulach.cc) 💬 Длинная дискуссия

How to Think About GPUs (jax-ml.github.io) 🔥 Горячее

Wan – Open-source alternative to VEO 3 (github.com)

ARM adds neural accelerators to GPUs (newsroom.arm.com)

PCIe 8.0 announced by the PCI-Sig will double throughput again (servethehome.com) 💬 Длинная дискуссия

Ask HN: How can ChatGPT serve 700M users when I can't run one GPT-4 locally? 🔥 Горячее 💬 Длинная дискуссия

Writing a Rust GPU kernel driver: a brief introduction on how GPU drivers work (collabora.com) 🔥 Горячее