Hacker News Digest — Страница 335/464

For all that's holy, can you just leverage the Web, please? (blog.tomayac.com)

Почему не дать мне просто зарегистрировать стиралку через веб?

В 2005-м мы с женой жили в общаге в Барселоне: старенькая стиралка, дверь держится стулом. Потом купили Electrolux — 20 лет прослужила, переезжала с нами в Гамбург и обратно. На прошлой неделе мотор сдох, заказал новую (опять Electrolux, но без Wi-Fi).

К брошюре прилагалась 10-летняя гарантия по регистрации: телефон и QR-код с номером в виде текста. Позвонил — 20 минут ожидания, потом сбросили. Предложили ссылку в SMS: https://www. example.com/gc/ — сертификат браузер не принял, руками починил — сайт не грузится.

Нашёл через Google electrolux warranty register — первая ссылка вела на /mypages/register-a-product/. Создал аккаунт, ввёл номер модели вручную или просто загрузил фото таблички — ИИ сам всё распознал и зарегистрировал за два клика. Почему не сразу дали эту ссылку?

Бонус
Прикрутил демо на Prompt API: браузер распознаёт 9-значный номер с фото таблички и возвращает только цифры регуляркой /\d{9}/.

by tomayac • 03 сентября 2025 г. в 13:29 • 91 points

Оригинал • HN

#web #qr-code #regular-expressions #artificial-intelligence #machine-learning #user-experience #business-models

Комментарии (100)

Компании сознательно усложняют регистрацию гарантии, чтобы снизить расходы и продавать доп-гарантии по телефону.
Пользователи предлагают простые решения: QR-код с прямой ссылкой, наклейка с данными, «тупой» сканер вместо ИИ.
Автор статьи, гуглер, вместо критики сам решает задачу через AI/ML, что выглядит иронично.
Многие покупатели стараются найти «немодели» без «умных» функций и рекламы, но выбор сужается.
Участники сходятся: проблема не в технологиях, а в бизнес-модели «planned obsolescence» и избегании реальной поддержки.

John Coltrane's Tone Circle (roelsworld.eu)

Джон Колтрейн и «Тональный круг»

Саксофонист Джон Колтрейн создал «Tone Circle» — геометрическую диаграмму, соединяющую 12 тонов хроматической гаммы в круг, где соседние тона разделяет интервал в полтона. На схеме аккорды и тональности выглядят как правильные фигуры: треугольники, квадраты, шестиугольники. Это позволяет «видеть» модальные переходы и последовательности кварт-квинт, которые Колтрейн активно использовал в Giant Steps и других композициях.

Круг демонстрирует симметрию, скрытую в традиционной нотации: квинтовый цикл образует правильный 12-угольник, а аккорд ii–V–I — равнобедренный треугольник. Колтрейн, увлечённый математикой и философией, считал такую визуализацию способом «слышать геометрию» и быстрее ориентироваться в сложных прогрессиях.

Диаграмма также подчёркивает связь музыки с космологией: 12 тонов — как 12 знаков зодиака, а круговые движения напоминают орбиты планет. Идея вдохновила многих джазовых теоретиков и продолжает использоваться для анализа и обучения импровизации.

by jim-jim-jim • 03 сентября 2025 г. в 12:38 • 139 points

Оригинал • HN

#music-theory #jazz #improvisation #geometry #cosmology

Комментарии (53)

Dave Pollack и Vox показывают: «Giant Steps» кажется монстром из-за темпа; замедлите — и Coltrane Changes превращаются в обычные ii-V-I.
Участники делятся интерактивом Sven, статьёй Гонзе и подкастом Strong Songs для дальнейшего изучения.
Кто-то поднимает тему «сакральной геометрии» и связи музыки с устройством Вселенной.
Идут споры о сложности для духовых, о «обожествлении» мёртвых музыкантов и о том, почему джаз нравится или раздражает.

MIT Study Finds AI Use Reprograms the Brain, Leading to Cognitive Decline (publichealthpolicyjournal.com) 🔥 Горячее 💬 Длинная дискуссия

Исследование MIT показало: при написании эссе с помощью ChatGPT мозг перепрограммируется и функции снижаются.
Методика: ЭЭГ-сканирование студентов, которые регулярно пользовались ИИ.
Результаты:
- ослабленные нейронные связи;
- ухудшение памяти;
- ощущение «чужого» текста.
Эссе, сгенерированные ИИ, получали высокие оценки, но мозг «отключался».
Вывод: LLM-ассистенты учат мозг не думать, накапливая «когнитивный долг».

by cainxinth • 03 сентября 2025 г. в 12:06 • 407 points

Оригинал • HN

#artificial-intelligence #llm #cognitive-science #neuroscience #machine-learning

Комментарии (390)

Исследование MIT о «вреде» ChatGPT вызвало шквал критики: мало участников (54), неудобная процедура (EEG), выводы не подтверждены.
Сами авторы попросили не называть это «brain rot» и выложили FAQ против сенсационных заголовков.
Комментаторы сходятся: если ИИ используется как «волшебная кнопка», мышление атрофируется; если как исследовательский помощник, навыки растут.
Аналогии с калькуляторами, GPS и книгами — каждая новая технология вызывала панику, но в итоге просто изменила, какую работу мы делегируем.
Практический совет: не давать ИИ писать за тебя целиком, а использовать для обратной связи, рефакторинга и ускорения циклов «мысль–проверка».

The wall confronting large language models (arxiv.org)

Основная идея
Авторы утверждают, что современные LLM уже близки к «стене» роста качества: дальнейшее увеличение моделей и данных даёт лишь логарифмический прирост, а затраты растут экспоненциально.

Причины стены

Исчерпаемость данных: высококачественный текст в интернете ограничен; синтетические данные быстро насыщают.
Сложность задач: после решения «лёгких» 90 % остаются «трудные» 10 %, где ошибки почти не коррелируют с размером модели.
Экономика: чтобы снизить ошибку в 2 раза, нужно в 10–100× больше ресурсов.

Эксперименты
На MMLU, GSM8K, HumanEval и BIG-Bench наблюдается выравнивание кривых качества даже при масштабировании на порядки.

Что делать

Переход к специализированным моделям и инструментам (код-интерпретаторы, поиск).
Агентские схемы, где LLM вызывает API и внешние системы.
Новые архитектуры (MoE, RAG, RL) и синтетические данные нового типа (симуляции, мультимодальные сцены).

Вывод
Чистое масштабирование скоро исчерпается; прорыв потребует перехода от «больших» к «умным» системам.

by PaulHoule • 03 сентября 2025 г. в 11:40 • 133 points

Оригинал • HN

#large-language-models #machine-learning #deep-learning #transformers #rag #rl #mmlu #gsm8k #humaneval #big-bench

Комментарии (145)

Обсуждение крутится вокруг того, можно ли свести понимание и логическое рассуждение к вероятностным моделям вроде LLM.
Часть участников считает, что формальное равенство с цепями Маркова или LLM ничего не даёт и упускает ключевые вещи — например, backtracking и символьное мышление.
Другие отвечают, что трансформеры с chain-of-thought уже теоретически могут решать всё в классе P, а агенты с внешними инструментами уже делают backtracking на практике.
Критика статьи: авторы-физики пишут запутанно, примеров нет, фокус на ядерных реакторах и численных методах выглядит неуместным.
Сторонники «горького урока» указывают, что дальнейшее увеличение моделей и данных даст больше, чем попытки встроить строгую символику.

Video Game Blurs (and how the best one works) (blog.frost.kiwi) 🔥 Горячее

Размытие в играх — основа эффектов: Bloom, DoF, UI.
Цель: быстрое размытие в реальном времени на GPU.
Путь: от простого Box Blur до Dual Kawase Blur.

Box Blur

Среднее цветов в квадрате.
Проблема: O(n²) по радиусу, медленно.

Ядро (kernel)

Матрица весов для свёртки.
Box = все веса 1.
Gaussian = веса по нормальному распределению.

Gaussian Blur

Два прохода: горизонталь + вертикаль → O(n) вместо O(n²).
Но: при радиусе > 10 всё ещё дорого.

Частоты

Размытие = низкочастотный фильтр.
Можно свернуть сразу в частотной области, но FFT на маленьких изображениях не выигрывает.

Оптимизации

Билинейная интерполяция: считаем не каждый пиксель, а с шагом 2×, экономим 4× выборок.
Даунсемплинг: уменьшаем изображение в 2×, размываем, растягиваем обратно — почти бесплатно.

Kawase Blur

4–5 проходов с offset-выборками по спирали.
Выглядит как Gaussian, но дешевле при больших радиусах.

Dual Kawase Blur

Пара Kawase-проходов на уменьшенной копии + один upscale.
Результат: кинематографическое размытие за O(log n).
Используют Unreal, Unity, Frostbite — де-факто стандарт.

Итог

Dual Kawase = лучшее соотношение качество/скорость для больших радиусов в реальном времени.

by todsacerdoti • 03 сентября 2025 г. в 11:27 • 256 points

Оригинал • HN

#gpu #graphics-programming #shaders #image-processing #game-development #real-time-rendering #unreal #unity #frostbite

Комментарии (38)

Автор статьи рассказал о Dual-Kawase Blur и личном интервью с Масаки Кавасэ.
Участники обсудили, что Kawase-blur 2005 года уступает современным боке-эффектам, но всё ещё полезен на слабом железе.
Поднят вопрос: как адаптировать Kawase для compute-шейдеров без записи в DRAM.
Уточнили, что гауссово размытие можно точно получить в Фурье-пространстве, но это не всегда быстрее.
Появились советы по улучшению читаемости (убрать выключку) и объяснено, что Spherical Harmonics не связаны с размытием.

Voyager – An interactive video generation model with realtime 3D reconstruction (github.com) 🔥 Горячее 💬 Длинная дискуссия

Voyager — интерактивная модель генерации RGBD-видео от Tencent Hunyuan, управляемая траекторией камеры и поддерживающая реконструкцию 3D-сцен в реальном времени.

by mingtianzhang • 03 сентября 2025 г. в 11:07 • 302 points

Оригинал • HN

#tencent #3d-reconstruction #machine-learning #llm #lidar #video-generation #github

Комментарии (206)

Лицензия запрещает использование в ЕС, Великобритании и Южной Корее, что участники связывают с регуляторными рисками (EU AI Act).
Модель не полностью open-source: доступны только веса, без данных обучения.
Пользователи отмечают ограниченные углы обзора в демо-видео и требуют «полного 360°».
Минимальные требования — 60 ГБ VRAM для 540p, что делает технологию недоступной для большинства.
Обсуждаются потенциальные применения: от замены LiDAR до генерации игр и 3D-сцен из фото/видео.

UK Electricity Generation Map (energydashboard.co.uk)

by zeristor • 03 сентября 2025 г. в 10:49 • 142 points

Оригинал • HN

#energy #electricity #renewable-energy #wind-power #solar-power #data-visualization #dashboard #api

Комментарии (85)

Пользователи делятся ссылками на живые дашборды электроэнергетики Великобритании, Нидерландов, Франции, Канады, Австралии, Эстонии и Тайваня.
Обсуждают, что в Британии последняя угольная ТЭС закрылась в октябре 2024 г.; сейчас доминируют ветер и солнце, но солнечная выработка зимой всего 3-4 ч в день.
Отмечают: круги на карте показывают установленную мощность, а не фактическую выработку; офшорные ветропарки считаются одним объектом.
Спрашивают, почему «батареи» отдельно от генерации, и предлагают улучшения: выключить анимацию, добавить скролл, показывать суммарную мощность выбранных объектов.
Люди удивляются, сколько объектов рядом с их домами, и обсуждают, учитываются ли бытовые солнечные панели.

VibeVoice: A Frontier Open-Source Text-to-Speech Model (microsoft.github.io) 🔥 Горячее

VibeVoice — открытая TTS-модель для создания экспрессивных многоспикерных диалогов (подкасты, интервью).

Токенизаторы акустический и семантический работают на рекордно низкой частоте 7,5 Гц, сохраняя качество и ускоряя длинные последовательности.
Архитектура: LLM понимает контекст и диалог, диффузионный «голова» добавляет детали.
Пределы: до 90 минут, до 4 голосов, поддержка фоновой музыки, спонтанных эмоций и пения.
Кросс-язычность: свободный перевод с/на китайский и английский.

by lastdong • 03 сентября 2025 г. в 10:44 • 406 points

Оригинал • HN

#text-to-speech #open-source #llm #diffusion #python #mit

Комментарии (150)

Качество VibeVoice высокое, но мужские голоса часто звучат роботизированно и попадают в «зловещую долину».
Женские образцы заметно реалистичнее; демо-сайт почти всегда начинает с них.
Лучшие альтернативы: HiggsAudio (быстрее и чище), Kokoro (для слабых GPU) и Chatterbox.
Модель хорошо клонирует голос и эмоции, поддерживает английский, китайский и индийские акценты, но не SSML и редкие языки.
Репозиторий временно закрыт, лицензия MIT, но данных обучения не раскрыто.

The 16-year odyssey it took to emulate the Pioneer LaserActive (readonlymemo.com) 🔥 Горячее

16 лет до первого эмулятора Pioneer LaserActive

В 2009 г. австралиец Nemesis, фанат Sega, задумался о Mega LD — гибриде Mega Drive и LaserDisc. В августе 2025-го он опубликовал первый эмулятор Pioneer LaserActive.

Почему раньше было невозможно

Не было оборудования для захвата аналогового видео.
Не было софта для декодирования.
Не было формата хранения видео, пригодного для эмуляции.

Что такое LaserActive

1993 г., 10 000 штук. Лазерный проигрыватель с картриджами:

PAC-PC — PC Engine.
PAC-S1 — Mega Drive/Sega CD.
Плюс 25 игр формата Mega LD, где FMV смешивалась с 16-битной графикой.

Путь Nemesis

2004 г. купил консоль и PAC-S1 за ≈ $200.
2008 г. реверс-инжин YM2612, улучшил FM-звук в эмуляторах.
2009 г. создал форум-тред: «Это не сложно».
2015 г. появился захват 10-битного 4:2:2 видео.
2019 г. написал собственный декодер MPEG-1.
2021 г. разработал формат LDSC («LaserDisc Sample Code») — 40 Мбайт/мин.
2023 г. добавил в эмулятор Ares поддержку Mega LD.
2025 г. релиз Ares v146 — первый рабочий LaserActive.

Итог

«Цифровая» часть была проста: LaserActive — это гигантский аддон к Mega Drive. Всё время ушло на аналоговое видео.

by LaSombra • 03 сентября 2025 г. в 10:02 • 281 points

Оригинал • HN

#laserdisc #emulation #reverse-engineering #mpe1 #sega #mega-drive

Комментарии (66)

Участники восторженно отзываются о масштабном реверс-инжиниринге LaserActive и эмуляции Mega LD: называют работу «гениальной» и «одной из самых напряжённых».
Подчёркивают важность сохранения культуры: автор эмулятора проделал колоссальный труд ради сохранения эксклюзивных игр и памяти о создателе эмулятора Near.
Вспоминают эпоху LaserDisc: удивляются, что носитель аналоговый, делятся ностальгией по образовательным дискам и рассказывают о бытовых проблемах плееров Pioneer.
Отмечают, что внутри техники Pioneer была заметна экономия на компонентах, что вызывало сложности при ремонте.
Некоторые участники признаются, что не программисты и не используют эмуляторы, но всё равно с удовольствием читают такие подробные истории.

Finding thousands of exposed Ollama instances using Shodan (blogs.cisco.com)

Ключевые выводы исследования Cisco по обнаружению открытых серверов Ollama

Цель: выявить уязвимые LLM-серверы, запущенные через фреймворк Ollama.
Метод: Python-скрипт, сканирующий Shodan на признаки открытых API /api/tags, /api/ps, /api/chat.
Результаты: найдено >1 100 публичных инстансов; ~20 % допускают анонимный чат и загрузку моделей.
Риски: утечка данных, DoS, финансовые потери (GPU-трафик), инъекция вредоносных моделей.
Рекомендации:
- включить авторизацию и TLS;
- фильтровать IP-адреса;
- отключить --network host;
- использовать reverse-proxy (nginx, traefik) и WAF;
- регулярно сканировать инфраструктуру.

by rldjbpin • 03 сентября 2025 г. в 08:18 • 124 points

Оригинал • HN

#ollama #shodan #python #api #security #nginx #traefik #dos #llm #reverse-proxy

Комментарии (59)

Cisco сообщила об открытых в интернете >1 100 серверов Ollama без аутентификации.
Ollama по умолчанию не требует пароля и не планирует встроенной защиты API.
Пользователи решают проблему через firewall, nginx/caddy с токеном или VPN.
Сообщество спорит: виноваты ли разработчики, админы или «вайб-кодеры».
Многие считают риск низким, пока LLM не подключены к инструментам и чувствительным данным.