Hacker News Digest

Обновлено: 28 ноября 2025 г. в 08:55

Постов: 4635 • Страница 335/464

For all that's holy, can you just leverage the Web, please? (blog.tomayac.com)

Почему не дать мне просто зарегистрировать стиралку через веб?

В 2005-м мы с женой жили в общаге в Барселоне: старенькая стиралка, дверь держится стулом. Потом купили Electrolux — 20 лет прослужила, переезжала с нами в Гамбург и обратно. На прошлой неделе мотор сдох, заказал новую (опять Electrolux, но без Wi-Fi).

К брошюре прилагалась 10-летняя гарантия по регистрации: телефон и QR-код с номером в виде текста. Позвонил — 20 минут ожидания, потом сбросили. Предложили ссылку в SMS: https://www. example.com/gc/ — сертификат браузер не принял, руками починил — сайт не грузится.

Нашёл через Google electrolux warranty register — первая ссылка вела на /mypages/register-a-product/. Создал аккаунт, ввёл номер модели вручную или просто загрузил фото таблички — ИИ сам всё распознал и зарегистрировал за два клика. Почему не сразу дали эту ссылку?

Бонус
Прикрутил демо на Prompt API: браузер распознаёт 9-значный номер с фото таблички и возвращает только цифры регуляркой /\d{9}/.

by tomayac • 03 сентября 2025 г. в 13:29 • 91 points

ОригиналHN

#web#qr-code#regular-expressions#artificial-intelligence#machine-learning#user-experience#business-models

Комментарии (100)

  • Компании сознательно усложняют регистрацию гарантии, чтобы снизить расходы и продавать доп-гарантии по телефону.
  • Пользователи предлагают простые решения: QR-код с прямой ссылкой, наклейка с данными, «тупой» сканер вместо ИИ.
  • Автор статьи, гуглер, вместо критики сам решает задачу через AI/ML, что выглядит иронично.
  • Многие покупатели стараются найти «немодели» без «умных» функций и рекламы, но выбор сужается.
  • Участники сходятся: проблема не в технологиях, а в бизнес-модели «planned obsolescence» и избегании реальной поддержки.

John Coltrane's Tone Circle (roelsworld.eu)

Джон Колтрейн и «Тональный круг»

Саксофонист Джон Колтрейн создал «Tone Circle» — геометрическую диаграмму, соединяющую 12 тонов хроматической гаммы в круг, где соседние тона разделяет интервал в полтона. На схеме аккорды и тональности выглядят как правильные фигуры: треугольники, квадраты, шестиугольники. Это позволяет «видеть» модальные переходы и последовательности кварт-квинт, которые Колтрейн активно использовал в Giant Steps и других композициях.

Круг демонстрирует симметрию, скрытую в традиционной нотации: квинтовый цикл образует правильный 12-угольник, а аккорд ii–V–I — равнобедренный треугольник. Колтрейн, увлечённый математикой и философией, считал такую визуализацию способом «слышать геометрию» и быстрее ориентироваться в сложных прогрессиях.

Диаграмма также подчёркивает связь музыки с космологией: 12 тонов — как 12 знаков зодиака, а круговые движения напоминают орбиты планет. Идея вдохновила многих джазовых теоретиков и продолжает использоваться для анализа и обучения импровизации.

by jim-jim-jim • 03 сентября 2025 г. в 12:38 • 139 points

ОригиналHN

#music-theory#jazz#improvisation#geometry#cosmology

Комментарии (53)

  • Dave Pollack и Vox показывают: «Giant Steps» кажется монстром из-за темпа; замедлите — и Coltrane Changes превращаются в обычные ii-V-I.
  • Участники делятся интерактивом Sven, статьёй Гонзе и подкастом Strong Songs для дальнейшего изучения.
  • Кто-то поднимает тему «сакральной геометрии» и связи музыки с устройством Вселенной.
  • Идут споры о сложности для духовых, о «обожествлении» мёртвых музыкантов и о том, почему джаз нравится или раздражает.

MIT Study Finds AI Use Reprograms the Brain, Leading to Cognitive Decline (publichealthpolicyjournal.com) 🔥 Горячее 💬 Длинная дискуссия

  • Исследование MIT показало: при написании эссе с помощью ChatGPT мозг перепрограммируется и функции снижаются.
  • Методика: ЭЭГ-сканирование студентов, которые регулярно пользовались ИИ.
  • Результаты:
    • ослабленные нейронные связи;
    • ухудшение памяти;
    • ощущение «чужого» текста.
  • Эссе, сгенерированные ИИ, получали высокие оценки, но мозг «отключался».
  • Вывод: LLM-ассистенты учат мозг не думать, накапливая «когнитивный долг».

by cainxinth • 03 сентября 2025 г. в 12:06 • 407 points

ОригиналHN

#artificial-intelligence#llm#cognitive-science#neuroscience#machine-learning

Комментарии (390)

  • Исследование MIT о «вреде» ChatGPT вызвало шквал критики: мало участников (54), неудобная процедура (EEG), выводы не подтверждены.
  • Сами авторы попросили не называть это «brain rot» и выложили FAQ против сенсационных заголовков.
  • Комментаторы сходятся: если ИИ используется как «волшебная кнопка», мышление атрофируется; если как исследовательский помощник, навыки растут.
  • Аналогии с калькуляторами, GPS и книгами — каждая новая технология вызывала панику, но в итоге просто изменила, какую работу мы делегируем.
  • Практический совет: не давать ИИ писать за тебя целиком, а использовать для обратной связи, рефакторинга и ускорения циклов «мысль–проверка».

The wall confronting large language models (arxiv.org)

Основная идея
Авторы утверждают, что современные LLM уже близки к «стене» роста качества: дальнейшее увеличение моделей и данных даёт лишь логарифмический прирост, а затраты растут экспоненциально.

Причины стены

  • Исчерпаемость данных: высококачественный текст в интернете ограничен; синтетические данные быстро насыщают.
  • Сложность задач: после решения «лёгких» 90 % остаются «трудные» 10 %, где ошибки почти не коррелируют с размером модели.
  • Экономика: чтобы снизить ошибку в 2 раза, нужно в 10–100× больше ресурсов.

Эксперименты
На MMLU, GSM8K, HumanEval и BIG-Bench наблюдается выравнивание кривых качества даже при масштабировании на порядки.

Что делать

  • Переход к специализированным моделям и инструментам (код-интерпретаторы, поиск).
  • Агентские схемы, где LLM вызывает API и внешние системы.
  • Новые архитектуры (MoE, RAG, RL) и синтетические данные нового типа (симуляции, мультимодальные сцены).

Вывод
Чистое масштабирование скоро исчерпается; прорыв потребует перехода от «больших» к «умным» системам.

by PaulHoule • 03 сентября 2025 г. в 11:40 • 133 points

ОригиналHN

#large-language-models#machine-learning#deep-learning#transformers#rag#rl#mmlu#gsm8k#humaneval#big-bench

Комментарии (145)

  • Обсуждение крутится вокруг того, можно ли свести понимание и логическое рассуждение к вероятностным моделям вроде LLM.
  • Часть участников считает, что формальное равенство с цепями Маркова или LLM ничего не даёт и упускает ключевые вещи — например, backtracking и символьное мышление.
  • Другие отвечают, что трансформеры с chain-of-thought уже теоретически могут решать всё в классе P, а агенты с внешними инструментами уже делают backtracking на практике.
  • Критика статьи: авторы-физики пишут запутанно, примеров нет, фокус на ядерных реакторах и численных методах выглядит неуместным.
  • Сторонники «горького урока» указывают, что дальнейшее увеличение моделей и данных даст больше, чем попытки встроить строгую символику.

Video Game Blurs (and how the best one works) (blog.frost.kiwi) 🔥 Горячее

  • Размытие в играх — основа эффектов: Bloom, DoF, UI.
  • Цель: быстрое размытие в реальном времени на GPU.
  • Путь: от простого Box Blur до Dual Kawase Blur.

Box Blur

Среднее цветов в квадрате.
Проблема: O(n²) по радиусу, медленно.


Ядро (kernel)

Матрица весов для свёртки.
Box = все веса 1.
Gaussian = веса по нормальному распределению.


Gaussian Blur

Два прохода: горизонталь + вертикаль → O(n) вместо O(n²).
Но: при радиусе > 10 всё ещё дорого.


Частоты

Размытие = низкочастотный фильтр.
Можно свернуть сразу в частотной области, но FFT на маленьких изображениях не выигрывает.


Оптимизации

  • Билинейная интерполяция: считаем не каждый пиксель, а с шагом 2×, экономим 4× выборок.
  • Даунсемплинг: уменьшаем изображение в 2×, размываем, растягиваем обратно — почти бесплатно.

Kawase Blur

4–5 проходов с offset-выборками по спирали.
Выглядит как Gaussian, но дешевле при больших радиусах.


Dual Kawase Blur

Пара Kawase-проходов на уменьшенной копии + один upscale.
Результат: кинематографическое размытие за O(log n).
Используют Unreal, Unity, Frostbite — де-факто стандарт.


Итог

Dual Kawase = лучшее соотношение качество/скорость для больших радиусов в реальном времени.

by todsacerdoti • 03 сентября 2025 г. в 11:27 • 256 points

ОригиналHN

#gpu#graphics-programming#shaders#image-processing#game-development#real-time-rendering#unreal#unity#frostbite

Комментарии (38)

  • Автор статьи рассказал о Dual-Kawase Blur и личном интервью с Масаки Кавасэ.
  • Участники обсудили, что Kawase-blur 2005 года уступает современным боке-эффектам, но всё ещё полезен на слабом железе.
  • Поднят вопрос: как адаптировать Kawase для compute-шейдеров без записи в DRAM.
  • Уточнили, что гауссово размытие можно точно получить в Фурье-пространстве, но это не всегда быстрее.
  • Появились советы по улучшению читаемости (убрать выключку) и объяснено, что Spherical Harmonics не связаны с размытием.

Voyager – An interactive video generation model with realtime 3D reconstruction (github.com) 🔥 Горячее 💬 Длинная дискуссия

Voyager — интерактивная модель генерации RGBD-видео от Tencent Hunyuan, управляемая траекторией камеры и поддерживающая реконструкцию 3D-сцен в реальном времени.

by mingtianzhang • 03 сентября 2025 г. в 11:07 • 302 points

ОригиналHN

#tencent#3d-reconstruction#machine-learning#llm#lidar#video-generation#github

Комментарии (206)

  • Лицензия запрещает использование в ЕС, Великобритании и Южной Корее, что участники связывают с регуляторными рисками (EU AI Act).
  • Модель не полностью open-source: доступны только веса, без данных обучения.
  • Пользователи отмечают ограниченные углы обзора в демо-видео и требуют «полного 360°».
  • Минимальные требования — 60 ГБ VRAM для 540p, что делает технологию недоступной для большинства.
  • Обсуждаются потенциальные применения: от замены LiDAR до генерации игр и 3D-сцен из фото/видео.

Комментарии (85)

  • Пользователи делятся ссылками на живые дашборды электроэнергетики Великобритании, Нидерландов, Франции, Канады, Австралии, Эстонии и Тайваня.
  • Обсуждают, что в Британии последняя угольная ТЭС закрылась в октябре 2024 г.; сейчас доминируют ветер и солнце, но солнечная выработка зимой всего 3-4 ч в день.
  • Отмечают: круги на карте показывают установленную мощность, а не фактическую выработку; офшорные ветропарки считаются одним объектом.
  • Спрашивают, почему «батареи» отдельно от генерации, и предлагают улучшения: выключить анимацию, добавить скролл, показывать суммарную мощность выбранных объектов.
  • Люди удивляются, сколько объектов рядом с их домами, и обсуждают, учитываются ли бытовые солнечные панели.

VibeVoice: A Frontier Open-Source Text-to-Speech Model (microsoft.github.io) 🔥 Горячее

VibeVoice — открытая TTS-модель для создания экспрессивных многоспикерных диалогов (подкасты, интервью).

  • Токенизаторы акустический и семантический работают на рекордно низкой частоте 7,5 Гц, сохраняя качество и ускоряя длинные последовательности.
  • Архитектура: LLM понимает контекст и диалог, диффузионный «голова» добавляет детали.
  • Пределы: до 90 минут, до 4 голосов, поддержка фоновой музыки, спонтанных эмоций и пения.
  • Кросс-язычность: свободный перевод с/на китайский и английский.

by lastdong • 03 сентября 2025 г. в 10:44 • 406 points

ОригиналHN

#text-to-speech#open-source#llm#diffusion#python#mit

Комментарии (150)

  • Качество VibeVoice высокое, но мужские голоса часто звучат роботизированно и попадают в «зловещую долину».
  • Женские образцы заметно реалистичнее; демо-сайт почти всегда начинает с них.
  • Лучшие альтернативы: HiggsAudio (быстрее и чище), Kokoro (для слабых GPU) и Chatterbox.
  • Модель хорошо клонирует голос и эмоции, поддерживает английский, китайский и индийские акценты, но не SSML и редкие языки.
  • Репозиторий временно закрыт, лицензия MIT, но данных обучения не раскрыто.

The 16-year odyssey it took to emulate the Pioneer LaserActive (readonlymemo.com) 🔥 Горячее

16 лет до первого эмулятора Pioneer LaserActive

В 2009 г. австралиец Nemesis, фанат Sega, задумался о Mega LD — гибриде Mega Drive и LaserDisc. В августе 2025-го он опубликовал первый эмулятор Pioneer LaserActive.

Почему раньше было невозможно

  • Не было оборудования для захвата аналогового видео.
  • Не было софта для декодирования.
  • Не было формата хранения видео, пригодного для эмуляции.

Что такое LaserActive

1993 г., 10 000 штук. Лазерный проигрыватель с картриджами:

  • PAC-PC — PC Engine.
  • PAC-S1 — Mega Drive/Sega CD.
  • Плюс 25 игр формата Mega LD, где FMV смешивалась с 16-битной графикой.

Путь Nemesis

  • 2004 г. купил консоль и PAC-S1 за ≈ $200.
  • 2008 г. реверс-инжин YM2612, улучшил FM-звук в эмуляторах.
  • 2009 г. создал форум-тред: «Это не сложно».
  • 2015 г. появился захват 10-битного 4:2:2 видео.
  • 2019 г. написал собственный декодер MPEG-1.
  • 2021 г. разработал формат LDSC («LaserDisc Sample Code») — 40 Мбайт/мин.
  • 2023 г. добавил в эмулятор Ares поддержку Mega LD.
  • 2025 г. релиз Ares v146 — первый рабочий LaserActive.

Итог

«Цифровая» часть была проста: LaserActive — это гигантский аддон к Mega Drive. Всё время ушло на аналоговое видео.

by LaSombra • 03 сентября 2025 г. в 10:02 • 281 points

ОригиналHN

#laserdisc#emulation#reverse-engineering#mpe1#sega#mega-drive

Комментарии (66)

  • Участники восторженно отзываются о масштабном реверс-инжиниринге LaserActive и эмуляции Mega LD: называют работу «гениальной» и «одной из самых напряжённых».
  • Подчёркивают важность сохранения культуры: автор эмулятора проделал колоссальный труд ради сохранения эксклюзивных игр и памяти о создателе эмулятора Near.
  • Вспоминают эпоху LaserDisc: удивляются, что носитель аналоговый, делятся ностальгией по образовательным дискам и рассказывают о бытовых проблемах плееров Pioneer.
  • Отмечают, что внутри техники Pioneer была заметна экономия на компонентах, что вызывало сложности при ремонте.
  • Некоторые участники признаются, что не программисты и не используют эмуляторы, но всё равно с удовольствием читают такие подробные истории.

Finding thousands of exposed Ollama instances using Shodan (blogs.cisco.com)

Ключевые выводы исследования Cisco по обнаружению открытых серверов Ollama

  • Цель: выявить уязвимые LLM-серверы, запущенные через фреймворк Ollama.
  • Метод: Python-скрипт, сканирующий Shodan на признаки открытых API /api/tags, /api/ps, /api/chat.
  • Результаты: найдено >1 100 публичных инстансов; ~20 % допускают анонимный чат и загрузку моделей.
  • Риски: утечка данных, DoS, финансовые потери (GPU-трафик), инъекция вредоносных моделей.
  • Рекомендации:
    • включить авторизацию и TLS;
    • фильтровать IP-адреса;
    • отключить --network host;
    • использовать reverse-proxy (nginx, traefik) и WAF;
    • регулярно сканировать инфраструктуру.

by rldjbpin • 03 сентября 2025 г. в 08:18 • 124 points

ОригиналHN

#ollama#shodan#python#api#security#nginx#traefik#dos#llm#reverse-proxy

Комментарии (59)

  • Cisco сообщила об открытых в интернете >1 100 серверов Ollama без аутентификации.
  • Ollama по умолчанию не требует пароля и не планирует встроенной защиты API.
  • Пользователи решают проблему через firewall, nginx/caddy с токеном или VPN.
  • Сообщество спорит: виноваты ли разработчики, админы или «вайб-кодеры».
  • Многие считают риск низким, пока LLM не подключены к инструментам и чувствительным данным.