Hacker News Digest — Страница 439/464

GPT-5: "How many times does the letter b appear in blueberry?" (bsky.app) 🔥 Горячее 💬 Длинная дискуссия

—

by minimaxir • 08 августа 2025 г. в 02:51 • 261 points

Оригинал • HN

#gpt-5 #gpt-4o #claude #qwen3 #bsky.app #nlp #tokenization #llm

Комментарии (234)

GPT-5 без «режима рассуждений» ошибочно считает количество букв «b» в слове blueberry (выдаёт 2 вместо 3).
Пользователи связывают ошибку с особенностями токенизации и тем, что модель «не видит» отдельные символы.
При явном включении «режима рассуждений» или в других моделях (Claude, Qwen3, GPT-4o) ответ получается верным.
Обсуждение подчёркивает: быстрый «дешёвый» вывод может быть неточным, а автоматический роутер пока плохо распознаёт задачи, требующие точного перебора символов.

New executive order puts all grants under political control (arstechnica.com)

Трамп подписал указ, передающий контроль над всеми федеральными грантами политическим назначенцам.
Объявления о конкурсах и каждая заявка теперь требуют одобрения «старшего политического назначенца», который должен убедиться, что проект «продвигает приоритеты президента».
До внедрения новой системы запрещено запускать любые новые программы финансирования.
Агентства обязаны создать механизм отмены уже выданных грантов, если они «перестали соответствовать приоритетам».
Экспертные рецензии становятся лишь рекомендацией: политики не обязаны их учитывать.
Под угрозой — климатология, биомедицина и другие области, не вписывающиеся в идеологические критерии.

by pbui • 08 августа 2025 г. в 02:37 • 163 points

Оригинал • HN

#public-policy #grants #research-funding #science #academia #politics #united-states

Комментарии (100)

Участники считают, что внезапное прекращение грантов убивает американскую науку: нельзя планировать 5-летний PhD, если финансирование отзывают мгновенно.
Многие видят в этом проявление антиинтеллектуализма и тоталитарного сценария, который толкает лучших учёных уезжать из США.
Европе и Китаю предрекают выгоду, если они быстро привлекут «утечку мозгов», но сомневаются в скорости реакции ЕС.
Поднимаются вопросы: насколько это законно, почему базовую науку вообще должно финансировать государство и можно ли заменить его частной филантропией.

Cursed Knowledge (immich.app) 🔥 Горячее

Zitadel: JS-движок не поддерживает именованные группы в regex.
Entra: PKCE есть, но не указан в OpenID-доке → клиенты думают, что нет.
EXIF: размеры в метаданных могут не совпадать с реальными.
YAML: пробелы ведут себя неочевидно.
Windows: скрытые файлы нельзя открыть флагом "w"; опция SMB hide dot files усложняет жизнь.
Git: автопреобразование LF ↔ CRLF ломает bash-скрипты.
Cloudflare Workers: fetch по умолчанию использует http, даже если указан https.
Android/iOS: без разрешения на геолокацию GPS-данные могут тихо удаляться из фото.
PostgreSQL NOTIFY: работает в транзакции → WAL растёт каждые 5 с при использовании socket.io-адаптера.
npm-скрипты: каждый запрос к реестру → плохой health-check.
JS-«пакетный» спамер: добавляет 50 лишних зависимостей «для обратной совместимости».
bcrypt: учитывает только первые 72 байта пароля.
JS Date: годы и дни считаются с 1, месяцы — с 0.
ESM ↔ CJS: до Node 20.8 смешанный импорт мог вызвать segfault.
PostgreSQL: максимум 65 535 параметров — большие bulk-insert ломаются.
Clipboard API и др. работают только в HTTPS/localhost.
TypeORM: .remove() удаляет поле id из переданного объекта.

by bqmjjx0kac • 07 августа 2025 г. в 23:34 • 411 points

Оригинал • HN

#javascript #yaml #windows #git #cloudflare-workers #android #ios #postgresql #npm

Комментарии (131)

Пользователи восторженно приняли идею «cursed knowledge» — каталога кошмарных нюансов, сопровождаемого коммитом-фиксом.
Обсуждали PostgreSQL-лимит в 65 k placeholder’ов, причины появления 50 лишних npm-пакетов, скрытые потоки NTFS/ADS и «призрачные» файлы macOS.
Упомянули, что bcrypt обрезает пароль до 72 байт, Cloudflare Workers могут игнорировать https, EXIF-даты в Immich — постоянная головная боль.
Поделились личным опытом: неразрывные пробелы, case-insensitive имена в macOS, Java-классы в Oracle, «магия» YAML-парсеров.
Кто-то предложил превратить подборку в репозиторий-«Awesome Cursed», другие подчеркнули пользу такого «терапевтического» лога ошибок.

Vibechart (vibechart.net) 🔥 Горячее 💬 Длинная дискуссия

vibechart — график, строящийся не по фактам, а по желаемому. Игнорирует истину, красоту и пользу. См. «ложь», «наглая ложь» и «статистика».

by datadrivenangel • 07 августа 2025 г. в 21:36 • 805 points

Оригинал • HN

#openai #data-visualization #statistics

Комментарии (178)

Пользователи заметили, что в презентации GPT-5 графики сравнения моделей содержат явные ошибки: колонки 69,1 и 30,8 одинаковой высоты, а 50,0 выглядит меньше 47,4.
Мнения разделились: одни считают это обычной невнимательностью или досадной ошибкой верстки, другие — сознательным искажением, чтобы преувеличить преимущество новой модели.
Некоторые шутят, что «vibe-coding» и автоматизированная генерация графиков привели к провалу, а OpenAI, несмотря на миллиардные инвестиции, не может нанять специалиста по визуализации данных.
Несколько комментаторов предполагают, что эпичный «фейл» мог быть специально подан для вирального обсуждения и дополнительного хайпа.
В официальном пресс-релизе ошибки уже исправлены, но общее впечатление осталось: «эпоха AI-хайпа в одной картинке».

Achieving 10,000x training data reduction with high-fidelity labels (research.google)

Сжатая суть статьи

Идентификация нарушающей политику рекламы требует глубокого контекста и культурной чувствительности — сильные стороны LLM. Однако дообучение требует дорогих, качественных разметок, а политика и типы нарушений постоянно меняются. Мы предложили масштабируемый процесс активного обучения, который сводит объём данных с 100 000 до менее 500 примеров и повышает согласованность с экспертами до 65 %. В продакшене крупные модели используют в 10 000 раз меньше данных без потери качества.

Процесс курирования

Нулевой LLM размечает весь трафик (1).
Кластеризуем «нарушения» и «безопасные» примеры; пересечения кластеров указывают на неуверенность модели (2).
Внутри пересечений выбираем пары близких, но по-разному размеченных примеров (3).
Эксперты размечают приоритетные пары (4).
Полученные метки делятся: часть — для дообучения, часть — для оценки по двум метрикам: внутренняя согласованность экспертов и согласованность «модель ↔ человек». Итерации повторяются до плато.

Метрика
Используем Cohen’s Kappa: 0 — случайное совпадение, >0,8 — отлично. Не требует «золотого стандарта».

Эксперименты
Сравнили Gemini Nano-1 (1,8 B) и Nano-2 (3,25 B) на двух задачах разной сложности. Базовые модели дообучались на ~100 k разметок краудсорсом. Курированные модели — на ~400 примерах за 6 итераций. Все модели вышли на плато, не догнав внутреннее согласие экспертов.

by badmonster • 07 августа 2025 г. в 21:11 • 136 points

Оригинал • HN

#active-learning #machine-learning #llm #clustering #data-labeling #google #embeddings #pca

Комментарии (25)

Участники сомневаются в заявлении, что «<1 % рекламы — кликбейт», приводя анекдоты о массе скамов и повторяющихся мошеннических объявлениях.
Поднимается тема Active Learning: один доклад показывает, что после нормализации условий случайный выбор примеров для разметки может быть эффективнее «умных» стратегий.
Критика метода кластеризации: неясно, как получаются пересекающиеся кластеры, если множества «кликбейт/не кликбейт» не пересекаются.
Спрашивают, какая именно модель даёт эмбеддинги: LLM или специализированная модель с контрастным обучением; тип кластеризации и роль PCA тоже не описаны.
Некоторые считают, что гиперсферы и SVM в диаграмме могут быть намеренным «затуманиванием» ключевых деталей выбора примеров для разметки.

Flipper Zero dark web firmware bypasses rolling code security (rtl-sdr.com) 🔥 Горячее 💬 Длинная дискуссия

В даркнете появилась модифицированная прошивка для Flipper Zero, которая обходит защиту rolling-code у гаражных ворот и автомобильных сигнализаций.

Прошивка «Shadow Code» перехватывает и «замораживает» текущий код, позволяя злоумышленнику повторно активировать систему без подбора следующего значения. Работает на частотах 433/868 МГц, совместима с Keeloq, KeeLoq HCS и аналогичными протоколами.

Разработчики утверждают, что эксплойт не требует физического доступа к брелку: достаточно одного перехваченного пакета. Прошивка распространяется через закрытые Telegram-каналы и даркнет-форумы за криптовалюту.

Специалисты по ИБ рекомендуют обновить прошивку своих систем до последней версии, включить двухфакторную аутентификацию (где поддерживается) и использовать шлюзы с временными окнами активации, чтобы минимизировать риск повторного использования кода.

by lq9AJ8yrfs • 07 августа 2025 г. в 21:10 • 432 points

Оригинал • HN

#flipper-zero #rolling-code #keeloq #hcs #rtl-sdr #dark-web #telegram #cryptocurrency #hyundai-kia #two-factor-authentication

Комментарии (253)

Уязвимость в системах с динамическим кодом KeeLoq позволяет по одному нажатию кнопки ключа клонировать все функции брелка, если известен «производственный ключ».
Пользователи обсуждают, что из-за атаки оригинальный брелок рассинхронизируется и перестаёт работать, что может быть использовано как акт вандализма.
Многие считают бесключевой запуск и удалённое открытие машины избыточным риском, предпочитая физический ключ или многофакторную защиту.
Упоминается, что производители (особенно Hyundai/Kia) могут выигрывать от краж, так как страховые выплаты приводят к продаже новых машин.
Некоторые производители (Chevrolet, Toyota, Honda, Nissan) в списке уязвимых не фигурируют — возможно, используют другие протоколы или просто не тестировались.

Cursor CLI (cursor.com) 🔥 Горячее 💬 Длинная дискуссия

Установка: npm i -g cursor-cli
Команды: cursor diff, cursor commit, cursor review, cursor chat
Где работает: VS Code, JetBrains, Android Studio, Ghostty, Warp, Bash

Функции

Прямые правки кода в терминале
Реальное управление агентом
Правила через .cursorrules, AGENTS.md, MCP

Плюсы

Последние модели Anthropic, OpenAI, Gemini
Интеграция в любой IDE
Скрипты и автоматизация

by gonzalovargas • 07 августа 2025 г. в 20:53 • 359 points

Оригинал • HN

#npm #vscode #jetbrains #android-studio #bash #anthropic #openai #gemini #github #llm

Комментарии (248)

Пользователи обсуждают внедрение единого стандарта AGENT.md вместо множества разных файлов.
CLI-агенты (Claude Code, Cursor CLI и др.) вызывают восторг: удобно держать в фоне, «чувствуешь себя хакером», но UI-IDE теряет значение.
Критика: непонятно, зачем платить за Cursor, если тот же функционал уже включён в подписку Anthropic/OpenAI; не хватает обратной связи, MCP, hooks и локальных моделей.
Сторонники Cursor верят в его будущую экосистему (CLI + IDE + GitHub-интеграции) и низкие издержки переключения между моделями.
Главный вопрос безопасности: доверять ли LLM полный доступ к файловой системе и устанавливать скрипты через curl | bash.

Historical Tech Tree (historicaltechtree.com) 🔥 Горячее

Историческое дерево технологий
Интерактивная визуализация технологической истории от 3 млн лет до наших дней. Проект Этьена Фортье-Дюбуа, пока содержит 0 технологий и 0 связей.

Каменное орудие
3300 тыс. до н. э. — первая технология производства.

by louisfd94 • 07 августа 2025 г. в 19:24 • 483 points

Оригинал • HN

#interactive-visualization #technology-history #web-development #ui-ux #web-design

Комментарии (107)

Пользователи отмечают слепые зоны: недооценены металлургия, точная механика и «базовая наука», из-за чего газовые турбины возникают «из ниоткуда».
Найдены мелкие ошибки: дата «обуви» указывает на сандалии, а не самые ранние туфли 7000–8000 г. до н. э.; точность дат винторезных токарных станков спорна.
UI-критика: слишком много пустого пространства, неудобно на мобильных, не хватает зума, тысячных разделителей и «привязки» к следующему узлу.
Замечена западная и англоязычная предвзятость: китайское письмо показано как терминус, а не как корень множества ветвей.
Предложения по улучшению: вертикальный мобильный вид, поиск «самых важных потомков» технологии, агент для автоматического обогащения графа.

OpenAI's new open-source model is basically Phi-5 (seangoedecke.com) 🔥 Горячее 💬 Длинная дискуссия

OpenAI выложила первые открытые веса: gpt-oss-120b и gpt-oss-20b. Модели хороши в бенчмарках, но проваливают SimpleQA и бедны на поп-культуру. Это, по сути, Phi-5.

Почему Phi?

Себастьян Бубек в Microsoft создал серию Phi, обучаясь исключительно на синтетике: высококачественные, но дорогие токены. Результат — отличные цифры в тестах и слабая практика, потому что «учили к экзамену». В конце 2024-го Бубек ушёл в OpenAI, и новые gpt-oss, судя по всему, построены на той же идее.

Зачем синтетика?

Безопасность. Открытый вес нельзя отозвать, а сообщество быстро стриптизирует модель под эротические ролевые игры. Синтетические данные позволяют заранее заложить отказы и избежать скандалов. OpenAI не нужно, чтобы модель была полезна в проде — достаточно победить китайские открытые веса в таблицах.

Итог: gpt-oss — это Phi-5 и Phi-5-mini, созданные ради безопасности и рекламных графиков.

by emschwartz • 07 августа 2025 г. в 18:59 • 371 points

Оригинал • HN

#openai #gpt-oss-120b #gpt-oss-20b #phi-5 #microsoft #open-source

Комментарии (199)

Модель GPT-OSS из-за жёстких «сейфти-фильтров» отказывается переводить даже безобидные романтические сцены с 17-летними персонажами.
Пользователи жалуются, что цензура мешает повседневным задачам: переводам, переписке, написанию детских историй.
Некоторые считают главной причиной отказа от полного open-source именно страх перед тонкой настройкой моделей для эротического ролеплея.
Другие подтверждают: в локальных сообществах «первертов» действительно много, но это далеко не единственный сценарий использования.
В итоге часть аудитории уходит на «аблитерированные» Llama и прочие неконтролируемые модели.

Encryption made for police and military radios may be easily cracked (wired.com)

Криптография для полицейских и военных радиостанций оказалась уязвима

Исследователи из Университета Кентукки и Университета штата Джорджия обнаружили, что алгоритм ADP (Advanced Digital Privacy), который используется в радиостанциях марок BK Technologies, EF Johnson, Relm, Tait и других, можно взломать менее чем за минуту на обычном ноутбуке.

ADP защищает переговоры полиции, армии и спецслужб, но реализует «шифрование» лишь 32-битным XOR-потоком, что делает его фактически небезопасным. Уязвимость позволяет злоумышленнику:

Слушать переговоры в реальном времени
Изменять команды и координаты
Отключать группы или отдельных операторов

Проблема усугубляется тем, что:

Производители не публикуют спецификации ADP, поэтому пользователи не могут оценить уровень защиты.
Некоторые модели радиостанций не поддерживают современные стандарты (AES-256, P25), оставляя ADP единственным вариантом.

Эксперты рекомендуют переходить на AES-256 или P25 Phase 2, но это требует замены оборудования и перенастройки инфраструктуры.

by mikece • 07 августа 2025 г. в 18:30 • 219 points

Оригинал • HN

#encryption #xor #radio #p25 #tetra #sdr #mac #security

Комментарии (144)

Kevin Mitnick в 90-х глушил полицейские рации, просто зажимая кнопку передачи; сегодня такое не пройдёт из-за P25-транкинга.
P25 и TETRA имеют уязвимости: от «on-demand» трекинга до 56-битных ключей и закрытых алгоритмов.
В США до недавнего времени большинство переговоров шло в открытом виде, и жители жаловались на переход к шифрованию.
Некоторые участники описывают, как легко искать MAC-адреса полицейских ноутбуков или использовать SDR-донглы и дроны для мониторинга.
Общий вывод: безопасность радиосвязи часто рассматривалась как пунктик, а не базовое требование, и теперь это даёт сбой.