Hacker News Digest

Обновлено: 28 ноября 2025 г. в 08:55

Постов: 4635 • Страница 439/464

GPT-5: "How many times does the letter b appear in blueberry?" (bsky.app) 🔥 Горячее 💬 Длинная дискуссия

by minimaxir • 08 августа 2025 г. в 02:51 • 261 points

ОригиналHN

#gpt-5#gpt-4o#claude#qwen3#bsky.app#nlp#tokenization#llm

Комментарии (234)

  • GPT-5 без «режима рассуждений» ошибочно считает количество букв «b» в слове blueberry (выдаёт 2 вместо 3).
  • Пользователи связывают ошибку с особенностями токенизации и тем, что модель «не видит» отдельные символы.
  • При явном включении «режима рассуждений» или в других моделях (Claude, Qwen3, GPT-4o) ответ получается верным.
  • Обсуждение подчёркивает: быстрый «дешёвый» вывод может быть неточным, а автоматический роутер пока плохо распознаёт задачи, требующие точного перебора символов.

New executive order puts all grants under political control (arstechnica.com)

  • Трамп подписал указ, передающий контроль над всеми федеральными грантами политическим назначенцам.
  • Объявления о конкурсах и каждая заявка теперь требуют одобрения «старшего политического назначенца», который должен убедиться, что проект «продвигает приоритеты президента».
  • До внедрения новой системы запрещено запускать любые новые программы финансирования.
  • Агентства обязаны создать механизм отмены уже выданных грантов, если они «перестали соответствовать приоритетам».
  • Экспертные рецензии становятся лишь рекомендацией: политики не обязаны их учитывать.
  • Под угрозой — климатология, биомедицина и другие области, не вписывающиеся в идеологические критерии.

by pbui • 08 августа 2025 г. в 02:37 • 163 points

ОригиналHN

#public-policy#grants#research-funding#science#academia#politics#united-states

Комментарии (100)

  • Участники считают, что внезапное прекращение грантов убивает американскую науку: нельзя планировать 5-летний PhD, если финансирование отзывают мгновенно.
  • Многие видят в этом проявление антиинтеллектуализма и тоталитарного сценария, который толкает лучших учёных уезжать из США.
  • Европе и Китаю предрекают выгоду, если они быстро привлекут «утечку мозгов», но сомневаются в скорости реакции ЕС.
  • Поднимаются вопросы: насколько это законно, почему базовую науку вообще должно финансировать государство и можно ли заменить его частной филантропией.

Cursed Knowledge (immich.app) 🔥 Горячее

  • Zitadel: JS-движок не поддерживает именованные группы в regex.
  • Entra: PKCE есть, но не указан в OpenID-доке → клиенты думают, что нет.
  • EXIF: размеры в метаданных могут не совпадать с реальными.
  • YAML: пробелы ведут себя неочевидно.
  • Windows: скрытые файлы нельзя открыть флагом "w"; опция SMB hide dot files усложняет жизнь.
  • Git: автопреобразование LF ↔ CRLF ломает bash-скрипты.
  • Cloudflare Workers: fetch по умолчанию использует http, даже если указан https.
  • Android/iOS: без разрешения на геолокацию GPS-данные могут тихо удаляться из фото.
  • PostgreSQL NOTIFY: работает в транзакции → WAL растёт каждые 5 с при использовании socket.io-адаптера.
  • npm-скрипты: каждый запрос к реестру → плохой health-check.
  • JS-«пакетный» спамер: добавляет 50 лишних зависимостей «для обратной совместимости».
  • bcrypt: учитывает только первые 72 байта пароля.
  • JS Date: годы и дни считаются с 1, месяцы — с 0.
  • ESM ↔ CJS: до Node 20.8 смешанный импорт мог вызвать segfault.
  • PostgreSQL: максимум 65 535 параметров — большие bulk-insert ломаются.
  • Clipboard API и др. работают только в HTTPS/localhost.
  • TypeORM: .remove() удаляет поле id из переданного объекта.

by bqmjjx0kac • 07 августа 2025 г. в 23:34 • 411 points

ОригиналHN

#javascript#yaml#windows#git#cloudflare-workers#android#ios#postgresql#npm

Комментарии (131)

  • Пользователи восторженно приняли идею «cursed knowledge» — каталога кошмарных нюансов, сопровождаемого коммитом-фиксом.
  • Обсуждали PostgreSQL-лимит в 65 k placeholder’ов, причины появления 50 лишних npm-пакетов, скрытые потоки NTFS/ADS и «призрачные» файлы macOS.
  • Упомянули, что bcrypt обрезает пароль до 72 байт, Cloudflare Workers могут игнорировать https, EXIF-даты в Immich — постоянная головная боль.
  • Поделились личным опытом: неразрывные пробелы, case-insensitive имена в macOS, Java-классы в Oracle, «магия» YAML-парсеров.
  • Кто-то предложил превратить подборку в репозиторий-«Awesome Cursed», другие подчеркнули пользу такого «терапевтического» лога ошибок.

Vibechart (vibechart.net) 🔥 Горячее 💬 Длинная дискуссия

vibechart — график, строящийся не по фактам, а по желаемому. Игнорирует истину, красоту и пользу. См. «ложь», «наглая ложь» и «статистика».

by datadrivenangel • 07 августа 2025 г. в 21:36 • 805 points

ОригиналHN

#openai#data-visualization#statistics

Комментарии (178)

  • Пользователи заметили, что в презентации GPT-5 графики сравнения моделей содержат явные ошибки: колонки 69,1 и 30,8 одинаковой высоты, а 50,0 выглядит меньше 47,4.
  • Мнения разделились: одни считают это обычной невнимательностью или досадной ошибкой верстки, другие — сознательным искажением, чтобы преувеличить преимущество новой модели.
  • Некоторые шутят, что «vibe-coding» и автоматизированная генерация графиков привели к провалу, а OpenAI, несмотря на миллиардные инвестиции, не может нанять специалиста по визуализации данных.
  • Несколько комментаторов предполагают, что эпичный «фейл» мог быть специально подан для вирального обсуждения и дополнительного хайпа.
  • В официальном пресс-релизе ошибки уже исправлены, но общее впечатление осталось: «эпоха AI-хайпа в одной картинке».

Achieving 10,000x training data reduction with high-fidelity labels (research.google)

Сжатая суть статьи

Идентификация нарушающей политику рекламы требует глубокого контекста и культурной чувствительности — сильные стороны LLM. Однако дообучение требует дорогих, качественных разметок, а политика и типы нарушений постоянно меняются. Мы предложили масштабируемый процесс активного обучения, который сводит объём данных с 100 000 до менее 500 примеров и повышает согласованность с экспертами до 65 %. В продакшене крупные модели используют в 10 000 раз меньше данных без потери качества.

Процесс курирования

  1. Нулевой LLM размечает весь трафик (1).
  2. Кластеризуем «нарушения» и «безопасные» примеры; пересечения кластеров указывают на неуверенность модели (2).
  3. Внутри пересечений выбираем пары близких, но по-разному размеченных примеров (3).
  4. Эксперты размечают приоритетные пары (4).
  5. Полученные метки делятся: часть — для дообучения, часть — для оценки по двум метрикам: внутренняя согласованность экспертов и согласованность «модель ↔ человек». Итерации повторяются до плато.

Метрика
Используем Cohen’s Kappa: 0 — случайное совпадение, >0,8 — отлично. Не требует «золотого стандарта».

Эксперименты
Сравнили Gemini Nano-1 (1,8 B) и Nano-2 (3,25 B) на двух задачах разной сложности. Базовые модели дообучались на ~100 k разметок краудсорсом. Курированные модели — на ~400 примерах за 6 итераций. Все модели вышли на плато, не догнав внутреннее согласие экспертов.

by badmonster • 07 августа 2025 г. в 21:11 • 136 points

ОригиналHN

#active-learning#machine-learning#llm#clustering#data-labeling#google#embeddings#pca

Комментарии (25)

  • Участники сомневаются в заявлении, что «<1 % рекламы — кликбейт», приводя анекдоты о массе скамов и повторяющихся мошеннических объявлениях.
  • Поднимается тема Active Learning: один доклад показывает, что после нормализации условий случайный выбор примеров для разметки может быть эффективнее «умных» стратегий.
  • Критика метода кластеризации: неясно, как получаются пересекающиеся кластеры, если множества «кликбейт/не кликбейт» не пересекаются.
  • Спрашивают, какая именно модель даёт эмбеддинги: LLM или специализированная модель с контрастным обучением; тип кластеризации и роль PCA тоже не описаны.
  • Некоторые считают, что гиперсферы и SVM в диаграмме могут быть намеренным «затуманиванием» ключевых деталей выбора примеров для разметки.

Flipper Zero dark web firmware bypasses rolling code security (rtl-sdr.com) 🔥 Горячее 💬 Длинная дискуссия

В даркнете появилась модифицированная прошивка для Flipper Zero, которая обходит защиту rolling-code у гаражных ворот и автомобильных сигнализаций.

Прошивка «Shadow Code» перехватывает и «замораживает» текущий код, позволяя злоумышленнику повторно активировать систему без подбора следующего значения. Работает на частотах 433/868 МГц, совместима с Keeloq, KeeLoq HCS и аналогичными протоколами.

Разработчики утверждают, что эксплойт не требует физического доступа к брелку: достаточно одного перехваченного пакета. Прошивка распространяется через закрытые Telegram-каналы и даркнет-форумы за криптовалюту.

Специалисты по ИБ рекомендуют обновить прошивку своих систем до последней версии, включить двухфакторную аутентификацию (где поддерживается) и использовать шлюзы с временными окнами активации, чтобы минимизировать риск повторного использования кода.

by lq9AJ8yrfs • 07 августа 2025 г. в 21:10 • 432 points

ОригиналHN

#flipper-zero#rolling-code#keeloq#hcs#rtl-sdr#dark-web#telegram#cryptocurrency#hyundai-kia#two-factor-authentication

Комментарии (253)

  • Уязвимость в системах с динамическим кодом KeeLoq позволяет по одному нажатию кнопки ключа клонировать все функции брелка, если известен «производственный ключ».
  • Пользователи обсуждают, что из-за атаки оригинальный брелок рассинхронизируется и перестаёт работать, что может быть использовано как акт вандализма.
  • Многие считают бесключевой запуск и удалённое открытие машины избыточным риском, предпочитая физический ключ или многофакторную защиту.
  • Упоминается, что производители (особенно Hyundai/Kia) могут выигрывать от краж, так как страховые выплаты приводят к продаже новых машин.
  • Некоторые производители (Chevrolet, Toyota, Honda, Nissan) в списке уязвимых не фигурируют — возможно, используют другие протоколы или просто не тестировались.

Cursor CLI (cursor.com) 🔥 Горячее 💬 Длинная дискуссия

  • Установка: npm i -g cursor-cli
  • Команды: cursor diff, cursor commit, cursor review, cursor chat
  • Где работает: VS Code, JetBrains, Android Studio, Ghostty, Warp, Bash

Функции

  • Прямые правки кода в терминале
  • Реальное управление агентом
  • Правила через .cursorrules, AGENTS.md, MCP

Плюсы

  • Последние модели Anthropic, OpenAI, Gemini
  • Интеграция в любой IDE
  • Скрипты и автоматизация

by gonzalovargas • 07 августа 2025 г. в 20:53 • 359 points

ОригиналHN

#npm#vscode#jetbrains#android-studio#bash#anthropic#openai#gemini#github#llm

Комментарии (248)

  • Пользователи обсуждают внедрение единого стандарта AGENT.md вместо множества разных файлов.
  • CLI-агенты (Claude Code, Cursor CLI и др.) вызывают восторг: удобно держать в фоне, «чувствуешь себя хакером», но UI-IDE теряет значение.
  • Критика: непонятно, зачем платить за Cursor, если тот же функционал уже включён в подписку Anthropic/OpenAI; не хватает обратной связи, MCP, hooks и локальных моделей.
  • Сторонники Cursor верят в его будущую экосистему (CLI + IDE + GitHub-интеграции) и низкие издержки переключения между моделями.
  • Главный вопрос безопасности: доверять ли LLM полный доступ к файловой системе и устанавливать скрипты через curl | bash.

Historical Tech Tree (historicaltechtree.com) 🔥 Горячее

Историческое дерево технологий
Интерактивная визуализация технологической истории от 3 млн лет до наших дней. Проект Этьена Фортье-Дюбуа, пока содержит 0 технологий и 0 связей.

Каменное орудие
3300 тыс. до н. э. — первая технология производства.

by louisfd94 • 07 августа 2025 г. в 19:24 • 483 points

ОригиналHN

#interactive-visualization#technology-history#web-development#ui-ux#web-design

Комментарии (107)

  • Пользователи отмечают слепые зоны: недооценены металлургия, точная механика и «базовая наука», из-за чего газовые турбины возникают «из ниоткуда».
  • Найдены мелкие ошибки: дата «обуви» указывает на сандалии, а не самые ранние туфли 7000–8000 г. до н. э.; точность дат винторезных токарных станков спорна.
  • UI-критика: слишком много пустого пространства, неудобно на мобильных, не хватает зума, тысячных разделителей и «привязки» к следующему узлу.
  • Замечена западная и англоязычная предвзятость: китайское письмо показано как терминус, а не как корень множества ветвей.
  • Предложения по улучшению: вертикальный мобильный вид, поиск «самых важных потомков» технологии, агент для автоматического обогащения графа.

OpenAI's new open-source model is basically Phi-5 (seangoedecke.com) 🔥 Горячее 💬 Длинная дискуссия

OpenAI выложила первые открытые веса: gpt-oss-120b и gpt-oss-20b. Модели хороши в бенчмарках, но проваливают SimpleQA и бедны на поп-культуру. Это, по сути, Phi-5.

Почему Phi?

Себастьян Бубек в Microsoft создал серию Phi, обучаясь исключительно на синтетике: высококачественные, но дорогие токены. Результат — отличные цифры в тестах и слабая практика, потому что «учили к экзамену». В конце 2024-го Бубек ушёл в OpenAI, и новые gpt-oss, судя по всему, построены на той же идее.

Зачем синтетика?

Безопасность. Открытый вес нельзя отозвать, а сообщество быстро стриптизирует модель под эротические ролевые игры. Синтетические данные позволяют заранее заложить отказы и избежать скандалов. OpenAI не нужно, чтобы модель была полезна в проде — достаточно победить китайские открытые веса в таблицах.

Итог: gpt-oss — это Phi-5 и Phi-5-mini, созданные ради безопасности и рекламных графиков.

by emschwartz • 07 августа 2025 г. в 18:59 • 371 points

ОригиналHN

#openai#gpt-oss-120b#gpt-oss-20b#phi-5#microsoft#open-source

Комментарии (199)

  • Модель GPT-OSS из-за жёстких «сейфти-фильтров» отказывается переводить даже безобидные романтические сцены с 17-летними персонажами.
  • Пользователи жалуются, что цензура мешает повседневным задачам: переводам, переписке, написанию детских историй.
  • Некоторые считают главной причиной отказа от полного open-source именно страх перед тонкой настройкой моделей для эротического ролеплея.
  • Другие подтверждают: в локальных сообществах «первертов» действительно много, но это далеко не единственный сценарий использования.
  • В итоге часть аудитории уходит на «аблитерированные» Llama и прочие неконтролируемые модели.

Encryption made for police and military radios may be easily cracked (wired.com)

Криптография для полицейских и военных радиостанций оказалась уязвима

Исследователи из Университета Кентукки и Университета штата Джорджия обнаружили, что алгоритм ADP (Advanced Digital Privacy), который используется в радиостанциях марок BK Technologies, EF Johnson, Relm, Tait и других, можно взломать менее чем за минуту на обычном ноутбуке.

ADP защищает переговоры полиции, армии и спецслужб, но реализует «шифрование» лишь 32-битным XOR-потоком, что делает его фактически небезопасным. Уязвимость позволяет злоумышленнику:

  • Слушать переговоры в реальном времени
  • Изменять команды и координаты
  • Отключать группы или отдельных операторов

Проблема усугубляется тем, что:

  • Производители не публикуют спецификации ADP, поэтому пользователи не могут оценить уровень защиты.
  • Некоторые модели радиостанций не поддерживают современные стандарты (AES-256, P25), оставляя ADP единственным вариантом.

Эксперты рекомендуют переходить на AES-256 или P25 Phase 2, но это требует замены оборудования и перенастройки инфраструктуры.

by mikece • 07 августа 2025 г. в 18:30 • 219 points

ОригиналHN

#encryption#xor#radio#p25#tetra#sdr#mac#security

Комментарии (144)

  • Kevin Mitnick в 90-х глушил полицейские рации, просто зажимая кнопку передачи; сегодня такое не пройдёт из-за P25-транкинга.
  • P25 и TETRA имеют уязвимости: от «on-demand» трекинга до 56-битных ключей и закрытых алгоритмов.
  • В США до недавнего времени большинство переговоров шло в открытом виде, и жители жаловались на переход к шифрованию.
  • Некоторые участники описывают, как легко искать MAC-адреса полицейских ноутбуков или использовать SDR-донглы и дроны для мониторинга.
  • Общий вывод: безопасность радиосвязи часто рассматривалась как пунктик, а не базовое требование, и теперь это даёт сбой.