Hacker News Digest — Страница 242/464

GPT-OSS Reinforcement Learning (docs.unsloth.ai)

Unsloth теперь поддерживает обучение с подкреплением для OpenAI gpt-oss и всех типов моделей, что значительно ускоряет процесс тонкой настройки. Это позволяет эффективно применять методы RL, такие как DPO, ORPO и KTO, для улучшения качества генерации текста и рассуждений модели.

Практический вывод: пользователи могут обучать собственные модели рассуждений с помощью GRPO, экономя память и вычислительные ресурсы. Это открывает возможности для создания более интеллектуальных и адаптивных ИИ-систем без необходимости мощного оборудования.

by vinhnx • 27 сентября 2025 г. в 02:01 • 143 points

Оригинал • HN

#reinforcement-learning #openai #gpt-oss #dpo #orpo #kto #grpo #vllm #reward-hacking #llm

Комментарии (37)

Благодарность Unsloth за реализацию режима сна в vLLM, упрощающего RL-обучение и делающего его более доступным.
Споры о качестве модели GPT-OSS: одни пользователи считают её устаревшей, другие приводят примеры её эффективности в конкретных задачах.
Обсуждение практической пользы дообучения моделей для бизнеса и локального использования, включая работу с редкими языками.
Акцент на демонстрации в релизе Unsloth методов борьбы с читерством (reward hacking) в reinforcement learning.
Упоминание инструмента DeepFabric для генерации данных в формате OpenAI.

The Obsessively Complete Infocom Catalog (eblong.com)

Сайт представляет собой архив всех версий игр Infocom, включая исходный код и скомпилированные файлы. Каждый пакет помечен серийным номером и датой компиляции, что позволяет восстановить хронологию разработки. Коллекция сосредоточена на оригинальных релизах и фанатских модификациях 1980-х годов, исключая современные пересборки и исправления ошибок.

Основой архива послужили материалы, опубликованные Джейсоном Скоттом в 2019 году, но здесь добавлены пропущенные вариации, бета-тесты и исправлены ошибки GitHub-репозиториев. Файлы доступны для скачивания в форматах JSON и ZIP. Автор подчёркивает историческую ценность коллекции, несмотря на юридическую неоднозначность распространения проприетарного контента.

by exvi • 26 сентября 2025 г. в 23:43 • 117 points

Оригинал • HN

#infocom #zork #activision #json #github #ifdb #ifwiki

Комментарии (39)

Рекомендуется начинать знакомство с текстовыми квантами не с Infocom (например, Zork), а с более дружелюбных к игроку игр, таких как Glowgrass или Lost Pig.
Обсуждается применение LLM (языковых моделей) для улучшения парсеров команд и создания более естественного диалога с NPC, что может привлечь новое поколение игроков.
Упоминаются ресурсы для поиска и оценки игр (база данных IFDB) и авторские системы для их создания (IFWiki), а также подкасты, посвящённые Infocom.
Отмечается историческая и культурная значимость Infocom, а также тот факт, что бренд был продан Activision и использовался для публикации игр после закрытия оригинальной студии.
Высказываются личные воспоминания и опыт игры в классические кванты, такие как Trinity или A Mind Forever Voyaging, подчёркивающие их художественную ценность.

New math revives geometry's oldest problems (quantamagazine.org)

Новые методы в алгебраической геометрии возрождают классические задачи, восходящие к древнегреческим математикам вроде Аполлония Пергского. Используя теорию обогащённой схемы — относительно молодой подход, разработанный в последние десятилетия, — исследователи смогли систематически подсчитывать геометрические объекты, удовлетворяющие заданным условиям, например, количество окружностей, касающихся трёх данных. Этот метод позволяет учитывать вырожденные случаи и мультипликативности, которые ранее затрудняли точные вычисления.

Один из ключевых результатов — доказательство того, что на кубической поверхности лежит ровно 27 прямых, а также уточнение числа конических сечений, касающихся пяти заданных. Подход не только даёт строгие ответы на многовековые вопросы, но и открывает пути для решения более сложных проблем, связывая геометрию с алгеброй и теорией чисел. Это показывает, как современные абстракции оживляют древнейшие математические интуиции.

by pykello • 26 сентября 2025 г. в 22:57 • 128 points

Оригинал • HN

#algebraic-geometry #theory-of-enriched-schemes #gromov-witten-theory #cubic-surfaces #conic-sections #apollonius-of-perga #number-theory

Комментарии (9)

Участники обсуждают сложность понимания математических концепций из статьи Quanta Magazine, в частности, теории Громова-Виттена и подсчёта линий на кубической поверхности.
Некоторые пользователи выражают затруднение или полное непонимание темы, отмечая, что даже поиск не прояснил вопрос.
Один из комментаторов предлагает простое визуальное наблюдение о состояниях круга (2^3=8), но не как доказательство, а как заметку.
Высказывается мнение, что Quanta Magazine в целом хорошо и точно доносит суть сложных тем, вселяя доверие даже к статьям вне зоны компетенции читателей.
Поднимается вопрос, сохраняется ли обсуждаемое математическое правило для большего количества точек (4, 5, 10).

Why do we remember some life moments but not others? (bu.edu)

Мозг укрепляет воспоминания о рутинных событиях, если они связаны с эмоционально значимым моментом — например, незначительные детали перед выигрышем в лотерею запоминаются лучше. Исследование Бостонского университета с участием 650 человек показало, что этот эффект работает по-разному для событий до и после ключевого момента: последующие воспоминания усиливаются пропорционально интенсивности эмоций, а предыдущие — через общие признаки, такие как визуальные совпадения.

Это открытие объясняет, почему мы ярко помним не только важные события, но и сопутствующие мелочи — например, камень на тропе перед встречей с бизонами. Результаты могут помочь в разработке методов улучшения памяти для студентов или терапии травматических воспоминаний, поскольку демонстрируют активную роль мозга в фильтрации и усилении значимых фрагментов опыта.

by hhs • 26 сентября 2025 г. в 22:44 • 91 points

Оригинал • HN

#neuroscience #cognitive-science #memory #psychology #research

Комментарии (48)

Память избирательна: эмоциональные и неожиданные события запоминаются лучше, чем рутинные.
Воспоминания могут быть тесно связаны с сенсорными сигналами, особенно с обонянием.
Процесс воспоминания не пассивен: память может меняться при каждом её воспроизведении.
Существует субъективный арбитрарный элемент: некоторые тривиальные моменты запоминаются без видимой причины.
Интенсивность воспоминаний может зависеть от личностных особенностей и того, на чём человек сосредотачивается.

Thoughts on Mechanical Keyboards and the ZSA Moonlander (masteringemacs.org) 💬 Длинная дискуссия

Механические клавиатуры, особенно программируемые модели вроде ZSA Moonlander, — это не просто модный аксессуар, а серьёзный инструмент для снижения нагрузки на пальцы и предотвращения травм. Автор, долгое время пользовавшийся эргономичными, но недолговечными клавиатурами Microsoft, перешёл на Moonlander из-за его долговечности, сменных переключателей и возможности кастомизации. Ключевое преимущество — прошивка, которая позволяет переназначать клавиши на уровне железа, делая настройки портативными между устройствами.

Особенно ценна эта возможность в строгих корпоративных средах, где стандартные методы переопределения клавиш (например, Caps Lock в Ctrl) часто блокируются. Программируемая клавиатура решает эту проблему, так как все макросы и переназначения хранятся в её памяти. Автор подчёркивает, что главное — не эстетика («клацающие» клавиши или цветные кейкапы), а практическая польза: гибкость, эргономика и сохранение здоровья при долгой работе за компьютером.

by TheFreim • 26 сентября 2025 г. в 22:17 • 132 points

Оригинал • HN

#zsa-moonlander #mechanical-keyboards #ergonomic-design #qmk #kinesis-advantage #glove80 #rsi

Комментарии (181)

Пользователи делятся опытом решения проблем с RSI (репитивной нагрузкой) с помощью эргономичных клавиатур, таких как Kinesis Advantage, Moonlander, Glove80 и других.
Подчёркивается важность программируемости (QMK), раздельной конструкции, ортолинейной или вогнутой формы для снижения нагрузки на руки и запястья.
Отмечается, что не существует универсального решения: выбор зависит от индивидуальных предпочтений (раскладка, количество клавиш, необходимость в функциональных клавишах).
Многие прошли через долгий период адаптации и кастомизации раскладки, что требует времени, но в итоге окупается.
Некоторые пользователи отмечают, что лучшим решением стала физиотерапия или комбинация методов (отдых, упражнения, вертикальная мышь), а не только смена клавиатуры.

Moondream 3 Preview: Frontier-level reasoning at a blazing speed (moondream.ai) 🔥 Горячее

Moondream 3 — это предварительная версия модели компьютерного зрения с архитектурой MoE на 9 млрд параметров, из которых активно используются только 2 млрд. Это позволяет ей достигать уровня передовых моделей в задачах визуального анализа, сохраняя при этом высокую скорость и низкую стоимость инференса. Ключевые улучшения включают расширение контекста до 32 тыс. токенов, лучшую обучаемость (включая обучение с подкреплением) и нативную поддержку сложных запросов, таких как детекция объектов, указание на элементы и структурированный вывод.

Модель демонстрирует впечатляющие результаты: точно определяет объекты по описанию (например, «бегун в фиолетовых носках»), генерирует JSON по изображению, преобразует таблицы в Markdown и работает с OCR. Несмотря на компактность, в бенчмарках она конкурирует с топовыми решениями, но делает это в разы быстрее и дешевле, что открывает возможности для массового применения в робототехнике, медицине и системах наблюдения.

by kristianp • 26 сентября 2025 г. в 21:59 • 262 points

Оригинал • HN

#moe #computer-vision #ocr #edge-computing #reinforcement-learning #json #markdown #object-detection #robotics #medical-imaging

Комментарии (38)

Moondream 2 и 3 высоко оцениваются за точность и скорость в задачах автоматической разметки датасетов и детекции объектов, особенно для краевых устройств.
Архитектура MoE модели с активацией только 2B параметров считается прорывом для развертывания на edge-устройствах из-за низкой задержки и стоимости инференса.
Отмечаются проблемы с точностью (precision) в последних релизах, а также отсутствие информации о ценах в облаке и временная лицензия BSL для превью Moondream 3.
Модель демонстрирует впечатляющие результаты в сравнении с крупными коммерческими аналогами (Gemini, Claude, OpenAI), особенно в задачах, смежных с OCR.
Потенциальные применения включают автоматизацию работы с UI, анализ графиков и диаграмм, а также управление компьютером/браузером.

How insurance risk is transformed into investable assets (riskvest.io)

Страховой риск превращается в инвестиционный актив через процесс коллатерализации. Обычные страховые полисы лишь частично обеспечены капиталом страховой компании — этого хватает для покрытия типичных убытков, но в экстремальных сценариях (например, катастрофические события) убытки могут превысить собранные премии и даже резервы, что ведёт к неплатежеспособности. Именно поэтому регуляторы строго контролируют достаточность капитала и ограничивают прямое инвестирование в страховые риски для розничных инвесторов.

Для создания инвестиционных продуктов страховой риск полностью коллатеризуется — эмитент резервирует активы, достаточные для покрытия максимально возможных убытков. Это защищает инвестора от потерь beyond вложенной суммы, в отличие от исторической практики Lloyd's, где инвесторы (Names) рисковали всем личным состоянием. Таким образом, страховой риск становится предсказуемым и безопасным активом с чёткими параметрами доходности и убытков.

by rrjjww • 26 сентября 2025 г. в 20:46 • 116 points

Оригинал • HN

#insurance #risk #investments #cat-bonds #collateralization #regulation #financial-crisis #covid-19

Комментарии (37)

Обсуждаются особенности CAT-бондов (облигаций, связанных с катастрофами): их триггеры (конкретные природные явления или отраслевые убытки), корреляция с реальными убытками страховщиков и ограниченная доступность для частных инвесторов.
Затрагивается влияние пандемии COVID-19 на страховую отрасль: отсутствие массовых банкротств из-за небольшого рынка страхования от пандемий и оспаривание выплат по полисам бизнес-прерывания.
Поднимаются вопросы о нишевости продукта, недостатке информации даже среди финансовых советников и потенциале для диверсификации и снижения волатильности при росте рынка.
Упоминаются системные риски, ретроцессия (перестрахование для перестраховщиков) и возможные параллели с финансовым кризисом 2008 года из-за сложности инструментов.
Отмечается качество и доступность исходной статьи, а также необходимость её вычитки для устранения опечаток.

Why use mailing lists? (mailarchive.ietf.org)

Электронная почта и почтовые рассылки остаются незаменимыми благодаря своей федеративной природе, асинхронности и лёгкости архивирования. Они не требуют одновременного присутствия онлайн, что отличает их от современных альтернатив вроде мессенджеров и соцсетей.

Ключевые преимущества включают отсутствие необходимости в специальном ПО — достаточно стандартного почтового клиента, простоту использования с едиными правилами, низкие риски безопасности и конфиденциальности по сравнению с веб-форумами, а также экономию трафика. Эти факторы делают почтовые рассылки устойчивым решением для технических и профессиональных сообществ.

by cnst • 26 сентября 2025 г. в 19:27 • 217 points

Оригинал • HN

#email #mailing-lists #ietf #nntp #activitypub #matrix #irc #rss #discourse

Комментарии (148)

Обсуждаются преимущества почтовых рассылок: независимость от компаний, федеративность, архивируемость и доступность.
Отмечаются проблемы рассылок: сложность модерации, уязвимость email-адресов, плохой UI/UX и отсутствие истории для новичков.
Упоминаются альтернативы: NNTP (Usenet), ActivityPub, Matrix, IRC, RSS и форумы (Discourse), но у них есть свои ограничения.
Подчёркивается ирония обсуждения рассылок на централизованном проприетарном форуме (Hacker News).
Приводятся примеры успешного использования рассылок для HOA, профессиональных сообществ и длительных дискуссий.

If you are harassed by lasers (laserpointersafety.com) 💬 Длинная дискуссия

Если вас преследуют лазерными лучами, важно сохранять спокойствие и избегать прямого взгляда на источник света. Лазерное излучение может вызвать временное ослепление, блики и даже необратимое повреждение сетчатки, особенно при использовании мощных устройств. В первую очередь защитите глаза, отвернувшись или прикрыв их, и немедленно покиньте опасную зону.

Сообщите о происшествии в правоохранительные органы, предоставив как можно больше деталей: время, место, описание источника и причастных лиц. Во многих странах нацеливание лазеров на людей, транспорт или aircraft является уголовным преступлением. Практический вывод: знание правил безопасности и быстрые действия помогают минимизировать риски и способствуют привлечению виновных к ответственности.

by 1970-01-01 • 26 сентября 2025 г. в 19:12 • 207 points

Оригинал • HN

#lasers #safety #eyesight-protection #law-enforcement #aircraft-safety #light-redirection

Комментарии (197)

Решение проблемы с раздражающим светом от генератора соседа с помощью зеленой наклейки, перенаправляющей свечение.
Обсуждение опасностей лазерных указателей, включая случаи их использования для хулиганства и потенциального вреда для зрения.
Критика сайта LaserPointerSafety.com за размещение ссылок на сомнительные ресурсы, связанные с теориями заговора.
Обсуждение психиатрического аспекта: люди, страдающие паранойей, могут интерпретировать обычные явления как целенаправленные атаки.
Предложения по решению проблемы слишком ярких индикаторных светодиодов в устройствах (затемнение, использование световодов, изоленты).

When Bruce Lee trained with Kareem Abdul-Jabbar (lithub.com)

Брюс Ли тренировал Карима Абдул-Джаббара в конце 1960-х, превратив баскетболиста в ученика джит кун до. Их сотрудничество выходило за рамки физической подготовки: Ли учил философии адаптивности и эффективности, подчёркивая, что «стиль без стиля» — ключ к настоящему мастерству. Для Абдул-Джаббара, искавшего духовную глубину за пределами спорта, эти уроки стали мостом между дисциплинами.

Их совместная работа позже воплотилась в фильме «Игра смерти», где сцены боёв демонстрируют синтез боевых искусств и атлетизма. Ли видел в росте Джаббара (218 см) не помеху, а уникальное преимущество, разрабатывая для него технику, использующую длину конечностей. Это взаимное влияние показало, как искусство может трансформировать даже самых физически одарённых людей.

by bookofjoe • 26 сентября 2025 г. в 19:04 • 110 points

Оригинал • HN

#bruce-lee #kareem-abdul-jabbar #martial-arts #basketball #film #racism

Комментарии (56)

Обсуждается тренировка Карима Абдул-Джаббара с Брюсом Ли и его влияние на восприятие времени и концентрацию.
Упоминается комедийная роль Карима (Роджера Мердока) в фильме «Аэроплан» и его спортивная карьера.
Поднимается вопрос о реальных боевых навыках Брюса Ли и их восприятии в массовой культуре.
Обсуждается проблема расизма в 60-е годы и вклад таких личностей, как Карим и Эд Салливан.
Критикуется заголовок статьи и приводятся архивные ссылки для ознакомления с первоисточником.