Hacker News Digest

Обновлено: 28 ноября 2025 г. в 08:55

Постов: 4635 • Страница 243/464

How does lossless compression in Fuji RAF files work? (2020) (capnfabs.net)

Fuji RAF использует адаптивный дифференциальный алгоритм сжатия без потерь. Сначала изображение делится на вертикальные полосы (например, 8 для X-T2), что позволяет параллельно обрабатывать данные на многоядерных процессорах. Затем пиксели группируются по цветовым компонентам (R, G, B) через фильтр Байера, поскольку соседние пиксели одного цвета имеют меньшие различия, что улучшает сжатие.

Далее цветовые векторы попарно перемежаются (например, R0 и G0) с особым порядком обработки: сначала чётные позиции, затем нечётные с отставанием в 5 шагов. Для каждого значения вычисляется ожидаемое на основе взвешенного среднего соседних пикселей, а кодируется разница между предсказанием и фактическим значением. Это сокращает энтропию данных, позволяя достичь двукратного уменьшения размера файла без потерь качества.

by dsego • 26 сентября 2025 г. в 18:43 • 93 points

ОригиналHN

#image-compression#fujifilm#raw-image-formats#lossless-compression#lightroom#capture-one#darktable#fastrawviewer#dng

Комментарии (47)

  • Пользователи отмечают проблемы с обработкой RAW-файлов Fuji (RAF) в Lightroom, включая перегрев и "червеобразные" артефакты ("worming").
  • Проблема связывается с нестандартной матрицей X-Trans, требующей особого алгоритма дебайеринга, который плохо реализован в Lightroom.
  • В качестве решения предлагаются альтернативные программы (Capture One, Darktable, FastRawViewer), лучше справляющиеся с RAF.
  • Обсуждаются споры о преимуществах несжатых RAW над сжатыми, где главный аргумент — совместимость (например, с iOS).
  • Критикуются производители за создание проприетарных форматов вместо использования стандартного DNG, что усложняет поддержку.

Oral Microbes Linked to 3-Fold Increased Risk of Pancreatic Cancer (nyulangone.org)

Исследование выявило прямую связь между определёнными бактериями в полости рта и повышенным риском развития рака поджелудочной железы. У пациентов с этим диагнозом обнаружили повышенные уровни микроорганизмов Porphyromonas gingivalis и Aggregatibacter actinomycetemcomitans, которые ассоциируются с заболеваниями дёсен. Эти бактерии могут проникать в кровоток и провоцировать хроническое воспаление, создавая условия для онкогенеза.

У носителей P. gingivalis риск возрастал на 59%, а у тех, у кого находили A. actinomycetemcomitans, — на 50%. Это подчёркивает важность гигиены полости рта не только для профилактики кариеса, но и для снижения вероятности серьёзных системных заболеваний. Регулярные визиты к стоматологу и контроль состояния дёсен могут стать частью стратегии по уменьшению риска онкологии.

by bmau5 • 26 сентября 2025 г. в 18:20 • 128 points

ОригиналHN

#healthcare#medical-research#dental-health#oncology#microbiology

Комментарии (60)

  • Исследование выявило корреляцию между определенными микробами в полости рта и риском рака поджелудочной железы, но не доказало причинно-следственную связь или механизм.
  • Подчеркивается важность баланса в уходе за полостью рта, а не стерильности, поскольку чрезмерное использование ополаскивателей может нанести вред здоровью.
  • Обсуждается необходимость включения стоматологической помощи в систему общего здравоохранения, так как плохое состояние полости рта связано с системными заболеваниями.
  • Критикуется представление данных о риске (например, «3-кратное увеличение») без указания базового уровня, что делает такие цифры малосодержательными.
  • Отмечается, что связь между патогенами и раком часто недооценивается из-за ограничений в методах обнаружения и дизайне исследований.

Auth.js is now part of Better Auth (better-auth.com)

Auth.js, ранее известный как NextAuth.js, переходит под управление команды Better Auth. Эта библиотека — один из самых популярных инструментов аутентификации в JavaScript, используемый такими сервисами, как ChatGPT и Google Labs. Инициатива возникла из-за растущих потребностей в гибкости и современных функциях, которые исходная команда Auth.js не могла полноценно реализовать.

Существующие пользователи Auth.js могут продолжать работу без изменений: команда будет поддерживать безопасность и исправлять критические проблемы. Однако для новых проектов рекомендуется выбирать Better Auth, так как он предлагает более современные решения. Миграционные руководства уже доступны, а в будущем Better Auth планирует добавить недостающие функции, такие как управление сессиями без базы данных, чтобы объединить экосистему.

by ShaggyHotDog • 26 сентября 2025 г. в 18:04 • 165 points

ОригиналHN

#auth.js#better-auth#nextauth.js#javascript#auth0#openai

Комментарии (65)

  • Выражена обеспокоенность поглощением бесплатного проекта Auth.js коммерческим продуктом Better Auth, что может привести к его заброшенности.
  • Отмечаются проблемы с развитием Auth.js: долгая разработка новой версии и уход ключевого контрибьютора.
  • Подчеркивается удобство и популярность Auth.js среди разработчиков благодаря простой настройке и независимости от фреймворков.
  • Обсуждается миграция крупных компаний (например, OpenAI) с Auth0 на собственные или открытые решения из-за неудовлетворительной поддержки.
  • Упоминается нехватка простых и современных аутентификационных решений для языков вроде Go, в отличие от экосистемы JavaScript.

SimpleFold: Folding proteins is simpler than you think (github.com) 🔥 Горячее

Apple выпустила open-source библиотеку ML-SimpleFold для предсказания трёхмерной структуры белков на основе их аминокислотной последовательности. Она использует архитектуру трансформеров и оптимизирована для эффективного обучения и инференса на GPU. Код написан на PyTorch и включает инструменты для подготовки данных, обучения моделей и визуализации результатов.

Библиотека поддерживает предсказание структур как отдельных белков, так и комплексов, с акцентом на скорость и воспроизводимость. Это демонстрирует растущий интерес крупных tech-компаний к computational biology. Практический вывод: инструмент упрощает исследования в биоинформатике, снижая барьер входа для научных групп без мощных вычислительных ресурсов.

by kevlened • 26 сентября 2025 г. в 18:01 • 450 points

ОригиналHN

#pytorch#transformers#gpu#machine-learning#protein-folding#bioinformatics#apple#knowledge-distillation#alphafold#esmfold

Комментарии (126)

  • Представлена упрощенная модель предсказания структуры белков SimpleFold, использующая подход knowledge distillation от сложных моделей (AlphaFold, ESMFold) и демонстрирующая высокую эффективность.
  • Обсуждается, что модель обучалась на данных, сгенерированных другими ИИ-системами, а не на экспериментальных структурах, что поднимает вопросы о её истинной новизне и независимости.
  • Подчеркивается тренд на упрощение архитектур моделей для предсказания folding, следуя "bitter lesson" в ML, и потенциальные выгоды для локального inference на потребительском железе.
  • Участники спорят, является ли проблема folding решенной после AlphaFold, и в чем разница между физическими симуляциями (Folding@Home) и статистическими методами (ИИ).
  • Высказываются предположения о мотивации Apple заниматься этой темой: от престижа и маркетинга до практических целей вроде оптимизации чипов и развития локальных вычислений.

Suno Studio, a Generative AI DAW (suno.com) 💬 Длинная дискуссия

Suno Studio — это веб-платформа для создания музыки с помощью искусственного интеллекта, позволяющая пользователям генерировать треки по текстовым описаниям. Она предлагает интуитивный интерфейс, где можно указать жанр, настроение, инструменты и даже добавить вокал, получая готовые композиции за секунды.

Сервис демократизирует музыкальное производство, делая его доступным даже для новичков без специальных навыков. Пользователи отмечают высокое качество звука и креативные возможности, хотя иногда AI может выдавать неожиданные результаты. Это инструмент для быстрого прототипирования, вдохновения или просто развлечения, расширяющий границы творчества.

by debrisapron • 26 сентября 2025 г. в 17:17 • 185 points

ОригиналHN

#generative-ai#music-production#ai-ethics#midi#daw#artificial-intelligence#llm

Комментарии (217)

  • Музыканты и энтузиасты разделились во мнениях: одни видят в Suno мощный инструмент для творчества и исследования звука, другие считают его лишённым души и чувства достижения.
  • Ключевые обсуждаемые особенности Suno: переход к браузерной DAW, генерация качественного контента, включая MIDI и stems, а также вопросы авторских прав и коммерческого использования.
  • Поднимаются вопросы этики использования ИИ: заимствование чужих работ для обучения моделей и потенциальная девальвация человеческого труда в музыке и искусстве.
  • Отмечается стремительный прогресс качества генерации (Suno v5), что делает музыку неотличимой от профессиональной для большинства слушателей, но эксперты могут определить искусственное происхождение.
  • Высказываются опасения о насыщении рынка однообразным контентом и влиянии ИИ-инструментов на будущее профессии музыканта и процесс обучения.

Modular Manifolds (thinkingmachines.ai)

Нормализация тензоров в больших нейросетях — ключевой аспект их стабильного обучения. Она предотвращает проблемы численной нестабильности, такие как переполнение или исчезновение градиентов, и упрощает проектирование алгоритмов, обеспечивая предсказуемость размеров весов, активаций и обновлений. Хотя нормализация активаций (например, layer norm) и градиентов уже стала стандартом, нормализация весовых матриц применяется реже, несмотря на потенциальные преимущества.

Ограничение норм весов помогает контролировать относительный размер обновлений, избегать взрыва норм и улучшать condition number матриц, делая их поведение более предсказуемым. Это позволяет сосредоточить усилия по настройке гиперпараметров на наиболее значимых тензорах. Практические реализации, такие как в EDM2, показывают, что такие методы могут улучшать устойчивость и эффективность обучения больших моделей.

by babelfish • 26 сентября 2025 г. в 17:06 • 147 points

ОригиналHN

#machine-learning#deep-learning#neural-networks#tensors#normalization#optimization#pymanopt

Комментарии (53)

  • Обсуждение возможности ограничения весов нейронных сетей на многообразиях и переосмысления оптимизации с такими ограничениями.
  • Вопросы о новизне подхода, учитывая существующие работы и библиотеки (Pymanopt) по оптимизации на многообразиях.
  • Критика и сомнения в представленных эмпирических результатах (низкая точность на CIFAR-10, малый масштаб модели).
  • Обсуждение формата публикации (блогпост vs. научная статья) и мотивов авторов.
  • Замечания о дизайне и UX сайта с блогпостом (положительные и отрицательные).

Open Social (overreacted.io) 🔥 Горячее 💬 Длинная дискуссия

Открытое ПО стало стандартом для общей инфраструктуры, хотя 35 лет назад многие сомневались в его конкурентоспособности. Сегодня мы находимся на аналогичном переломном моменте с социальными приложениями — возникает движение «открытой социальности». AT Protocol от Bluesky предлагает наиболее убедительный подход, где данные контролируются пользователями, а не платформами, подобно тому, как открытый код изменил разработку.

Веб изначально позволял независимо управлять контентом через личные домены, но социальные медия централизовали данные в своих базах. AT Protocol восстанавливает децентрализацию: пользователи владеют данными, могут менять хостинг без потери связей, что меняет баланс сил между платформами и пользователями. Как и с открытым ПО, это потребует времени, но может стать новой нормой.

by knowtheory • 26 сентября 2025 г. в 16:01 • 883 points

ОригиналHN

#at-protocol#bluesky#decentralization#activitypub#social-media#web#open-source#data-ownership#nostr#rss

Комментарии (354)

  • Обсуждение преимуществ AT Protocol для контроля пользователями своих данных через личные репозитории и домены
  • Сравнение AT Protocol с ActivityPub, включая вопросы интероперабельности, доступности и централизации (например, через Bluesky)
  • Критические замечания о практических ограничениях: стоимость доменов, сложность для обычных пользователей и риски потери данных
  • Вопросы о приватности, модерации и безопасности в децентрализованной модели
  • Обсуждение сетевых эффектов, будущего социальных медиа и альтернатив (например, личные сайты, RSS, Nostr)

Evolving the Multi-User Spaceport (spacex.com)

Компания SpaceX, основанная Илоном Маском в 2002 году, занимается разработкой ракет и космических технологий с целью снижения стоимости космических полетов и колонизации Марса. Её ключевые достижения включают многоразовые ракеты Falcon 9 и космический корабль Dragon, который доставляет грузы на МКС.

Одним из самых амбициозных проектов является Starship — полностью многоразовая система для межпланетных путешествий. Успешные испытания и регулярные запуски Starlink (спутниковой интернет-сети) демонстрируют практическую ценность технологий SpaceX, меняя представление о доступности космоса.

by thsName • 26 сентября 2025 г. в 15:17 • 129 points

ОригиналHN

#spacex#starship#starlink#falcon-9#dragon#blue-origin#ula#twitter

Комментарии (54)

  • SpaceX представляет планы по увеличению запусков Starship во Флориде, отвечая на экологические и операционные возражения конкурентов, таких как Blue Origin и ULA.
  • Участники обсуждают, является ли заявление SpaceX обновлением или аспирационным замыслом, отмечая отсутствие конкретных новостей, но признавая долгосрочное планирование.
  • Подняты вопросы о потенциальном воздействии частых запусков на окружающую среду, включая выбросы CO2, разрушение озонового слоя и риск разжижения грунта.
  • Обсуждается будущее техасского Starbase и необходимость масштабных изменений в инфраструктуре космодромов для поддержки высокой частоты запусков.
  • Некоторые пользователи видят в этом часть конкурентной борьбы, где экологические аргументы могут использоваться для задержки или блокировки проектов конкурентов.

Fast UDP I/O for Firefox in Rust (max-inden.de) 🔥 Горячее

Firefox переписывает свой стек UDP для QUIC на Rust, чтобы использовать современные системные вызовы и повысить производительность. Около 20% HTTP-трафика браузера уже идёт через HTTP/3 поверх QUIC/UDP, а старый код на NSPR не поддерживает многопакетные операции вроде sendmmsg или аппаратное ускорение сегментации (GSO/GRO).

Новый движок построен на основе библиотеки quinn-udp и показывает впечатляющие результаты: в CPU-нагруженных сценариях пропускная способность выросла с менее 1 Гбит/с до 4 Гбит/с. Основная сложность заключалась в поддержке старых версий ОС, включая Android 5. Проект также усиливает безопасность благодаря использованию memory-safe языка и тесной интеграции с существующей Rust-реализацией QUIC во Firefox.

by Bender • 26 сентября 2025 г. в 15:14 • 328 points

ОригиналHN

#rust#quic#udp#firefox#http3#quinn#gso#gro

Комментарии (64)

  • Увеличение пропускной способности UDP до 4 Гбит/с и снижение нагрузки на CPU благодаря оптимизациям в библиотеке quinn-udp
  • Критика скорости в 4 Гбит/с как недостаточной для высокоскоростных сетей и обсуждение ограничений системных вызовов и шифрования
  • Вопросы о работе механизмов GSO/GRO для UDP и обработки пакетов, приходящих не по порядку
  • Обсуждение поддержки проектов с открытым исходным кодом, в частности, вклад Mozilla в Quinn кодом, но не финансированием
  • Дебаты о целесообразности использования самоподписанных сертификатов в HTTP/3 для LAN и соображения безопасности

Context is the bottleneck for coding agents now (runnercode.com)

Современные модели ИИ демонстрируют сверхчеловеческие способности в решении абстрактных задач, как показал недавний успех GPT-5 на ICPC, но автономные кодирующие агенты всё ещё не могут заменить разработчиков. Основное ограничение — не интеллект, а контекст: агентам не хватает глубокого понимания кодовой базы, её архитектурных паттернов и скрытых знаний, которые есть у людей.

Контекст включает не только код, но и документацию, историю решений, неформальные соглашения и причины прошлых изменений. Без доступа к Slack-тредам, постмортемам инцидентов и организационным практикам агенты работают лишь на 20% от возможного уровня, справляясь в основном с мелкими задачами. Чтобы двигаться дальше, нужны системы, способные усваивать и применять этот скрытый контекст так же, как это делают люди.

by zmccormick7 • 26 сентября 2025 г. в 15:06 • 146 points

ОригиналHN

#llm#coding-agents#codebases#context-management#documentation#software-development#large-language-models#artificial-intelligence#developer-tools#machine-learning

Комментарии (149)

  • Основным ограничением для кодирующих агентов на основе ИИ является не размер контекстного окна, а неспособность эффективно фокусироваться на актуальных задачах и отбрасывать нерелевантную информацию.
  • Многие участники отмечают, что ИИ-агенты демонстрируют уровень понимания, сравнимый с начинающим разработчиком, и не способны заменить senior-специалистов, которые могут интерпретировать бизнес-требования и принимать ответственные решения.
  • Существует скептицизм относительно бесконечного увеличения "интеллекта" моделей, так как даже с большим контекстом они допускают ошибки и галлюцинации, а фундаментальные ограничения вероятностной генерации остаются.
  • Предлагаются решения для улучшения работы агентов: лучше структурированные кодобазы, иерархическая документация, инструменты для управления контекстом и памятью, а также человеческий контроль для курирования процесса.
  • Подчёркивается, что ключевая проблема — не технический контекст, а понимание intent (намерения) стоящего за кодом, что требует более глубокого осмысления, чем простое прогнозирование токенов.