Hacker News Digest — Страница 385/464

From GPT-4 to GPT-5: Measuring progress through MedHELM [pdf] (fertrevino.com)

%PDF-1.7
50 0 obj
<< /Length 2836 /Filter /FlateDecode >>
stream
…сжатый бинарный поток…
endstream
endobj

65 0 obj
<< /Length 2952 /Filter /FlateDecode >>
stream
…сжатый бинарный поток…
endstream
endobj

by fertrevino • 21 августа 2025 г. в 22:52 • 118 points

Оригинал • HN

#gpt-4 #gpt-5 #medhelm #rag #headqa #medbullets #pubmedqa #llm

Комментарии (87)

GPT-5 показывает смешанные результаты: лучше справляется с фактами и рассуждениями, но хуже — со структурированными запросами, честностью и доказательной базой.
Обычным пользователям, интересующимся здоровьем, важнее всего HeadQA, Medbullets, MedHallu и PubMedQA; при этом RAG-подходы могут быть полезнее «чистого» модельного ответа.
Некоторые разработчики отмечают, что GPT-5 быстро решает сложные задачи, но «самоуправляется» и делает лишнее; другие считают улучшение минимальным и связывают это с экономией вычислений.
Обсуждаются возможные причины регрессии: маршрутизатор экспертных моделей, ограничения на tool-calls и использование режима «medium» вместо «high» reasoning.

The Onion brought back its print edition and the gamble is paying off (wsj.com)

The Onion вернул печать — и выиграл

Новые владельцы The Onion год назад вложились в «умерший» формат: бумажную подписку.
Ставка сработала: спрос растёт, издание выделяется на фоне цифрового шума.

by andsoitis • 21 августа 2025 г. в 22:28 • 148 points

Оригинал • HN

#print-media #media-industry #subscriptions

Комментарии (40)

Печатная версия The Onion вернулась и вызывает ностальгию: её помнят по университетам Миннесоты и Висконсина 80–90-х.
Подписчики рады отвлечься от экранов: линейное чтение, меньше рекламы и драмы, больше удовольствия.
Кто-то нашёл работу через рекламу в старом выпуске, кто-то просто наслаждается субботним сэндвичем и свежим номером.
Качество юмора, по мнению некоторых, заметно улучшилось после смены владельца в 2023 году.
Печатные издания вроде Game Informer и The Economist тоже получают похвалу за «дыхание свежего воздуха» в эпоху кликбейтов.

Scientists No Longer Find X Professionally Useful, and Have Switched to Bluesky (academic.oup.com)

—

by sebg • 21 августа 2025 г. в 22:22 • 125 points

Оригинал • HN

#bluesky #x #mastodon #social-media

Комментарии (92)

Исследование, утверждающее «Bluesky полезнее X для учёных», вызывает скепсис: выборка мала, данные о доле учёных на X и кроссплатформенном использовании отсутствуют.
Многие участники считают X всё ещё главной площадкой для tech-обсуждений, несмотря на поток спама, мизинформации и NSFW-контента.
Bluesky критикуют за слабую модерацию непомеченного NSFW, «либеральный пузырь» и отсутствие ключевых инфлюенсеров; часть пользователей вернулась в X.
Люди, ушедшие с X, жалуются на резкое падение качества дискуссий и переходят в Mastodon/Bluesky, но признают меньшую активность и узость аудитории.
Общий вывод: выбор платформы остаётся компромиссом между охватом (X) и комфортом/контролем (Bluesky, Mastodon).

CEO pay and stock buybacks have soared at the 100 largest low-wage corporations (ips-dc.org)

Главные выводы

Зарплаты CEO в «Low-Wage 100» (100 крупнейших компаний S&P 500 с самой низкой медианной зарплатой сотрудников) выросли в 2024 г. до $15,9 млн (+9 % за год и +31 % с 2019 г.).
Медианная зарплата работников за тот же период выросла всего на 12 %, а с учётом инфляции реально упала.
Соотношение CEO/сотрудник достиго 1:335; в McDonald’s — 1:1 209.
За 2019–2024 гг. 100 компаний потратили $341 млрд на выкуп акций, что в 2,6 раза превышает их капвложения.
Amazon, Walmart, Target, McDonald’s, Starbucks — лидеры по объёму buyback и одновременно по числу работников, получающих господдержку (SNAP, Medicaid).
74 % этих компаний вели антисоюзные кампании, 46 % стали объектом трудовых жалоб в NLRB.

Комментарии (105)

Участники обсуждают, как выкуп акций (buybacks) стал легальным способом уменьшить налоги и перераспределить деньги от зарплат к акционерам.
Утверждается, что гигантские пакеты компенсаций CEO сознательно привязывают руководство к интересам акционеров, а не работников.
Некоторые считают, что «топ-талант» в низкооплачиваемых отраслях — заменяемый ресурс, поэтому рынок не «самокорректирует» зарплаты вверх.
Упоминаются Costco и другие контрпримеры, где высокие зарплаты работников совмещаются с успешным бизнесом, но их влияние на рынок пока ограничено.
Критика buybacks смещается к обсуждению иммиграции: большинство исследований не находят значимого долгосрочного давления иммиграции на зарплаты американцев.

Rolling the dice with CSS random() (webkit.org)

CSS random()
Новая функция random(min, max, step) генерирует случайные значения без JS. Все аргументы должны быть одного типа; step опционален и округляет результат.

Пример: звёздное поле

body{background:#000}
.star{
  position:fixed;
  top:random(0%,100%);
  left:random(0%,100%);
  width:random(2px,10px,1px);
  background:#fff;
  border-radius:50%;
}

Каждый .star получает случайные координаты и размер, создавая естественное распределение.

Дополнительные эффекты
Используйте CSS-переменные и слои box-shadow для свечения, а random() для прозрачности и цвета, усиливая атмосферу.

by zdw • 21 августа 2025 г. в 20:43 • 127 points

Оригинал • HN

#css #random #webkit #safari #css-values-5

Комментарии (21)

Предложили «старую» технику «cicada principle» с фонами-простыми числами для предсказуемой «случайности».
Обсудили, что «настоящая» случайность в графике выглядит плохо из-за скоплений и пустот; нужны low-discrepancy последовательности.
Подняли вопрос воспроизводимости: хотят фиксированный seed при перезагрузке, но пока в спецификации нет такого механизма.
Появились шутки о «безопасности в CSS» и предупреждения не использовать random() для криптографии.
Ссылка на спецификацию: CSS Values 5; работает пока только Safari.

Code formatting comes to uv experimentally (pydevtools.com) 🔥 Горячее 💬 Длинная дискуссия

uv format — экспериментальная команда в uv для форматирования кода. Под капотом вызывает Ruff, но не требует отдельной установки.

Как начать

# форматировать текущий проект
uv format

# проверить, без изменений
uv format --check

# только нужные файлы
uv format src/ tests/

Передача аргументов Ruff

Всё, что идёт после --, уходит напрямую в Ruff:

# исключить файлы
uv format -- --exclude="*_pb2.py"

# задать длину строки
uv format -- --line-length 100

Пока функция флажком --preview, но уже позволяет обойтись без отдельного бинарника ruff.

by tanelpoder • 21 августа 2025 г. в 20:26 • 351 points

Оригинал • HN

#uv #ruff #code-formatting #command-line #python

Комментарии (242)

Пользователи спорят: стоит ли встраивать форматирование (ruff format) в uv или это «feature-creep».
Одни рады единой команде uv format, упрощающей жизнь новичкам и командам; другие требуют оставить инструменты раздельными, как в UNIX-way.
Создатели подчеркивают: ruff и uv не сливаются; uv format лишь удобный алиас, аналогичный cargo fmt.

Crimes with Python's Pattern Matching (2022) (hillelwayne.com)

Python 3.10 добавил сопоставление с образцом, которое использует isinstance.
ABC с __subclasshook__ могут подменять проверку типа, поэтому:

class NotIterable(ABC):
    @classmethod
    def __subclasshook__(cls, C):
        return not hasattr(C, "__iter__")

match x:
    case NotIterable(): ...

работает — 10 считается NotIterable, строки и списки — нет.

Аналогично можно «матчить» по наличию атрибутов:

class DistanceMetric(ABC):
    @classmethod
    def __subclasshook__(cls, C):
        return hasattr(C, "distance")

и деструктурировать:

match x:
    case DistanceMetric(distance=d): ...

Динамически создаём комбинаторы:

def Not(cls):
    class _Not(ABC):
        @classmethod
        def __subclasshook__(_, C):
            return not issubclass(C, cls)
    return _Not

n = Not(DistanceMetric)
match x:
    case n(): ...

Синтаксис не позволяет писать Not(DistanceMetric)() прямо в case, но сохранив сгенерированный ABC в переменную, обходим ограничение.

by agluszak • 21 августа 2025 г. в 19:47 • 233 points

Оригинал • HN

#python #python-3.10 #pattern-matching #abstract-base-classes #abc #type-checking

Комментарии (99)

btown показал «трюк» с rrshift, позволяющий делать цепочки вида x >> f >> g без изменения левой части.
Большинство участников критикуют реализацию pattern matching: неочевидное поведение имен-констант, лишняя сложность, отсутствие общих константных паттернов.
Некоторые считают match-case полезным для структурной проверки типов, но просят линтеры/semgrep-правила, чтобы запретить его в кодовой базе.
Обсуждаются и другие «преступления»: предложение {/} для пустого множества, метаклассы, меняющие isinstance, и «goto-подобная» неявность.

The AI Job Title Decoder Ring (dbreunig.com)

Ключевые слова титулов
AI-роли собираются из трёх блоков:

модификатор	домен	роль
Forward Deployed / Applied / —	AI / ML / Gen AI	Researcher / Engineer / Scientist / Architect / PM / Designer

Forward Deployed — работают у клиента, внедряют готовые модели.
Applied — строят продукты на базе моделей, но не обучают их.
AI — общий термин.
ML — классическое обучение моделей для узких задач.
Gen AI — генерация текста, картинок, звука; термин быстро устаревает.

Researcher и Scientist почти синонимы, но «исследователь» всё чаще означает «продуктовый инженер с OKR», а не академика.

Реальные примеры

AI Researcher — исследует архитектуру LLM.
Applied AI Engineer — интегрирует модели в продукт.
Forward Deployed AI Architect — проектирует решения на месте у заказчика.

by dbreunig • 21 августа 2025 г. в 19:22 • 76 points

Оригинал • HN

#llm #machine-learning #gen-ai #pytorch #hugging-face

Комментарии (66)

«AI» стал маркетинговым зонтиком для всего, от LLM до обычного ML, а титулы вроде «AI Engineer» или «Forward Deployed Engineer» часто не отражают реальные задачи.
Участники смеются над инфляцией названий («Exalted Engineer», «Senior Anything-But-C-Level») и предлагают практичные эвристики: MLE = PyTorch, AI Engineer = Hugging Face, Researcher = пишет статьи.
Многие «AI-роли» на деле сводятся к обычной разработке без GPU и fine-tuning’а, а само слово «engineer» уже обесценено.
Популярность профессии взлетела после 2022 г. из-за денег, вызвав приток «хайпожоров» и «лестничных альпинистов», от которых «нормальные» инженеры мечтают избавиться.
Итог: вакансии описывают задачи лучше, чем громкие титулы, а понимание «AI» всё чаще заменяется лозунгом «дайте инвестиции».

DeepSeek-v3.1 (api-docs.deepseek.com) 🔥 Горячее 💬 Длинная дискуссия

DeepSeek-V3.1 — первый шаг к эпохе агентов

Гибридный режим: одна модель, два режима — Think (рассуждения) и Non-Think (быстрый ответ).
Скорость: Think-режим отвечает быстрее, чем DeepSeek-R1-0528.
Агентские навыки: улучшены работа с инструментами и многошаговые задачи.
Попробовать: chat.deepseek.com

API

deepseek-chat → Non-Think, deepseek-reasoner → Think, контекст 128К.
Поддержка формата Anthropic API и строгого Function Calling (бета).

Инструменты и агенты

Рост результатов на SWE / Terminal-Bench.
Эффективнее многошаговые поисковые задачи.

Модель

База V3.1: дообучена на 840 B токенов для длинного контекста.
Обновлён токенайзер и шаблон чата.
Веса открыты: V3.1-Base, V3.1.

Цены

Новые тарифы с 5 сентября 2025, 16:00 UTC. До этого действуют старые.

by wertyk • 21 августа 2025 г. в 19:06 • 732 points

Оригинал • HN

#deepseek #llm #api #gguf #huggingface #fp8 #nvidia #anthropic #glm

Комментарии (253)

Выпущены GGUF-файлы DeepSeek-V3.1 для локального запуска: ≥250 ГБ RAM+VRAM или медленный off-load на SSD.
На бенчмарках модель уступает GPT-5/Claude 4/GLM-4.5, но конкурентоспособна среди открытых весов.
Пользователи жалуются на навязчивое «Of course.» в ответах, повышенные галлюцинации и устаревшие форматы tool-use.
Цена API: $0,56 вход / $1,68 выход за 1 M токенов — дёшево, но без прежней ночной скидки.
Китайские СМИ: V3.1 обучена на FP8 для будущих отечественных AI-чипов, что может ударить по позициям NVIDIA.

AI tooling must be disclosed for contributions (github.com) 🔥 Горячее 💬 Длинная дискуссия

Требование: раскрывать использование ИИ-инструментов при любом вкладе в проект.

Что добавляется: в CONTRIBUTING.md новый раздел «AI-Generated Content Disclosure».
Суть: авторы pull-request’ов и issue обязаны явно указывать, если текст, код, коммиты или дизайн были созданы или существенно изменены при помощи ИИ (ChatGPT, Copilot, Claude и т.д.).
Формат: достаточно короткой пометки в описании PR/issue или в коммит-сообщении, например:
AI-assist: code comments and variable naming via GitHub Copilot.
Цель: сохранить прозрачность, облегчить ревью, защитить проект от лицензионных и качественных рисков.
Без наказаний: нарушение не влечёт блокировку, но ревьюеры могут запросить уточнение.

by freetonik • 21 августа 2025 г. в 18:49 • 665 points

Оригинал • HN

#github #open-source #contributing-guidelines #llm #github-copilot #claude #dco #code-review

Комментарии (407)

Проблема: LLM не может подписать DCO, а человек не может гарантировать происхождение кода, если он был сгенерирован ИИ.
Правовые риски: код может быть заимствован из неизвестных источников, что создаёт угрозу нарушения авторских прав.
Сообщество: многие мейнтейнеры требуют явного раскрытия использования ИИ, чтобы сохранить качество ревью и обучение новичков.
Практика: проекты вроде Ghostty и Caddy уже маркируют AI-PR метками или текстовыми пометками.
Противники считают, что важен результат, а не процесс, и предлагают полагаться на ревью кода, а не на дисклеймеры.

From GPT-4 to GPT-5: Measuring progress through MedHELM [pdf] (fertrevino.com)

The Onion brought back its print edition and the gamble is paying off (wsj.com)

Scientists No Longer Find X Professionally Useful, and Have Switched to Bluesky (academic.oup.com)

CEO pay and stock buybacks have soared at the 100 largest low-wage corporations (ips-dc.org)

Главные выводы

Рекомендации

Rolling the dice with CSS random() (webkit.org)

Code formatting comes to uv experimentally (pydevtools.com) 🔥 Горячее 💬 Длинная дискуссия

Как начать

Передача аргументов Ruff

Crimes with Python's Pattern Matching (2022) (hillelwayne.com)

The AI Job Title Decoder Ring (dbreunig.com)

DeepSeek-v3.1 (api-docs.deepseek.com) 🔥 Горячее 💬 Длинная дискуссия

API

Инструменты и агенты

Модель

Цены

AI tooling must be disclosed for contributions (github.com) 🔥 Горячее 💬 Длинная дискуссия