Hacker News Digest

Обновлено: 21 августа 2025 г. в 19:22

Постов: 755 • Страница 48/76

Ask HN: How can ChatGPT serve 700M users when I can't run one GPT-4 locally? 🔥 Горячее 💬 Длинная дискуссия

by superasn • 08 августа 2025 г. в 19:27 • 476 points

ОригиналHN

#llm#gpt-4#openai#gpu#cloud-computing#machine-learning#neural-networks

Комментарии (306)

  • У OpenAI десятки миллиардов долларов на кластеры GPU (по $20–40 тыс. за карту) и инфраструктуру, чего нет у обычного пользователя.
  • Ключевая «фишка» — массовое батчирование запросов: одновременная обработка тысяч пользователей позволяет загружать видеопамять и вычислительные блоки почти на 100 %, тогда как дома GPU простаивает.
  • Используются Mixture-of-Experts, спекулятивное декодирование, конвейерная разбивка модели по GPU и прочие оптимизации, снижающие затраты на одного пользователя.
  • Большинство пользователей активны лишь доли процента времени, поэтому общая нагрузка оказывается меньше, чем кажется по 700 млн «weekly users».
  • Всё это — классический эффект экономии масштаба: высокие фиксированные затраты и почти нулевые переменные на одного юзера делают запуск GPT-4 локально невыгодным.

Build durable workflows with Postgres (dbos.dev)

  • Выбор хранилища метаданных рабочих процессов оказался ключевым. Нужно было простое: чекпойнт состояния и восстановление после сбоя. Postgres выбрали за технические возможности, а не только за популярность и 40-летнюю проверку временем.

  • Масштабируемые очереди
    Классическая таблица-очередь страдает от конкуренции: все воркеры пытаются взять одни и те же задачи. Postgres решает это через FOR UPDATE SKIP LOCKED: строки блокируются и пропускаются, если уже захвачены. Воркеры без конфликтов берут следующие N записей, позволяя обрабатывать десятки тысяч задач в секунду.

  • Наблюдаемость
    Каждый шаг сохраняется, поэтому можно строить дашборды и фильтры. SQL позволяет писать сложные запросы напрямую; индексы по created_at, executor_id, status ускоряют выборки из миллионов записей без лишних затрат.

  • Exactly-once для шагов с БД
    Обычно гарантируется «по крайней мере один раз», но если шаг меняет данные в той же транзакции, что и чекпойнт, Postgres обеспечит, что изменения зафиксируются ровно один раз даже после перезапуска.

by KraftyOne • 08 августа 2025 г. в 19:24 • 138 points

ОригиналHN

#postgresql#dbos#graphile-worker#temporal#python#typescript#java#c##go#dag

Комментарии (49)

  • Пользователи хвалят DBOS за простоту миграции с graphile-worker и отсутствие необходимости менять инфраструктуру.
  • Сравнения с Temporal, Azure Durable Functions, Inngest, Restate и Cloudflare: DBOS выглядит проще и легче, но Temporal/Cloudflare критикуют за сложность самостоятельного хостинга и высокую цену.
  • Некоторые жалуются, что «сервер» DBOS (Conductor) не open-source, что ограничивает самостоятельное развёртывание.
  • Планы по добавлению Java, C#, Go и поддержке сообщества уже анонсированы; Python и TypeScript уже поддерживаются.
  • Отмечена возможность комбинировать DBOS с Dagster/Oban/pgflow для более сложной оркестрации.

Efrit: A native elisp coding agent running in Emacs (github.com)

efrit — агент для написания кода на чистом Elisp, работающий прямо в Emacs.
Он читает/пишет буферы, запускает команды, ищет документацию, тестирует и рефакторит код, используя только встроенные средства Emacs и внешние процессы.

Возможности

  • Понимает структуру проекта (файлы, зависимости, тесты).
  • Пишет новые функции, классы, тесты, документацию.
  • Исправляет баги и предлагает улучшения.
  • Работает в фоне и может действовать по хукам (сохранение, коммит).

Установка

(use-package efrit
  :straight (:host github :repo "steveyegge/efrit"))

Запуск: M-x efrit-mode в нужном буфере или (efrit-global-mode 1) для всей сессии.

Команды

  • efrit-suggest-improvements — предложения по коду.
  • efrit-write-tests — сгенерировать тесты.
  • efrit-explain-region — объяснить выделенный фрагмент.

Конфигурация

(setq efrit-model "gpt-4o-mini"
      efrit-max-tokens 4000
      efrit-auto-save t)

Статус
Альфа-версия; API может меняться. Пул-реквесты и issue приветствуются.

by simonpure • 08 августа 2025 г. в 19:20 • 140 points

ОригиналHN

#elisp#emacs#steveyegge#github#llm#code-generation#code-refactoring

Комментарии (29)

  • Пользователи обсуждают новый Emacs-пакет Efrit (от Steve Yegge) для AI-ассистента внутри редактора.
  • Уточняют, что «efrit» — это игра слов: «e» (emacs) + «ifrit» (разновидность джинна).
  • Сравнивают с gptel: Efrit пока заточен под Anthropic, в то время как gptel поддерживает множество бэкендов.
  • Кто-то уже запустил Efrit c Gemini через прокси, другие жалуются на ошибки и отсутствие документации.
  • Параллельно идёт спор о «современном» способе конфигурировать Emacs: bedrock, doom, ручной минимализм vs «сделать из Emacs VS Code».

Jim Lovell, Apollo 13 commander, has died (nasa.gov) 🔥 Горячее

Временный глава NASA Джанет Петро назвала Джима Ловелла «символом бесстрашия и изобретательности», чьи полёты на «Джемини 7», «Джемини 12» и «Аполлоне-8» задали курс лунной программе.

Она подчеркнула, что «Аполлон-13» превратил потенциальную катастрофу в «триумф человеческого духа» благодаря хладнокровию Ловелла и команды.

Петро отметила, что наследие астронавта продолжает вдохновлять новые поколения исследователей, а его жизнь — «напоминание о силе смелости, смекалки и командной работы».

by LorenDB • 08 августа 2025 г. в 19:12 • 556 points

ОригиналHN

#nasa#apollo-13

Комментарии (110)

  • Умер Джим Ловелл — единственный человек, дважды летавший к Луне, но не ступивший на неё (Apollo 8 и 13).
  • Участники вспоминают встречи с ним, его шутки («вы ждали Тома Хэнкса?») и выступления в университетах.
  • Отмечают, что в фильме «Apollo 13» сам Ловелл сыграл капитана корабля, встречающего экипаж.
  • Подчёркивают спокойствие и мастерство экипажа Apollo 13, а также то, что Ловелл прожил долгую жизнь, умерев 7 августа.
  • Выражают соболезнования и желание вернуться на Луну «пока не ушли все герои».

How to teach your kids to play poker: Start with one card (bloomberg.com) 💬 Длинная дискуссия

  • Начните с одной карты: каждый игрок получает рубашкой вверх карту и делает ставку, зная лишь свою.
  • Цель — понять, что покер — это ставки на неполную информацию.
  • Добавляйте по одному элементу: две карты, общие карты, комбинации, блайнды, позиции.
  • Используйте фишки-конфеты и короткие сессии (10 минут).
  • Подчеркивайте математику: шансы, outs, ожидание.
  • Обсуждайте банкролл-менеджмент: «не ставь больше, чем готов потерять».
  • Играйте открыто: показывайте карты, объясняйте решения.
  • Переходите к Техасскому холдему только после освоения базы.

by ioblomov • 08 августа 2025 г. в 19:11 • 111 points

ОригиналHN

#poker#texas-holdem#probability#decision-making

Комментарии (170)

  • Участники спорят: полезен ли покер как способ обучения детей принятию решений при неполной информации и расчёту вероятностей.
  • Одни считают, что игра развивает критическое мышление и умение «читать» людей; другие боятся, что это введёт ребёнка в мир азартных игр.
  • Многие подчёркивают: покер можно играть без денег, используя фишки или спички, тогда он становится обычной семейной игрой.
  • Предложены альтернативы: Skull, Monopoly Deal, шахматы, го, блэкджек — всё, что учит стратегии без ставок.
  • Общий вывод: покер сам по себе не «дегенеративен», но важно подавать его детям в безопасной форме и с правильной мотивацией.

I want everything local – Building my offline AI workspace (instavm.io) 🔥 Горячее 💬 Длинная дискуссия

  • Локальный стек: Ollama (LLM), assistant-ui (веб-интерфейс), Apple container (изолированные ВМ), Playwright (браузер), coderunner (MCP-сервер с Jupyter).
  • Цель: чат, запуск кода и доступ в интернет без облаков и утечек данных.
  • Проблемы:
    – Модели Ollama пока не поддерживают вызовы инструментов.
    – Создание нативного Mac-приложения провалилось: a0.dev заточен под iOS, Electron + NextJS оказались геморроем.
    – Apple container часто падает с Trap; помогает pkill + перезапуск.
  • Решения:
    – Веб-версия assistant-ui через ai-sdk с выпадающим списком моделей (локальных и облачных).
    – Jupyter в изолированной ВМ, доступен по MCP: http://coderunner.local:8222/mcp.
    – Конфиг для Claude Desktop: "coderunner": { "httpUrl": "http://coderunner.local:8222/mcp" }.

by mkagenius • 08 августа 2025 г. в 18:19 • 1026 points

ОригиналHN

#ollama#assistant-ui#apple-container#playwright#coderunner#jupyter#mcp#docker#rag#vector-databases

Комментарии (274)

  • Участники восхищаются локальной, «песочной» архитектурой для приватного AI-воркспейса и инструментом coderunner, но отмечают, что узкие места — это не только софт, но и «железо»: 80B-модели требуют ≥80 ГБ быстрой RAM, что доступно разве что на RTX 4090 или Strix Halo.
  • Критичным становится слой знаний: RAG над личными файлами требует вектор-БД, а значит — много диска и оперативки; Docker-обёртка или docker compose up -d просится как минимальный способ разворачивания.
  • Пока локальные модели — скорее «увлекательное хобби» (медленно, глючно, нужен тюнинг), чем рабочий инструмент; облачные API (Cerebras, Groq) дают 1000 ток/с, но подрывают приватность.
  • Сообщество просит готовый «всё-в-одном» стек: веб-поиск, голосовой режим, image-gen, лёгкий switch «локально ↔ облако» без потери данных.
  • Несколько участников делятся своими решениями: Kasm + Ollama, Open WebUI, MLX-электрон-приложение, Synology-NAS-контейнеры, браузерный LLM без установки.

The surprise deprecation of GPT-4o for ChatGPT consumers (simonwillison.net) 🔥 Горячее 💬 Длинная дискуссия

  • OpenAI одновременно с выпуском GPT-5 немедленно отключила в потребительских приложениях все старые модели: GPT-4o, 4.1, 4.5, o3, o4-mini и др.
  • Переписки автоматически переводятся на GPT-5 или GPT-5-Thinking; выбрать старую модель нельзя.
  • Цель — убрать «пикер моделей», но продвинутые пользователи жалуются на непредсказуемость ответов.
  • Многие горько жалуются на Reddit: GPT-4o лучше подходил для творчества, ролевых игр, эмоционального общения; GPT-5 звучит «слишком профессионально».
  • OpenAI признаёт, что 4o мог вдохновлять эмоциональную зависимость и обещает «не давать прямых советов» в личных вопросах.
  • GPT-4o остаётся в API; возможен отток пользователей к сторонним клиентам, использующим этот API.

by tosh • 08 августа 2025 г. в 18:04 • 385 points

ОригиналHN

#gpt-4o#gpt-5#openai#api#llm

Комментарии (378)

  • OpenAI сначала убрала выбор моделей, но после взрыва негодования вернула 4o и o3, признав «ошибку».
  • Пользователи жалуются на резкие лимиты GPT-5, его медленность и регресс в некоторых задачах; многие считают апгрейд скромным.
  • Обсуждают «психологическую зависимость» от старых моделей и даже целый сабреддит «MyBoyfriendIsAI».
  • Разработчики подчеркивают: отсутствие контроля над закрытыми API превращает любой продукт в «строительство на песке».

A message from Intel CEO Lip-Bu Tan to all company employees (newsroom.intel.com) 💬 Длинная дискуссия

Послание сотрудникам от CEO Intel Лип-Бу Тана, 7 августа 2025 г.

  • О себе. США — мой дом 40+ лет; возглавлять Intel считаю привилегией.
  • Суть. Сегодня много новостей; хочу говорить прямо и честно.
  • Приоритеты.
    1. Безопасность и доверие — защита данных клиентов и сотрудников.
    2. Инновации — лидерство в ИИ, полупроводниках, технологиях будущего.
    3. Культура — открытость, разнообразие, поддержка друг друга.
  • Обещание. Быть на связи, принимать быстрые решения, сохранять прозрачность.
  • Призыв. Вместе превратим вызовы в возможности и продолжим «вдохновлять мир технологиями».

by rntn • 08 августа 2025 г. в 17:48 • 144 points

ОригиналHN

#intel#ceo#artificial-intelligence#semiconductors#cloud-platforms#graphics-processing-units

Комментарии (199)

  • Трамп публично обвинил нового CEO Intel Лип-Бу Тана в «конфликтах интересов» из-за его связей с китайскими компаниями.
  • Участники обсуждают, как совет директоров мог утвердить Тана, несмотря на судебные проблемы в прошлом.
  • Многие считают, что Intel упустила кучу возможностей (например, не выпустила ARC-карты с 32–64 ГБ памяти).
  • Поднимается вопрос: не идёт ли Intel к де-факто национализации, учитывая миллиардные субсидии и вмешательство властей.
  • Сторонники Тана отмечают, что он 40+ лет живёт в США, а обвинения пока без конкретных доказательств.

Someone keeps stealing, flying, fixing and returning this man's 1958 Cessna (latimes.com)

  • Владелец Cessna 172 из графства Сонома трижды за год обнаруживал пропажу и возврат самолёта: топливо израсходовано, масло долито, мелкие поломки устранены.
  • Вор проникает через незапертую дверь ангара, летает ночью и ставит машину обратно до рассвета. На борту оставляют бутылку воды и записку «Спасибо».
  • Полиция зафиксировала следы шасси на взлётке, но камеры не сняли нарушителя. Версии: бывший пилот, который «просто скучает по небу», или местный механик, оттачивающий навыки.
  • Владелец не подаёт в суд, но установил GPS-трекер и просит злоумышленника «просто позвонить, чтобы договориться о легальном полёте».

by MBCook • 08 августа 2025 г. в 17:45 • 104 points

ОригиналHN

Комментарии (116)

  • Неизвестная женщина не «возвращает» самолёт, а просто ставит его в другое место, где владелец находит его позже; «ремонт» — это замена украденного аккумулятора и наушников.
  • Пилот легко улетает без плана полёта: для VFR в США он не требуется, а на неконтролируемых аэродромах почти нет охраны.
  • Версии сообщества: кто-то без денег и с проблемами психики, наркоторговцы, «DCS-нёрд» или просто человек, перепутавший самолёты.
  • Владелец 75 лет, не продаёт редкий Cessna-172, хотя сам им не летает; участники считают, что машина должна быть в небе, а не пылиться.
  • Найдены окурки с ДНК, но полиция пока бездействует; аэродром не усиливает меры безопасности.

All known 49-year-old Apple-1 computers (apple1registry.com)

Apple-1 Registry: кратко

  • 92 почти подтверждённых Apple-1
    • 70 полностью проверены
    • 22 «почти» проверены
  • 9 могут дублироваться, 3 возможно утрачены
  • 47 из 1-й партии, 42 из 2-й, 2 неизвестны, 1 собран вручную
  • 67 работают, 19 состояние неясно
  • 19 в музеях, 9 в оригинальных Byte Shop-корпусах
  • 1088 фото всего

Фильтры: партия, серийный №, фото, история, экспозиция.
Список загружается; если не видно — простой список.

Дополнительно: ПО, документация, периферия, истории, аукционы.
Сайт без рекламы и трекинга, поддерживается пожертвованиями и ссылками.

by elvis70 • 08 августа 2025 г. в 17:32 • 124 points

ОригиналHN

#apple#apple-1#computers#hardware

Комментарии (25)

  • На аукционе выставлен Apple I, ставка уже $109 919, но цена вырастет.
  • В реестре 92 «проверенных и почти проверенных» Apple I, 67 из них рабочие.
  • Одним из владельцев считается бывший топ-менеджер Apple Жан-Луи Гассе.
  • На прошлых торгах платины уходили от $200 000 до $945 000.
  • В 2015 году женщина случайно сдала Apple I в пункт утилизации; компьютер продали за $200 000, но вернуть ей деньги так и не смогли.