Hacker News Digest — Страница 422/464

Is the A.I. Boom Turning Into an A.I. Bubble? (newyorker.com)

Бум ИИ или уже пузырь?
Цены акций гигантов растут, IPO снова шокируют оценками — звучит как dot-com 2000 года.

Nvidia стала самой дорогой компанией мира ($4,4 трлн) после встречи Хуана с Трампом и освобождения от новых пошлин на чипы.
Goldman Sachs в марте утверждал: это не пузырь, рост подкреплён прибылями «Великолепной семёрки». С 2022 г. выручка Nvidia выросла в 5 раз, прибыль — в 10.
Однако Palantir оценён в 600× годовой прибыли и 130× продаж — даже в 1999-м такие цифры вызывали тревогу.
В июле Figma вышла на IPO, и её цена выглядит так же фантастически, как у Pets.com в 2000-м.

Вывод: пока прибыли растут, но FOMO и множитель «больший дурак» уже слышны всё громче.

by FinnLobsien • 12 августа 2025 г. в 17:25 • 77 points

Оригинал • HN

Комментарии (62)

Участники спорят, «пузырь ли ИИ»; одни уверены, что да, другие считают, что технология реальна, но переоценена.
Повторяется мысль: рынок может оставаться иррациональным дольше, чем вы останетесь платёжеспособны.
Напоминают, что пандемия, война и высокие ставки действительно обрушивали рынки, но быстро отыгрывались.
Основной риск видят не в крахе курсов, а в неэффективном распределении капитала и усилении неравенства.
Совет прост: диверсифицируйтесь, не пытайтесь угадать момент и будьте готовы к любому сценарию.

Claude vs. Gemini: Testing on 1M Tokens of Context (every.to)

Claude Sonnet 4 теперь держит 1 млн токенов (~все книги о Гарри Поттере) за один запрос.
Получили ранний доступ и проверили:

Текст: спрятали две сцены из фильмов в 900 тыс. слов Шерлока Холмса.
- Все модели нашли, но Claude был в 2 раза быстрее (42 с vs 69–78 с у Gemini).
- Меньше галлюцинаций, но анализ менее подробный.
Код: загрузили весь код CMS Every + «подушку» до 1 млн токенов.
- Claude справился, но ответы короче и менее полные, чем у Gemini.
AI Diplomacy: играли в «Дипломатию» — мировое господство пока не одержал.

Вывод: быстрый и стабильный длинный контекст, но менее детальный, чем конкуренты.

by dshipper • 12 августа 2025 г. в 16:59 • 114 points

Оригинал • HN

Комментарии (29)

Пользователи обсуждают, что Google AI Studio предоставляет бесплатный доступ к Gemini 2.5 Pro/Flash с контекстом 1M токенов, но фри-тариф быстро исчерпывается.
Сравнивают скорость Sonnet 4 и Gemini 2.5 Flash: при одинаковых TPUs Sonnet оказался быстрее на длинных контекстах.
Отмечают, что Gemini путается в длинной истории чата и «смешивает» факты, чего не наблюдают у OpenAI/Anthropic.
Предлагают проводить соревнования LLM по сжатию данных: сделать краткие заметки и отвечать по ним на вопросы.
Уточняют, что весь цикл «Гарри Поттера» (~1 млн слов ≈ 1,4 млн токенов) не помещается в 1M контекст.

WHY2025: How to become your own ISP [video] (media.ccc.de)

Как стать собственным интернет-провайдером
Nick Bouwhuis, 34 мин

Доклад о том, как устроен интернет «изнутри» и как самому стать его полноценным участником. Разберём BGP, AS-номера, IP-префиксы и практические шаги для старта. Узнаете, как обрести сетевой суверенитет и что значит запускать собственный ISP. Краткий тур по личной сети докладчика: как она построена и для чего используется.

Видео

1080p AV1 213 МБ
576p MP4 93 МБ
1080p MP4 350 МБ
576p WebM 79 МБ
1080p WebM 253 МБ

Аудио

MP3 31 МБ
Opus 18 МБ

Лицензия: CC BY 4.0

by exiguus • 12 августа 2025 г. в 16:53 • 187 points

Оригинал • HN

Комментарии (29)

Участники жалуются на высокие сборы RIPE (≈2000 €/год) и считают их барьером для мелких игроков, хотя кто-то видит в этом фильтр «экономически неразумных» проектов.
@abound получил ASN и стоит в очереди на IPv4, планируя стать сельским ISP; ему советуют сразу разговаривать с транзит-провайдерами, смотреть аукционы IPv4 и общаться на RIPE-встречах.
Нидерланды названы «лёгкой» страной для пиринга, тогда как Швейцария воспринимается сложнее; однако упоминают Init7, SwiNOG и community-IX как полезные точки входа.
@max_ критикует европейскую систему как «феодальную», ограничивающую рост мелких.

Show HN: Omnara – Run Claude Code from anywhere (github.com) 🔥 Горячее

Omnara (YC S25) — универсальный клиент для AI-агентов.
Где бы вы ни находились, общайтесь с моделями через единый интерфейс: мессенджеры, браузер, десктоп, мобильные устройства.

Ключевые возможности

Подключение из любого места — Slack, Telegram, WhatsApp, веб-чат, расширения браузера, macOS/Windows/Linux, iOS/Android.
Один аккаунт — все агенты — подключайте OpenAI, Anthropic, Google, Mistral и другие модели без переключения между сервисами.
Быстрый доступ — горячие клавиши, виджеты, команды голосового помощника.
Безопасность — end-to-end шифрование, SSO, аудит логов.

Установка

# macOS
brew install omnara-ai/tap/omnara

# Windows
winget install Omnara.Omnara

# Linux
curl -fsSL https://get.omnara.ai | sh

Быстрый старт

Зарегистрируйтесь: omnara login
Добавьте API-ключи моделей в ~/.omnara/config.yaml
Напишите первое сообщение: omnara chat "Привет, помоги с кодом"

Поддержка

by kmansm27 • 12 августа 2025 г. в 16:33 • 289 points

Оригинал • HN

Комментарии (146)

Пользователи в восторге от идеи «Claude Code на ходу»: можно запустить агента на ноутбуке и продолжать управлять им с телефона, пока идёшь или едешь.
Главные сомнения — качество кода при больших несупервизированных изменениях и отсутствие удобного способа быстро ревьюить результат на маленьком экране.
Практически каждый второй комментарий требует самостоятельного хостинга или локального tunneled-решения (Tailscale, ngrok, VNC) из-за опасений за приватность кода и отсутствия «moat» у продукта.
Половина аудитории ждёт Android-версию, нормальную авторизацию и возможность подключать другие CLI-агенты (Codex, Gemini, OpenCode).
Несколько человек уже опубликовали свои DIY-решения (PWA, Termux, SSH+tmux/screen), подтверждая, что технически задача решается простыми средствами.

Show HN: Building a web search engine from scratch with 3B neural embeddings (blog.wilsonl.in) 🔥 Горячее

Цель: за 2 месяца с нуля собрать поисковик, который выдаёт только качественный контент, используя 3 млрд нейро-эмбеддингов.
Мотив: классические поисковики скатываются в SEO-спам, а трансформерные эмбеддинги уже «понимают» язык.

Что вышло

200 GPU → 3 млрд SBERT-векторов.
Пик: 50 тыс. страниц/сек, 280 млн страниц в индексе.
Latency запроса ≈ 500 мс.
RocksDB + HNSW на 200 ядрах, 4 ТБ ОЗУ, 82 ТБ SSD.

Архитектура (сверху вниз)

Crawler – горизонтально масштабируемый, 50 к/с.
Нормализация – чистка HTML, удаление шаблонов.
Чанкинг – разбиение на семантические блоки + «цепочка утверждений» для контекста.
Pipeline – CPU-часть (чистка, чанки) → GPU-часть (эмбеддинги).
Storage – RocksDB для метаданных, HNSW для векторов, шардировано 200-way.
Service mesh – gRPC, балансировка, отказоустойчивость.
SERP – ранжирование, сниппеты, AI-ассистент, трекинг сессий.
Knowledge graph – сущности и связи между ними, довесок к векторам.

Ключевые фокусы

Latency: кэш L2, предвычисленные top-k, батчинг GPU.
Качество поиска: эмбеддинги ловят интент, а не ключевики; минимум SEO-спама.
Демо: живой инстанс доступен (ссылка в оригинале).

Цена

≈ 12 000 $ за два месяца (GPU, SSD, трафик).

Дальше

Больше языков, real-time индекс, персонализация, API для разработчиков.

by wilsonzlin • 12 августа 2025 г. в 16:02 • 577 points

Оригинал • HN

Комментарии (97)

Автор показал, что за $100 можно эмбеддить миллиард страниц через дешёвый OpenAI-batch, а полный поисковый движок обойдётся всего в ~50 000 $/год.
Участники восторгаются глубиной статьи и качеством прототипа, но спорят: векторный поиск плохо справляется с точными ключами, а SEO-спам всё ещё возможен.
Предлагают использовать гибрид BM-25 + embeddings, открытые датасеты OpenWebSearch.eu/Common Crawl и «человеческие» клики для ранжирования.
Обсуждают коммерческую модель (Kagi-like за 5 $/мес) и дают советы по масштабированию (IVF, SPLADE, RocksDB+Faiss).

Claude Sonnet 4 now supports 1M tokens of context (anthropic.com) 🔥 Горячее 💬 Длинная дискуссия

Claude Sonnet 4 расширен до 1 млн токенов контекста — в 5 раз больше, чем раньше.
Доступ: публичная бета в Anthropic API и Amazon Bedrock; скоро в Vertex AI.
Применение: анализ целых кодовых баз, синтез сотен документов, агенты с длинной памятью.

Цены (свыше 200 K токенов):

Тип	≤200 K	>200 K
Вход	$3/Мток	$6/Мток
Выход	$15/Мток	$22.5/Мток

Экономия: кэширование промптов и пакетная обработка снижают расходы.

Клиенты:

Bolt.new использует 1 M токенов для генерации кода в больших проектах.
iGent AI запускает агента Maestro, который днями работает с реальными кодовыми базами.

Старт: доступен для Tier 4 и кастомных лимитов; документация и цены по ссылкам.

by adocomplete • 12 августа 2025 г. в 16:02 • 1257 points

Оригинал • HN

Комментарии (667)

Пользователи сомневаются в практической пользе 1M токенов: качество ответов быстро падает, контекст «засоряется», а цена растёт квадратично.
Большинство считают текущие окна в 100–200K уже избыточными без точной RAG-поддержки и быстрой очистки старого контекста.
Ключевые запросы: лучше скорость и надёжность, чем «рекламные» миллионы токенов; нужен контроль расходов и явное предупреждение о дорогих запросах.

Perplexity Makes Longshot $34.5B Offer for Chrome (wsj.com)

—

by eduction • 12 августа 2025 г. в 15:33 • 112 points

Оригинал • HN

#google #chrome #chromium #perplexity

Комментарии (67)

DOJ требует у судьи Мехты принудительно отделить Chrome от Google после признания монополии в поиске; предложение Perplexity рассматривается как юридический ход.
Предложение Perplexity в $34,5 млрд (в 2× превышающее её капитализацию) участники называют пиар-акцией: денег нет, цена занижена, а сделка обречена на провал.
Многие считают, что проще форкнуть Chromium бесплатно, чем платить за бренд и установленную базу в 3,45 млрд пользователей.
Пользователи критикуют саму Perplexity: «фанфары вместо продукта», «плохие результаты», «обман маркетинга» и опасения, что ИИ-компания будет ещё агрессивнее использовать данные, чем Google.

Evaluating LLMs playing text adventures (entropicthoughts.com)

Оценка LLM в текстовых квестах

Сначала мы просто мерили, сколько ходов нужно, чтобы дойти до далёкой цели. Теперь придумали лучше: ставим лимит в 40 ходов и считаем выполненные достижения. Их описываем парой «ключ → фрагмент текста игры». Например, для 9:05:

EXIT_BED → You get out of bed
OPEN_DRESSER → revealing some clean
…и так далее. Модель о достижениях не знает; мы просто подсчитываем совпадения. Очки сравниваем между собой, а не считаем абсолютной оценкой.

Результаты (4 игры, 40 ходов)

Модель	9:05	Lockout	Dreamhold	Lost Pig
Grok 4	86 %	15 %	46 %	33 %
Claude 4 Sonnet	80 %	30 %	53 %	46 %
Gemini 2.5 Flash	80 %	30 %	33 %	46 %
Gemini 2.5 Pro	80 %	30 %	40 %	40 %
DeepSeek R1	80 %	23 %	33 %	33 %
Claude 4 Opus	73 %	30 %	60 %	46 %
gpt-5 Chat	73 %	15 %	53 %	33 %
DeepSeek V3	66 %	23 %	20 %	33 %
gpt-4o	53 %	23 %	40 %	40 %
Qwen3 Coder	53 %	23 %	40 %	33 %
Kimi K2	53 %	30 %	46 %	40 %
glm 4.5	53 %	23 %	33 %	53 %
Claude 3.5 Haiku	38 %	15 %	26 %	26 %
Llama 3 Maverick	33 %	30 %	40 %	33 %
gpt-o3-mini	20 %	15 %	26 %	26 %
Mistral Small 3	20 %	15 %	0 %	20 %
gpt-4o-mini	13 %	23 %	20 %	40 %

Повторные прогоны не делали — дорого.

by todsacerdoti • 12 августа 2025 г. в 15:19 • 96 points

Оригинал • HN

#large-language-models #text-adventure #grok #claude #gemini #llm

Комментарии (63)

Исследование показало, что современные LLM-провайдеры плохо справляются даже с классическими текстовыми квестами, несмотря на доступные онлайн-гайды.
Участники подчеркивают: ChatGPT-5 — это не одна модель, а роутер, случайно выбирающий модель, что снижает надёжность результатов.
Критика методики: неясно, просили ли LLM именно проходить игру, а не просто исследовать, и нет сравнения с людьми.
Большинство считает, что LLM не обладают «моделью мира» и не понимают строгих правил, поэтому не могут системно решать головоломки.
Некоторые предлагают улучшить подход: давать модели прямой доступ к интерпретатору игры или использовать более точные промпты.

Recto – A Truly 2D Language (masatohagiwara.net)

Recto — язык, где код — это вложенные прямоугольники. Он не читается сверху вниз, а воспринимается пространственно: структура и рекурсия задаются формой, а не текстом.

Идея

Большинство языков — линейны: слова идут одно за другим. Recto отказывается от этой традиции и возвращается к древним «картам мыслей» — пиктограммам, звёздным картам, схемам. Главное требование к языку:

Понятен человеку и машине.
Может быть создан человеком и машиной.

Линейность не обязательна: можно представить «приложение», где жест или выражение лица превращается в сетку эмодзи, и всё работает.

Примеры

Hello Recto — прямоугольник, внутри которого текст Hello Recto.
Арифметика — прямоугольники-числа и операторы встраиваются друг в друга, образуя выражения.
Факториал — рекурсивный прямоугольник ссылается на себя.

Почему это важно

Recto показывает, как можно писать, парсить и мыслить кодом без строк и файлов. Он открывает путь к языкам, где значение рождается из формы, а не последовательности символов.

Попробовать: Recto Pad | Google Colab | GitHub

by mhagiwara • 12 августа 2025 г. в 15:06 • 131 points

Оригинал • HN

#recto #programming-languages #path #befunge #hexagony #orca #racket #unreal-blueprints #emit

Комментарии (58)

Участники обсуждают Recto как «2D-язык», но многие считают его всё же 1D с «скобками и лишними шагами».
Поднимаются примеры других 2D/3D-языков: PATH, Befunge, Hexagony, Orca, Unreal Blueprints, Racket 2d.
Спор о том, считать ли нотный стан или речь по-настоящему многомерными; автор статьи настаивает на их 1D-основе.
Предлагаются улучшения: полноценная графическая среда, Unicode-рамки, поддержка VR/AR, именованные параметры.
Упомянуты эксперименты с «временем» как измерением (EmiT, ICFPC 2024).
Автору пожелали сил в борьбе с раком и скинули ссылки на GoFundMe и CaringBridge.

Why are there so many rationalist cults? (asteriskmag.com) 🔥 Горячее 💬 Длинная дискуссия

Почему у рационалистов так много культов?
Ози Бреннан

Рационалисты собрались вокруг «Последовательностей» Элиезера Юдковского — цикла постов о том, как мыслить рационально. Казалось бы, сообщество должно быть образцом скепсиса, но оно породило около полдюжины странных групп, включая две, «общавшиеся с демонами». Самые известные — «зизианцы» (анархо-трансгуманисты-веганы), причастные к шести смертям, и «Чёрный лотос» Брента Дилла, где ролевые игры превратились в метафизику. Ещё Leverage Research, из исследовательской организации — в токсичный культ с элементами оккультизма.

Я поговорила с десятью участниками этих групп и ранними рационалистами. Сама я из сообщества, поэтому получила редкий уровень откровенности.

Почему это происходит?

Маркетинг. «Последовательности» обещают: «Научитесь думать лучше — решите все проблемы, станьте элитой, спасите человечество». Это неправда, но люди хотят верить. Они ищут гуру, который перепрограммирует их мозг и даст роль в грандиозном плане. Вместо этого находят обычных людей, статистику и барбекю.

Контроль сверху. В «Чёрном лотосе» Брент Дилл использовал игру Mage: the Ascension как фреймворк власти. Без него группа давала «пиковые переживания», но с ним — травму.

Токсика снизу. В Leverage Research деструктивные практики рождались не от лидера, а от самих участников.

by glenstein • 12 августа 2025 г. в 14:56 • 461 points

Оригинал • HN

#cults #skepticism #transhumanism #llm #occultism #veganism

Комментарии (698)

Участники обсуждают, как сообщество «рационалистов» Элиезера Юдковского выросло из блогов в полноценные субкультуры, включая группы с оккультными и даже насильственными практиками.
Многие отмечают, что стремление «мыслить рационально» без проверки базовых аксиом и без внешних корректировок легко приводит к культам и дисфункции.
Часть комментаторов защищает сообщество, описывая его участников как доброжелательных и искренних, но признаёт, что идеи о грядущем конце света через ИИ могут парализовать обычную жизнь.
Наблюдается сравнение с другими историческими движениями — от хиппи-коммун 60-х до религиозных сект, подчёркивающее повторяющийся паттерн изоляции и «чистоты» идей.
Наконец, звучит предупреждение: чрезмерная уверенность в собственной рациональности и отказ от интуиции и культурных норм открывает дверь к манипуляциям и культовой динамике.