Is the A.I. Boom Turning Into an A.I. Bubble?
Бум ИИ или уже пузырь?
Цены акций гигантов растут, IPO снова шокируют оценками — звучит как dot-com 2000 года.
- Nvidia стала самой дорогой компанией мира ($4,4 трлн) после встречи Хуана с Трампом и освобождения от новых пошлин на чипы.
- Goldman Sachs в марте утверждал: это не пузырь, рост подкреплён прибылями «Великолепной семёрки». С 2022 г. выручка Nvidia выросла в 5 раз, прибыль — в 10.
- Однако Palantir оценён в 600× годовой прибыли и 130× продаж — даже в 1999-м такие цифры вызывали тревогу.
- В июле Figma вышла на IPO, и её цена выглядит так же фантастически, как у Pets.com в 2000-м.
Вывод: пока прибыли растут, но FOMO и множитель «больший дурак» уже слышны всё громче.
Комментарии (62)
- Участники спорят, «пузырь ли ИИ»; одни уверены, что да, другие считают, что технология реальна, но переоценена.
- Повторяется мысль: рынок может оставаться иррациональным дольше, чем вы останетесь платёжеспособны.
- Напоминают, что пандемия, война и высокие ставки действительно обрушивали рынки, но быстро отыгрывались.
- Основной риск видят не в крахе курсов, а в неэффективном распределении капитала и усилении неравенства.
- Совет прост: диверсифицируйтесь, не пытайтесь угадать момент и будьте готовы к любому сценарию.
Claude vs. Gemini: Testing on 1M Tokens of Context
Claude Sonnet 4 теперь держит 1 млн токенов (~все книги о Гарри Поттере) за один запрос.
Получили ранний доступ и проверили:
-
Текст: спрятали две сцены из фильмов в 900 тыс. слов Шерлока Холмса.
- Все модели нашли, но Claude был в 2 раза быстрее (42 с vs 69–78 с у Gemini).
- Меньше галлюцинаций, но анализ менее подробный.
-
Код: загрузили весь код CMS Every + «подушку» до 1 млн токенов.
- Claude справился, но ответы короче и менее полные, чем у Gemini.
-
AI Diplomacy: играли в «Дипломатию» — мировое господство пока не одержал.
Вывод: быстрый и стабильный длинный контекст, но менее детальный, чем конкуренты.
Комментарии (29)
- Пользователи обсуждают, что Google AI Studio предоставляет бесплатный доступ к Gemini 2.5 Pro/Flash с контекстом 1M токенов, но фри-тариф быстро исчерпывается.
- Сравнивают скорость Sonnet 4 и Gemini 2.5 Flash: при одинаковых TPUs Sonnet оказался быстрее на длинных контекстах.
- Отмечают, что Gemini путается в длинной истории чата и «смешивает» факты, чего не наблюдают у OpenAI/Anthropic.
- Предлагают проводить соревнования LLM по сжатию данных: сделать краткие заметки и отвечать по ним на вопросы.
- Уточняют, что весь цикл «Гарри Поттера» (~1 млн слов ≈ 1,4 млн токенов) не помещается в 1M контекст.
WHY2025: How to become your own ISP [video]
Как стать собственным интернет-провайдером
Nick Bouwhuis, 34 мин
Доклад о том, как устроен интернет «изнутри» и как самому стать его полноценным участником. Разберём BGP, AS-номера, IP-префиксы и практические шаги для старта. Узнаете, как обрести сетевой суверенитет и что значит запускать собственный ISP. Краткий тур по личной сети докладчика: как она построена и для чего используется.
Видео
- 1080p AV1 213 МБ
- 576p MP4 93 МБ
- 1080p MP4 350 МБ
- 576p WebM 79 МБ
- 1080p WebM 253 МБ
Аудио
- MP3 31 МБ
- Opus 18 МБ
Лицензия: CC BY 4.0
Комментарии (29)
- Участники жалуются на высокие сборы RIPE (≈2000 €/год) и считают их барьером для мелких игроков, хотя кто-то видит в этом фильтр «экономически неразумных» проектов.
- @abound получил ASN и стоит в очереди на IPv4, планируя стать сельским ISP; ему советуют сразу разговаривать с транзит-провайдерами, смотреть аукционы IPv4 и общаться на RIPE-встречах.
- Нидерланды названы «лёгкой» страной для пиринга, тогда как Швейцария воспринимается сложнее; однако упоминают Init7, SwiNOG и community-IX как полезные точки входа.
- @max_ критикует европейскую систему как «феодальную», ограничивающую рост мелких.
Show HN: Omnara – Run Claude Code from anywhere 🔥 Горячее
Omnara (YC S25) — универсальный клиент для AI-агентов.
Где бы вы ни находились, общайтесь с моделями через единый интерфейс: мессенджеры, браузер, десктоп, мобильные устройства.
Ключевые возможности
- Подключение из любого места — Slack, Telegram, WhatsApp, веб-чат, расширения браузера, macOS/Windows/Linux, iOS/Android.
- Один аккаунт — все агенты — подключайте OpenAI, Anthropic, Google, Mistral и другие модели без переключения между сервисами.
- Быстрый доступ — горячие клавиши, виджеты, команды голосового помощника.
- Безопасность — end-to-end шифрование, SSO, аудит логов.
Установка
# macOS
brew install omnara-ai/tap/omnara
# Windows
winget install Omnara.Omnara
# Linux
curl -fsSL https://get.omnara.ai | sh
Быстрый старт
- Зарегистрируйтесь:
omnara login - Добавьте API-ключи моделей в
~/.omnara/config.yaml - Напишите первое сообщение:
omnara chat "Привет, помоги с кодом"
Поддержка
Комментарии (146)
- Пользователи в восторге от идеи «Claude Code на ходу»: можно запустить агента на ноутбуке и продолжать управлять им с телефона, пока идёшь или едешь.
- Главные сомнения — качество кода при больших несупервизированных изменениях и отсутствие удобного способа быстро ревьюить результат на маленьком экране.
- Практически каждый второй комментарий требует самостоятельного хостинга или локального tunneled-решения (Tailscale, ngrok, VNC) из-за опасений за приватность кода и отсутствия «moat» у продукта.
- Половина аудитории ждёт Android-версию, нормальную авторизацию и возможность подключать другие CLI-агенты (Codex, Gemini, OpenCode).
- Несколько человек уже опубликовали свои DIY-решения (PWA, Termux, SSH+tmux/screen), подтверждая, что технически задача решается простыми средствами.
Show HN: Building a web search engine from scratch with 3B neural embeddings 🔥 Горячее
- Цель: за 2 месяца с нуля собрать поисковик, который выдаёт только качественный контент, используя 3 млрд нейро-эмбеддингов.
- Мотив: классические поисковики скатываются в SEO-спам, а трансформерные эмбеддинги уже «понимают» язык.
Что вышло
- 200 GPU → 3 млрд SBERT-векторов.
- Пик: 50 тыс. страниц/сек, 280 млн страниц в индексе.
- Latency запроса ≈ 500 мс.
- RocksDB + HNSW на 200 ядрах, 4 ТБ ОЗУ, 82 ТБ SSD.
Архитектура (сверху вниз)
- Crawler – горизонтально масштабируемый, 50 к/с.
- Нормализация – чистка HTML, удаление шаблонов.
- Чанкинг – разбиение на семантические блоки + «цепочка утверждений» для контекста.
- Pipeline – CPU-часть (чистка, чанки) → GPU-часть (эмбеддинги).
- Storage – RocksDB для метаданных, HNSW для векторов, шардировано 200-way.
- Service mesh – gRPC, балансировка, отказоустойчивость.
- SERP – ранжирование, сниппеты, AI-ассистент, трекинг сессий.
- Knowledge graph – сущности и связи между ними, довесок к векторам.
Ключевые фокусы
- Latency: кэш L2, предвычисленные top-k, батчинг GPU.
- Качество поиска: эмбеддинги ловят интент, а не ключевики; минимум SEO-спама.
- Демо: живой инстанс доступен (ссылка в оригинале).
Цена
≈ 12 000 $ за два месяца (GPU, SSD, трафик).
Дальше
- Больше языков, real-time индекс, персонализация, API для разработчиков.
Комментарии (97)
- Автор показал, что за $100 можно эмбеддить миллиард страниц через дешёвый OpenAI-batch, а полный поисковый движок обойдётся всего в ~50 000 $/год.
- Участники восторгаются глубиной статьи и качеством прототипа, но спорят: векторный поиск плохо справляется с точными ключами, а SEO-спам всё ещё возможен.
- Предлагают использовать гибрид BM-25 + embeddings, открытые датасеты OpenWebSearch.eu/Common Crawl и «человеческие» клики для ранжирования.
- Обсуждают коммерческую модель (Kagi-like за 5 $/мес) и дают советы по масштабированию (IVF, SPLADE, RocksDB+Faiss).
Claude Sonnet 4 now supports 1M tokens of context 🔥 Горячее 💬 Длинная дискуссия
- Claude Sonnet 4 расширен до 1 млн токенов контекста — в 5 раз больше, чем раньше.
- Доступ: публичная бета в Anthropic API и Amazon Bedrock; скоро в Vertex AI.
- Применение: анализ целых кодовых баз, синтез сотен документов, агенты с длинной памятью.
Цены (свыше 200 K токенов):
| Тип | ≤200 K | >200 K |
|---|---|---|
| Вход | $3/Мток | $6/Мток |
| Выход | $15/Мток | $22.5/Мток |
- Экономия: кэширование промптов и пакетная обработка снижают расходы.
Клиенты:
- Bolt.new использует 1 M токенов для генерации кода в больших проектах.
- iGent AI запускает агента Maestro, который днями работает с реальными кодовыми базами.
Старт: доступен для Tier 4 и кастомных лимитов; документация и цены по ссылкам.
Комментарии (667)
- Пользователи сомневаются в практической пользе 1M токенов: качество ответов быстро падает, контекст «засоряется», а цена растёт квадратично.
- Большинство считают текущие окна в 100–200K уже избыточными без точной RAG-поддержки и быстрой очистки старого контекста.
- Ключевые запросы: лучше скорость и надёжность, чем «рекламные» миллионы токенов; нужен контроль расходов и явное предупреждение о дорогих запросах.
Комментарии (67)
- DOJ требует у судьи Мехты принудительно отделить Chrome от Google после признания монополии в поиске; предложение Perplexity рассматривается как юридический ход.
- Предложение Perplexity в $34,5 млрд (в 2× превышающее её капитализацию) участники называют пиар-акцией: денег нет, цена занижена, а сделка обречена на провал.
- Многие считают, что проще форкнуть Chromium бесплатно, чем платить за бренд и установленную базу в 3,45 млрд пользователей.
- Пользователи критикуют саму Perplexity: «фанфары вместо продукта», «плохие результаты», «обман маркетинга» и опасения, что ИИ-компания будет ещё агрессивнее использовать данные, чем Google.
Evaluating LLMs playing text adventures
Оценка LLM в текстовых квестах
Сначала мы просто мерили, сколько ходов нужно, чтобы дойти до далёкой цели. Теперь придумали лучше: ставим лимит в 40 ходов и считаем выполненные достижения. Их описываем парой «ключ → фрагмент текста игры». Например, для 9:05:
EXIT_BED → You get out of bedOPEN_DRESSER → revealing some clean
…и так далее. Модель о достижениях не знает; мы просто подсчитываем совпадения. Очки сравниваем между собой, а не считаем абсолютной оценкой.
Результаты (4 игры, 40 ходов)
| Модель | 9:05 | Lockout | Dreamhold | Lost Pig |
|---|---|---|---|---|
| Grok 4 | 86 % | 15 % | 46 % | 33 % |
| Claude 4 Sonnet | 80 % | 30 % | 53 % | 46 % |
| Gemini 2.5 Flash | 80 % | 30 % | 33 % | 46 % |
| Gemini 2.5 Pro | 80 % | 30 % | 40 % | 40 % |
| DeepSeek R1 | 80 % | 23 % | 33 % | 33 % |
| Claude 4 Opus | 73 % | 30 % | 60 % | 46 % |
| gpt-5 Chat | 73 % | 15 % | 53 % | 33 % |
| DeepSeek V3 | 66 % | 23 % | 20 % | 33 % |
| gpt-4o | 53 % | 23 % | 40 % | 40 % |
| Qwen3 Coder | 53 % | 23 % | 40 % | 33 % |
| Kimi K2 | 53 % | 30 % | 46 % | 40 % |
| glm 4.5 | 53 % | 23 % | 33 % | 53 % |
| Claude 3.5 Haiku | 38 % | 15 % | 26 % | 26 % |
| Llama 3 Maverick | 33 % | 30 % | 40 % | 33 % |
| gpt-o3-mini | 20 % | 15 % | 26 % | 26 % |
| Mistral Small 3 | 20 % | 15 % | 0 % | 20 % |
| gpt-4o-mini | 13 % | 23 % | 20 % | 40 % |
Повторные прогоны не делали — дорого.
Комментарии (63)
- Исследование показало, что современные LLM-провайдеры плохо справляются даже с классическими текстовыми квестами, несмотря на доступные онлайн-гайды.
- Участники подчеркивают: ChatGPT-5 — это не одна модель, а роутер, случайно выбирающий модель, что снижает надёжность результатов.
- Критика методики: неясно, просили ли LLM именно проходить игру, а не просто исследовать, и нет сравнения с людьми.
- Большинство считает, что LLM не обладают «моделью мира» и не понимают строгих правил, поэтому не могут системно решать головоломки.
- Некоторые предлагают улучшить подход: давать модели прямой доступ к интерпретатору игры или использовать более точные промпты.
Recto – A Truly 2D Language
Recto — язык, где код — это вложенные прямоугольники. Он не читается сверху вниз, а воспринимается пространственно: структура и рекурсия задаются формой, а не текстом.
Идея
Большинство языков — линейны: слова идут одно за другим. Recto отказывается от этой традиции и возвращается к древним «картам мыслей» — пиктограммам, звёздным картам, схемам. Главное требование к языку:
- Понятен человеку и машине.
- Может быть создан человеком и машиной.
Линейность не обязательна: можно представить «приложение», где жест или выражение лица превращается в сетку эмодзи, и всё работает.
Примеры
- Hello Recto — прямоугольник, внутри которого текст
Hello Recto. - Арифметика — прямоугольники-числа и операторы встраиваются друг в друга, образуя выражения.
- Факториал — рекурсивный прямоугольник ссылается на себя.
Почему это важно
Recto показывает, как можно писать, парсить и мыслить кодом без строк и файлов. Он открывает путь к языкам, где значение рождается из формы, а не последовательности символов.
Попробовать: Recto Pad | Google Colab | GitHub
Комментарии (58)
- Участники обсуждают Recto как «2D-язык», но многие считают его всё же 1D с «скобками и лишними шагами».
- Поднимаются примеры других 2D/3D-языков: PATH, Befunge, Hexagony, Orca, Unreal Blueprints, Racket 2d.
- Спор о том, считать ли нотный стан или речь по-настоящему многомерными; автор статьи настаивает на их 1D-основе.
- Предлагаются улучшения: полноценная графическая среда, Unicode-рамки, поддержка VR/AR, именованные параметры.
- Упомянуты эксперименты с «временем» как измерением (EmiT, ICFPC 2024).
- Автору пожелали сил в борьбе с раком и скинули ссылки на GoFundMe и CaringBridge.
Why are there so many rationalist cults? 🔥 Горячее 💬 Длинная дискуссия
Почему у рационалистов так много культов?
Ози Бреннан
Рационалисты собрались вокруг «Последовательностей» Элиезера Юдковского — цикла постов о том, как мыслить рационально. Казалось бы, сообщество должно быть образцом скепсиса, но оно породило около полдюжины странных групп, включая две, «общавшиеся с демонами». Самые известные — «зизианцы» (анархо-трансгуманисты-веганы), причастные к шести смертям, и «Чёрный лотос» Брента Дилла, где ролевые игры превратились в метафизику. Ещё Leverage Research, из исследовательской организации — в токсичный культ с элементами оккультизма.
Я поговорила с десятью участниками этих групп и ранними рационалистами. Сама я из сообщества, поэтому получила редкий уровень откровенности.
Почему это происходит?
Маркетинг. «Последовательности» обещают: «Научитесь думать лучше — решите все проблемы, станьте элитой, спасите человечество». Это неправда, но люди хотят верить. Они ищут гуру, который перепрограммирует их мозг и даст роль в грандиозном плане. Вместо этого находят обычных людей, статистику и барбекю.
Контроль сверху. В «Чёрном лотосе» Брент Дилл использовал игру Mage: the Ascension как фреймворк власти. Без него группа давала «пиковые переживания», но с ним — травму.
Токсика снизу. В Leverage Research деструктивные практики рождались не от лидера, а от самих участников.
Комментарии (698)
- Участники обсуждают, как сообщество «рационалистов» Элиезера Юдковского выросло из блогов в полноценные субкультуры, включая группы с оккультными и даже насильственными практиками.
- Многие отмечают, что стремление «мыслить рационально» без проверки базовых аксиом и без внешних корректировок легко приводит к культам и дисфункции.
- Часть комментаторов защищает сообщество, описывая его участников как доброжелательных и искренних, но признаёт, что идеи о грядущем конце света через ИИ могут парализовать обычную жизнь.
- Наблюдается сравнение с другими историческими движениями — от хиппи-коммун 60-х до религиозных сект, подчёркивающее повторяющийся паттерн изоляции и «чистоты» идей.
- Наконец, звучит предупреждение: чрезмерная уверенность в собственной рациональности и отказ от интуиции и культурных норм открывает дверь к манипуляциям и культовой динамике.