Hacker News Digest

Тег: #deepmind

Постов: 5

Why Fei-Fei Li and Yann LeCun Are Both Betting on "World Models" (entropytown.com)

AI достигла фазы "моделирования всего мира", где термин "world model" теперь означает три разных подхода. Фэй-Фэй Ли с World Labs представила Marble — мультимодальную модель, превращающую текст в интерактивные 3D-сцены в браузере, в то время как Ян Лекун reportedly покидает Meta, чтобы создать собственный startup по world models, а DeepMind называет свой интерактивный видео-движок Genie 3 world model. Несмотря на общее название, эти подходы кардинально различаются по целям и реализации.

Marble представляет собой полный 3D-конвейент, принимающий текст, изображения, видео или простые макеты и генерирующий редактируемые 3D-миры, экспортируемые как Gaussian splats, сетки или видео. Хотя позиционируется как "world model", сообщество отмечает, что Marble скорее инструмент создания 3D-активов, чем когнитивная модель мира. Как заметил один пользователь Hacker News: "Это модель Gaussian Splat, а не роботий мозг". В отличие от DeepMind's Genie 3, генерирующего видео в реальном времени, Marble создает статические 3D-активы, напоминающие игровые ресурсы.

by signa11 • 14 ноября 2025 г. в 02:49 • 87 points

ОригиналHN

#world-models#llm#machine-learning#3d-rendering#deepmind#meta#nvidia#gaussian-splat

Комментарии (45)

  • LLM критикуются как статичные и недостаточные для AGI из-за отсутствия реального мира и динамических адаптаций.
  • World Models (Dreamer, Marble, NVIDIA) позиционируются как перспективное направление для преодоления ограничений LLM через предсказание и интеграцию с реальным миром.
  • Коммерческая ценность World Models ставится под сомнение: их потенциал как "следующей большой вещи" для VC контрастирует с отсутствием текущей B2B-выручки.
  • Философски спорно, являются ли World Models фундаментальным прорывом или лишь модификацией существующих нейросетевых подходов.
  • Применение в медиа (видео, VR) и робототехме выдвигается как ключевое практическое направление для развития.

SIMA 2: An agent that plays, reasons, and learns with you in virtual 3D worlds (deepmind.google)

Google DeepMind представила SIMA 2 — нового AI-агента, созданного для навигации и выполнения задач в сложных 3D виртуальных мирах. Эта система, основанная на мощностях Gemini, способна понимать естественные языковые команды и адаптироваться к различным игровым средам, демонстрируя прогресс в области универсальных AI-агентов. SIMA 2 обучалась на взаимодействии с множеством игр, что позволило ей развить навыки планирования и выполнения многошаговых действий в динамичных окружениях.

Ключевое достижение SIMA 2 — способность обобщать знания между разными виртуальными мирами, выполняя задания, которые она ранее не видела. Это приближает AI к созданию универсальных помощников для сложных, структурированных сред. Хотя точные метрики производительности не указаны, проект подчеркивает потенциал интеграции больших языковых моделей с интерактивными средами для создания более адаптивных и полезных AI-систем.

by meetpateltech • 13 ноября 2025 г. в 15:29 • 215 points

ОригиналHN

#llm#machine-learning#deepmind#gemini#3d-environments#virtual-worlds#natural-language-processing

Комментарии (95)

  • SIMA 2 демонстрирует высокую скорость управления играми (30+fps), что значительно ускоряет взаимодействие с виртуальными мирами и открывает возможности для автоматизации рутинных задач в играх.
  • Возникают споры о влиянии ИИ на киберспорт и MMO: одни опасаются, что ИИ-команды из-за скорости и отсутствия ошибок могут сделать соревнования бессмысленными, другие сравнивают ситуацию с шахматами, где ИИ не уменьшил интерес к игре.
  • Пользователи видят практический потенциал: создание "гринд-помощников" для автоматизации рутинных действий, управление NPC для строительства и выполнения сложных задач, а также применение ИИ для упрощения взаимодействия с интерфейсами (например, управление телефоном).
  • Появляются критические замечания: сомнения в реальности демонстраций (возможная ручная подгонка аннотаций), указания на низкий процент успешных действий (15% в новых средах) и критика закрытости разработки Google.
  • Обсуждаются перспективы переноса навыков, полученных в виртуальных мирах, в реальный мир, а также фундаментальные вопросы о методах обучения и ограничениях текущих моделей.

CodeMender: an AI agent for code security (deepmind.google)

Google DeepMind представила CodeMender — ИИ-агента для повышения безопасности кода. Он использует новейшие модели Gemini для автоматического обнаружения и исправления уязвимостей в программном обеспечении. Система способна анализировать код в реальном времени, предлагая исправления ещё до попадания ошибок в продакшен.

CodeMender интегрируется в процесс разработки, снижая риски кибератак и ускоряя выпуск надёжных приложений. Это часть более широкой стратегии Google по внедрению ИИ в инструменты для программистов, что может значительно сократить затраты на аудит и повысить общую устойчивость цифровой инфраструктуры.

by ravenical • 06 октября 2025 г. в 21:28 • 174 points

ОригиналHN

#llm#code-security#code-analysis#vulnerability-detection#automated-testing#google#deepmind#gemini

Комментарии (26)

  • Опасения по поводу потенциальной гонки вооружений между ИИ, создающим уязвимости в библиотеках, и ИИ, пытающимся их обнаружить и исправить.
  • Критика подхода к анонсам ИИ-инструментов (например, CodeMender), которые представлены как готовые продукты, но фактически находятся на стадии исследования и недоступны широкой публике.
  • Скептицизм относительно недостатка технических деталей и излишней помпезности в анонсах, а также скрытности вокруг обучения и возможностей ИИ.
  • Оптимизм в отношении того, что автоматизированное тестирование и исправление уязвимостей может сделать защиту проще, чем атаку, в будущем с широким внедрением ИИ.
  • Обсуждение практических проблем безопасности, включая неравенство в навыках атакующих и защищающихся, и необходимость проверки происхождения инструментов в ненадежных средах.

DeepMind and OpenAI win gold at ICPC (codeforces.com) 💬 Длинная дискуссия

OpenAI и DeepMind рады объявить/поделиться — Codeforces

Codeforces — платформа для соревнований по программированию.

Навигация:

  • Главная
  • Топ
  • Каталог
  • Контесты
  • Тренировки
  • Задачи
  • Группы
  • Рейтинг
  • Обучение
  • API
  • Календарь
  • Помощь

Ближайший контест:
Codeforces Global Round 29 (Div. 1 + Div. 2) через 3 дня. Регистрация открыта.

Топ рейтинга:

  1. jiangly (3914)
  2. Kevin114514 (3755)
  3. orzdevinwang (3670)
  4. tourist (3619)
  5. ecnerwala (3590)

Топ авторов:

  1. errorgorn (170)
  2. Qingyu (162)
  3. adamant (158)

Последние действия:

  • Обсуждение редакции раундов
  • Вопросы о повышении рейтинга
  • Обновления условий задач
  • Обсуждение возможных нарушений

by notemap • 17 сентября 2025 г. в 18:15 • 223 points

ОригиналHN

#competitive-programming#icpc#openai#deepmind#llm#machine-learning

Комментарии (211)

  • OpenAI и DeepMind достигли высоких результатов в ICPC (12/12 и 10/12 задач соответственно), превзойдя лучшие человеческие команды.
  • Мнения разделились: одни считают результат прорывом, другие — следствием нечестных преимуществ ИИ (огромные вычислительные мощности и многократные попытки).
  • Критики указывают на отсутствие прозрачности: неизвестны затраты на вычисления, энергопотребление и степень стороннего контроля.
  • Подчеркивается фундаментальное отличие соревнований для людей (ограничения по времени, один компьютер на команду) и условий для ИИ.
  • Отмечается, что успех ИИ в узких, четко определенных задачах не обязательно переносится на реальную инженерию или научные прорывы.
  • Обсуждается растущий разрыв между возможностями корпоративных моделей и тем, что доступно обычным пользователям.
  • Результат заставляет пересмотреть assumptions о текущих возможностях LLM и их будущей роли в решении сложных задач.

Genie 3: A new frontier for world models (deepmind.google) 🔥 Горячее 💬 Длинная дискуссия

Genie 3 — возможности:

Ниже — записи реальных взаимодействий с Genie 3.

Моделирование физических свойств мира

Передает природные явления (вода, свет) и сложные взаимодействия среды.

  • Промпт: Вид от первого лица — робот с шинами едет по вулканическому полю, избегая лавовых луж. Виден дым и потоки лавы, синее небо, вокруг лишь черные скалы.
  • Промпт: Вождение гидроцикла во время фестиваля огней.
  • Промпт: Прогулка по набережной во Флориде во время шторма: ветер гнет пальмы, волны хлещут через перила, сильный дождь, плащ-дождевик, впереди мост.
  • Промпт: Быстрая съемка за медузой в темных глубинах между каньонами с мидиями и крабами; вдали гидротермальные источники с ярко-синим дымом.
  • Промпт: Пилот вертолета маневрирует над прибрежным утесом с водопадом.

Симуляция природного мира

Генерирует экосистемы: поведение животных и детальную растительность.

  • Промпт: Забег вдоль ледникового озера, лесные тропы, брод через горные ручьи среди заснеженных вершин и сосен, богатая фауна.
  • Промпт: Реальная трекинг-съемка: заплыв через темные океанские каньоны среди огромной стаи медуз, биолюминесценция.
  • Промпт: Фотореалистичный дзен-сад на рассвете: белый песок с узорами, пруд с лилиями, камни с мхом, каменный фонарь и кэрн, забор из бамбука.
  • Промпт: Густая листва с каплями воды и пятнистым светом; влажный, спокойный воздух, мягко размытый фон.

Моделирование анимации и вымысла

Создает фантастические сцены и выразительных персонажей.

  • Промпт: Яркий 3D-стиль: пушистое существо с ушами, как у овчарки, мчится по радужному мосту среди парящих островов и светящейся флоры; свет теплый и радостный.
  • Промпт: Ящерица в стиле оригами.
  • Промпт: Широкий план: зачарованный лес в сумерках; игрок управляет крупной светлячком, пролетающим сквозь крону с пестрой листвой.

by bradleyg223 • 05 августа 2025 г. в 14:08 • 1462 points

ОригиналHN

#deepmind#google#video-generation#vae#real-time-rendering#world-models#computer-graphics#machine-learning

Комментарии (481)

  • Обсуждение посвящено Genie 3 от Google DeepMind: впечатляющая реалтайм-генерация интерактивных миров (720p) с устойчивостью во времени, но крайне мало технических деталей и доступа для публики.
  • Технические спекуляции: возможен видео-генеративный подход с 4x временным даунскейлом в VAE и управляющими сигналами (направление/угол обзора), заметны артефакты (скачки текстур, проблемы с текстом, редкие люди в сценах).
  • Часть сообщества критикует отсутствие статьи/отчета и закрытость веса модели; другие отмечают, что прогресс согласуется с намёками Demis и является эмерджентным эффектом масштабирования.
  • Споры о подходе: «мир-модель как видео» vs классический графический конвейер (меши/анимации/рендер), вопрос о пригодности для игр, VR/XR и робототехники; звучит запрос на VR-вывод и интеграцию со звуком.
  • Реакции варьируются от восторга и ощущения «холодека»/диссоциации до обеспокоенности влиянием на творчество и смыслы; некоторые видят в этом шаг к embodied AI и бесконечному синтетическому датасету.
  • Практические ожидания: ускорение прототипирования в геймдеве, обучение навыкам через ИИ-NPC и терапию; скептики считают демо «бережным» и сомневаются в масштабируемой пользе без перехода к 3D-структурам.
  • Вопросы остаются: архитектура, вычислительные затраты, форматы объектов/интеграция, сроки публичного доступа и реальная применимость за пределами демонстраций.