Тег: #imagenet — Hacker News Digest

Spatial intelligence is AI’s next frontier (drfeifei.substack.com)

—

by mkirchner • 10 ноября 2025 г. в 21:07 • 212 points

Обсуждение в основном вращается вокруг понятия «пространственный интеллект» и его связи с текущим состоянием ИИ, при этом подчеркивается, что конкретных технических деталей или методологий не раскрыто.
Участники обсуждения выдвигают сомнения в том, что у компании есть что-то, кроме «собирать пространственные данные», и сравнивают это с ImageNet.
Обсуждается, что текущие модели не могут обобщать физический мир, и что для этого нужно будет много вычислительных ресурсов.
Также поднимается вопрос о том, что такое «пространственный интеллект» и как он будет развиваться в будущем.

DINOv3 — PyTorch-реализация и модели от Facebook Research.
Репозиторий содержит код, веса и примеры для самостоятельного обучения и дообучения.

git clone https://github.com/facebookresearch/dinov3
cd dinov3
pip install -r requirements.txt

from dinov3 import DinoVisionTransformer, load_pretrained

model = load_pretrained("dinov3_vitb14")
features = model.extract_features(image)

MIT (код) + CC-BY-NC 4.0 (веса).

by reqo • 14 августа 2025 г. в 20:02 • 158 points

Meta выпустила DINOv3 — самонадзорную модель зрения, обученную на 1,2 млрд изображений и выдающую плотные эмбеддинги без дообучения.
Для спутниковых снимков появилась специальная версия, что радует специалистов по аэро- и спутниковым данным.
Модель можно использовать как прямую замену DINOv2 в существующих пайплайнах (см. примеры в репозитории и ноутбуках).
Лицензия новая и более ограниченная, чем Apache 2.0 у DINOv2; доступ требует регистрации и одобрения Meta.
Сообщество отмечает высокое качество эмбеддингов, но разочаровано коммерческой лицензией.