Hacker News Digest

Тег: #3d-reconstruction

Постов: 2

Computer Vision: Algorithms and Applications, 2nd ed (szeliski.org)

Второе издание фундаментального учебника по компьютерному зрению охватывает алгоритмы и практические приложения, от классических методов до современных нейросетевых подходов. Книга основана на курсах автора в Университете Вашингтона и Стэнфорда, с акцентом на глубину и доступность материала. Электронная версия в формате PDF оптимизирована для онлайн-чтения, с гиперссылками и возможностью комментирования.

Текст дополнен визуальными примерами, включая маски сегментации Mask R-CNN и 3D-реконструкции. Для преподавателей и студентов указаны ссылки на слайды и курсы ведущих университетов, таких как MIT, Корнелл и CMU. Автор приветствует обратную связь по ошибкам и планирует периодически обновлять электронную версию.

by ibobev • 27 сентября 2025 г. в 12:27 • 76 points

ОригиналHN

#computer-vision#machine-learning#neural-networks#mask-r-cnn#3d-reconstruction#mit#cornell#cmu#arxiv#github

Комментарии (13)

  • Пользователи высоко оценивают книгу как отличный фундаментальный учебник по компьютерному зрению.
  • Обсуждается отсутствие продвинутых учебников, покрывающих современные практики, и предлагается искать актуальные знания на arXiv и GitHub.
  • Поднимается вопрос о том, почему старый пост (2022 г.) публикуется снова, и предлагается добавлять дату в заголовок для ясности.
  • Указывается на наличие слайдов и лекций к книге на сайте автора.
  • Отмечается, что область компьютерного зрения очень широка и быстро развивается, что затрудняет создание актуальных учебников.

Voyager – An interactive video generation model with realtime 3D reconstruction (github.com) 🔥 Горячее 💬 Длинная дискуссия

Voyager — интерактивная модель генерации RGBD-видео от Tencent Hunyuan, управляемая траекторией камеры и поддерживающая реконструкцию 3D-сцен в реальном времени.

by mingtianzhang • 03 сентября 2025 г. в 11:07 • 302 points

ОригиналHN

#tencent#3d-reconstruction#machine-learning#llm#lidar#video-generation#github

Комментарии (206)

  • Лицензия запрещает использование в ЕС, Великобритании и Южной Корее, что участники связывают с регуляторными рисками (EU AI Act).
  • Модель не полностью open-source: доступны только веса, без данных обучения.
  • Пользователи отмечают ограниченные углы обзора в демо-видео и требуют «полного 360°».
  • Минимальные требования — 60 ГБ VRAM для 540p, что делает технологию недоступной для большинства.
  • Обсуждаются потенциальные применения: от замены LiDAR до генерации игр и 3D-сцен из фото/видео.