Тег: #3d-reconstruction — Hacker News Digest

Computer Vision: Algorithms and Applications, 2nd ed (szeliski.org)

Второе издание фундаментального учебника по компьютерному зрению охватывает алгоритмы и практические приложения, от классических методов до современных нейросетевых подходов. Книга основана на курсах автора в Университете Вашингтона и Стэнфорда, с акцентом на глубину и доступность материала. Электронная версия в формате PDF оптимизирована для онлайн-чтения, с гиперссылками и возможностью комментирования.

Текст дополнен визуальными примерами, включая маски сегментации Mask R-CNN и 3D-реконструкции. Для преподавателей и студентов указаны ссылки на слайды и курсы ведущих университетов, таких как MIT, Корнелл и CMU. Автор приветствует обратную связь по ошибкам и планирует периодически обновлять электронную версию.

by ibobev • 27 сентября 2025 г. в 12:27 • 76 points

Оригинал • HN

#computer-vision #machine-learning #neural-networks #mask-r-cnn #3d-reconstruction #mit #cornell #cmu #arxiv #github

Комментарии (13)

Пользователи высоко оценивают книгу как отличный фундаментальный учебник по компьютерному зрению.
Обсуждается отсутствие продвинутых учебников, покрывающих современные практики, и предлагается искать актуальные знания на arXiv и GitHub.
Поднимается вопрос о том, почему старый пост (2022 г.) публикуется снова, и предлагается добавлять дату в заголовок для ясности.
Указывается на наличие слайдов и лекций к книге на сайте автора.
Отмечается, что область компьютерного зрения очень широка и быстро развивается, что затрудняет создание актуальных учебников.

Voyager – An interactive video generation model with realtime 3D reconstruction (github.com) 🔥 Горячее 💬 Длинная дискуссия

Voyager — интерактивная модель генерации RGBD-видео от Tencent Hunyuan, управляемая траекторией камеры и поддерживающая реконструкцию 3D-сцен в реальном времени.

by mingtianzhang • 03 сентября 2025 г. в 11:07 • 302 points

Оригинал • HN

#tencent #3d-reconstruction #machine-learning #llm #lidar #video-generation #github

Комментарии (206)

Лицензия запрещает использование в ЕС, Великобритании и Южной Корее, что участники связывают с регуляторными рисками (EU AI Act).
Модель не полностью open-source: доступны только веса, без данных обучения.
Пользователи отмечают ограниченные углы обзора в демо-видео и требуют «полного 360°».
Минимальные требования — 60 ГБ VRAM для 540p, что делает технологию недоступной для большинства.
Обсуждаются потенциальные применения: от замены LiDAR до генерации игр и 3D-сцен из фото/видео.