Computer Vision: Algorithms and Applications, 2nd ed
Второе издание фундаментального учебника по компьютерному зрению охватывает алгоритмы и практические приложения, от классических методов до современных нейросетевых подходов. Книга основана на курсах автора в Университете Вашингтона и Стэнфорда, с акцентом на глубину и доступность материала. Электронная версия в формате PDF оптимизирована для онлайн-чтения, с гиперссылками и возможностью комментирования.
Текст дополнен визуальными примерами, включая маски сегментации Mask R-CNN и 3D-реконструкции. Для преподавателей и студентов указаны ссылки на слайды и курсы ведущих университетов, таких как MIT, Корнелл и CMU. Автор приветствует обратную связь по ошибкам и планирует периодически обновлять электронную версию.
Комментарии (13)
- Пользователи высоко оценивают книгу как отличный фундаментальный учебник по компьютерному зрению.
- Обсуждается отсутствие продвинутых учебников, покрывающих современные практики, и предлагается искать актуальные знания на arXiv и GitHub.
- Поднимается вопрос о том, почему старый пост (2022 г.) публикуется снова, и предлагается добавлять дату в заголовок для ясности.
- Указывается на наличие слайдов и лекций к книге на сайте автора.
- Отмечается, что область компьютерного зрения очень широка и быстро развивается, что затрудняет создание актуальных учебников.
Voyager – An interactive video generation model with realtime 3D reconstruction 🔥 Горячее 💬 Длинная дискуссия
Voyager — интерактивная модель генерации RGBD-видео от Tencent Hunyuan, управляемая траекторией камеры и поддерживающая реконструкцию 3D-сцен в реальном времени.
Комментарии (206)
- Лицензия запрещает использование в ЕС, Великобритании и Южной Корее, что участники связывают с регуляторными рисками (EU AI Act).
- Модель не полностью open-source: доступны только веса, без данных обучения.
- Пользователи отмечают ограниченные углы обзора в демо-видео и требуют «полного 360°».
- Минимальные требования — 60 ГБ VRAM для 540p, что делает технологию недоступной для большинства.
- Обсуждаются потенциальные применения: от замены LiDAR до генерации игр и 3D-сцен из фото/видео.