Hacker News Digest

Тег: #data-preservation

Постов: 2

The people rescuing forgotten knowledge trapped on old floppy disks (bbc.com)

Архивисты и энтузиасты по всему миру спешат сохранить информацию с устаревших носителей, таких как дискеты, которые скоро станут нечитаемыми. В Кембриджском университете, например, команда из 20 человек оцифровывает документы Стивена Хокинга, включая его диссертацию, опасаясь, что магнитные носители могут размагничиться. Эта проблема не ограничивается академическими кругами: от Национального архива Великобритании до Би-би-си — все сталкиваются с риском потери данных на устаревших носителях.

Специалисты подчеркивают, что "цифровая темная эпоха" уже наступает, поскольку информация, созданная с 1990-х по 2010-е, может быть утеряна из-за отсутствия совместимого оборудования. В ответ на это энтузиасты, такие как Джейсон Скотт из Archive Team, активно сканируют и сохраняют данные с различных платформ, подчеркивая важность своевременного действия для спасения цифрового наследия.

by jnord • 10 октября 2025 г. в 23:36 • 83 points

ОригиналHN

#data-preservation#archival#digital-archiving#floppy-disks#data-storage#data-recovery

Комментарии (34)

  • Обсуждение охватывает широкий спектр тем: от сохранения старых дискет и форматов 3" и 5.25" до долгосрочного хранения данных и проблем устаревших носителей.
  • Участники обмениваются личным опытом, включая работу с KryoFlux, проблемы с чтением старых дисков и невозможность найти подходящие инструменты.
  • Обсуждаются различные аспекты, включая размеры дискет, формат файлов, и даже такие вещи как стоимость и доступность инструментов для чтения таких носителей.
  • Участники также затрагивают тему долговечности и надежности различных носителей и форматов, включая флоппи-диски, магнитная лента, оптические носители и даже бумажные носители.
  • В конце обсуждение сдвигается к обсуждению будущего хранения данных и необходимости в долгосрочном планировании сохранения информации.

ArchiveTeam has finished archiving all goo.gl short links (tracker.archiveteam.org) 🔥 Горячее

Как запустить ArchiveTeam Warrior

Это виртуальная машина для архивации сайтов. Работает на Windows, macOS, Linux через VirtualBox или VMware, не влияет на систему, использует лишь трафик и немного диска.

Быстрый старт (VirtualBox)

  1. Скачайте образ (357 МБ).
  2. VirtualBox → Файл → Импортировать → выбрать файл.
  3. Запустите ВМ; она обновится и предложит открыть браузер.

После запуска

  • Откройте http://localhost:8001/
  • Укажите имя для таблицы лидеров.
  • Выберите проект во вкладке «All projects» или оставьте «ArchiveTeam’s Choice» для автоматического выбора приоритетной задачи.

Goo-gl tracker
Загрузка…

by pentagrama • 17 августа 2025 г. в 17:46 • 384 points

ОригиналHN

#virtualbox#vmware#docker#archiveteam#wayback-machine#goo.gl#url#web-archiving#data-preservation

Комментарии (90)

  • ArchiveTeam (не Archive.org) спас 3,75 млрд коротких ссылок goo.gl и весь их контент (91 ТиБ) до отключения Google 25 августа.
  • Данные уже поступают в Wayback Machine; сами файлы WARC пока закрыты «access-restricted».
  • Участники просто запускали Docker-контейнер, перебирая пространство URL, чтобы не попасть под бан.
  • Поднимались идеи блокчейн/P2P-краулера и сравнение с CommonCrawl, но основная цель — предотвратить link rot.
  • Reddit и Twitter тоже архивировались (Pushshift, ArcticShift, AcademicTorrents), пока API не закрыли.