Hacker News Digest

Тег: #internet-archive

Постов: 7

Internet Archive's legal fights are over, but its founder mourns what was lost (arstechnica.com)

Internet Archive недавно отметил сохранение триллионной веб-страницы, получив признание от города Сан-Франциско и статус федеральной депозитарной библиотеки. Несмотря на эти достижения, организация только что вышла из многолетних судебных разбирательств по авторским правам, которые привели к удалению более 500 000 книг из проекта "Open Library". Основатель Brewster Kahle отметил: "Мы выжили, но это уничтожило библиотеку".

Kahle с 1996 года стремился превратить Internet Archive в цифровую Библиотеку Александрии, предвидя юридические проблемы, но веря, что Wayback Machine изменит понимание авторских прав. Он считает, что споры были не с создателями, а с крупными медиакомпаниями, которые хотят большего, чем предоставляет авторское право. Сейчас Archive не сталкивается с крупными исками, но Kahle сожалеет, что мир стал "глупее" после опустошения Open Library, и ищет новые пути развития.

by thinkcontext • 05 ноября 2025 г. в 18:59 • 140 points

ОригиналHN

#internet-archive#copyright#open-library#wayback-machine

Комментарии (94)

  • Пользователи обсуждают, что Internet Archive (IA) сталкивается с юридическим давлением издателей, что привело к удалению сотен тысяч книг из Open Library, и что это может быть связано с тем, что IA не может позволить себе защищать их в суде, как это делают крупные корпорации.
  • Участники обсуждения подчеркивают, что критика IA за «National Emergency Library» инициативу в период пандемии COVID-19, когда библиотеки были закрыты, была неуместной, поскольку она была направлена на обеспечение доступа к книгам для тех, кто не может физически получить к ним доступ.
  • Участники также обсуждают, что критика IA за «National Emergency Library» не учитывает, что IA не предоставляет книги в полном объеме, а лишь ограниченный доступ в форме, который не отличается от того, что предоставляют другие библиотеки, использующие цифровое кредитование.
  • Участники также обсуждают, что критика IA за использование книг для обучения ИИ-моделей не учитывает, что такое использование не является уникальным для IA и что подобное использование происходит и в других местах.

1 Trillion Web Pages Archived (blog.archive.org) 🔥 Горячее

Интернет-архив достигнет триллиона сохранённых веб-страниц в Wayback Machine в октябре — это результат почти 30 лет работы с библиотеками по всему миру для создания коллективной цифровой памяти человечества. Масштаб достижения подчёркивает важность сохранения онлайн-истории: от глобальных новостей до личных страниц, которые иначе были бы утрачены.

В честь события запланирована серия мероприятий, включая концерт Del Sol Quartet, диалог Тима Бернерса-Ли и Брюстера Кейла о будущем интернета, виртуальный форум библиотечных лидеров и экскурсии по физическому архиву. Эти события не только отмечают веху, но и подчёркивают необходимость продолжать совместными усилиями сохранять веб-контент для будущих поколений.

by pabs3 • 06 октября 2025 г. в 03:48 • 579 points

ОригиналHN

#internet-archive#wayback-machine#ipfs#common-crawl#torrent#archive.is#pywaybackup

Комментарии (81)

  • Пользователи предлагают технические улучшения для Internet Archive: распределенное пиринговое зеркалирование (по типу torrent), интеграция с IPFS, улучшение поиска по содержимому страниц и статистики.
  • Обсуждаются вопросы масштаба и инфраструктуры архива: объем данных, надежность хранения, защита от несанкционированного изменения, сотрудничество с Common Crawl и ArchiveTeam.
  • Высказывается критика в адрес скорости работы сервиса, сложности извлечения данных и точности метрик, а также опасения о приватности из-за отсутствия возможности удалить информацию.
  • Пользователи делятся инструментами для работы с архивом (например, pywaybackup) и альтернативными сервисами (archive.is).
  • Участники выражают благодарность и поддержку Internet Archive, интересуются мероприятиями организации и возможностями трудоустройства.

Internet Archive's big battle with music publishers ends in settlement (arstechnica.com) 🔥 Горячее

Интернет-архив урегулировал многолетний судебный спор с крупными лейблами, включая UMG, Capitol и Sony, по поводу проекта Great 78, оцифровывавшего хрупкие записи на шеллаке. Детали соглашения остаются конфиденциальными, но стороны официально уведомили суд о завершении дела. Изначально издатели требовали компенсацию в $400 млн, утверждая о потере потокового дохода, а позже увеличили сумму до $700 млн, добавив новые претензии.

Хотя защита настаивала на скромном масштабе использования архивных записей и оценке ущерба всего в $41 тыс., риски для некоммерческого архива были огромны. Это уже второе крупное урегулирование после проигранного в прошлом году дела с книжными издателями, что подчёркивает растущее давление на цифровые архивы в условиях ужесточения авторского права.

by coloneltcb • 15 сентября 2025 г. в 22:34 • 350 points

ОригиналHN

#copyright#internet-archive#umg#capitol#sony#digital-archiving#content-id#youtube

Комментарии (148)

  • Internet Archive подвергается судебным искам за нарушение авторских прав, в отличие от крупных платформ вроде YouTube, которые защищены системами вроде Content ID.
  • Существуют опасения, что из-за спорного контента и неоднозначных решений (например, «Национальной Чрезвычайной Библиотеки») будущее архива под угрозой, несмотря его огромную ценность для человечества.
  • Некоторые пользователи критикуют организацию за превращение в подобие пиратского сайта из-за размещения современного, а не только архивного контента.
  • Обсуждаются проблемы управления и финансирования архива, бюджет которого сравнительно мал, а также роль его совета директоров.
  • Предлагаются радикальные решения, такие как перемещение юрисдикции архива в страну без строгих законов об авторском праве, чтобы избежать давления.

Bookmarks.txt is a concept of keeping URLs in plain text files (github.com)

bookmarks.txt — идея хранить закладки в обычных текстовых файлах.
Проект на GitHub: soulim/bookmarks.txt.

by secwang • 28 августа 2025 г. в 02:12 • 157 points

ОригиналHN

#plain-text#markdown#yaml#csv#url#link-rot#wallabag#eaglefiler#pdf#internet-archive

Комментарии (128)

  • Участники делятся на «быстрые закладки» (часто посещаемые сайты) и «долгосрочное хранение» (контент, который может исчезнуть).
  • Популярны минималистичные форматы: plain-text, Markdown, YAML, .url-файлы, CSV, либо просто e-mail/рассылки.
  • Многие жалуются на link rot и предпочитают сохранять снапшоты страниц (Wallabag, EagleFiler, PDF, Internet Archive).
  • Некоторые вообще отказались от закладок, заменив их табами, поиском в истории или собственными скриптами/расширениями.
  • Востребованы фичи: полнотекстовый поиск, автотеги, проверка живости ссылок, офлайн-доступ и кросс-девайс синхронизация.

Romhack.ing's Internet Archive Mirror No Longer Available (romhack.ing)

Для работы приложения включите JavaScript.
Перейдите по ссылке на HTML-версию; после клика должно произойти перенаправление.

Если этого не случилось, браузер устарел или игнорирует заголовки no-cache.
Агрессивное кеширование (например, в текстовом браузере Links) может мешать.
Отключите кеш, несколько раз обновите страницу или обратитесь к разработчикам браузера.

by pharrington • 23 августа 2025 г. в 20:43 • 144 points

ОригиналHN

#javascript#html#no-cache#internet-archive

Комментарии (25)

  • Архив Internet Archive (IA) временно убрал файлы ROM-хаков из-за ложных срабатываний антивирусов, а не по просьбе правообладателей.
  • Куратор IA Джейсон Скотт предложил писать ему напрямую при подобных проблемах.
  • Участники удивлены: IA годами хранит «чистые» нелицензионные ROM-ы без жалоб, а патчи вдруг заблокировали.
  • Обсуждают, помогут ли шифрование или пароль на архивы — скорее нет, антивирусы реагируют и на защищённые zip.
  • Упоминается, что RomHacking.net чуть не закрылся в 2024-м, но продолжает работать, а RomHack.ing стал его «духовным преемником».

Newgrounds: Flash Forward 2025 (newgrounds.com)

Flash Forward 2025
Пятый ежегодный джем, посвящённый Flash-наследию. Работы запускаются в браузере через Ruffle (AS2 и большинство AS3).

Требования

  • Игра или интерактивный фильм, созданный во Flash.
  • Проверьте в Ruffle перед публикацией.
  • Не используйте защищённые персонажей и нелицензионную музыку.
  • Премьера должна быть во время джема; не переиздавайте старые проекты.
  • Тег Flash-Forward-2025 до 20 апреля.
    Желательно выложить 6 апреля — 25-летие Flash-портала NG.

Призы
Игры: 1-е — $1200, 2-е — $700, 3-е — $400, 4-е — $150, 5-е — $75.
Интерактивные фильмы: 1-е — $150, 2-е — $100, 3-е — $50.

Спонсоры
@matt-likes-swords, @carbonlad — по $500; @Lochie — $420.69; @BoMToons — $250 и др.
Хотите добавить призов — донатите через Supporter и напишите TomFulp.

by lsferreira42 • 18 августа 2025 г. в 21:54 • 83 points

ОригиналHN

#flash#ruffle#adobe#haxe#swfmill#internet-archive

Комментарии (28)

  • Участники вспоминали «золотой век» Flash-игр на Newgrounds и то, как легко тогда было распространять свои проекты.
  • Отмечены важные юридические уроки (спор с BBC из-за пародии на Teletubbies) и технические решения: эмулятор Ruffle, проекты Flashpoint и Internet Archive для сохранения наследия.
  • Взрослый контент теперь скрыт за настройками, а сам Flash воспринимается как «ретро-консоль веба 1.0».
  • Обсуждались инструменты для создания Flash-контента: Adobe (всё ещё проприетарный), Haxe + swfmill, а также мечты о «Unity с интерфейсом Flash».

Enlisting in the Fight Against Link Rot (jszym.com)

Google закрывает goo.gl
В 2009-м сервис обещал «стабильность, безопасность, скорость». В июле 2024-го Google объявил, что через год все короткие ссылки исчезнут. Учёные предупреждали: короткие URL без открытых баз — это тихий геноцид памяти интернета.

Кто спасёт ссылки?
Archive Team — те же люди, что спасли Geocities, Yahoo! Answers и Yahoo! Groups. Они собирают карту всех ~3 млрд goo.gl-ссылок: заходят, фиксируют редирект, повторяют.

Как присоединиться

  1. Установи Warrior (контейнер или GUI).
  2. Не используй VPN/прокси, которые ломают сайты.
  3. Запусти — программа сама перебирает адреса.

Осталось меньше двух недель. 3000+ волонтёров уже в деле.

by jszymborski • 12 августа 2025 г. в 14:52 • 146 points

ОригиналHN

#goo.gl#archive.org#docker#url#internet-archive

Комментарии (98)

  • Пользователи сходятся во мнении, что закрытие goo.gl — логичный шаг из-за рисков фишинга и уязвимости домена.
  • Архивисты Internet Archive (ArchiveTeam) уже почти полностью сохранили базу коротких ссылок, используя добровольных «воинов» и Docker-контейнеры.
  • Многие считают, что Google мог бы просто передать очищенную базу Archive.org, но не делает этого из-за юридических и приватных ограничений.
  • Обсуждаются альтернативы: оставить только официальные ссылки Google, выдавать страницу-предупреждение или перенести домен под управление третьей стороны.
  • Участники подчеркивают, что URL-сокращатели изначально создавались ради экономии символов в Twitter и удобства QR-кодов, но превратились в источник link rot и трекинга.