Hacker News Digest

Тег: #wget

Постов: 2

Complete Digitization of Leonardo da Vinci's Codex Atlanticus (openculture.com)

Полностью оцифрован "Кодекс Атлантический" — крупнейшая коллекция рисунков и записей Леонардо да Винчи. В эпоху Возрождения искусство и наука не были так разделены, как сегодня, и Леонардо подходил ко всему как техник. Его художественные произведения были результатом математической точности, тщательного изучения и прямого наблюдения, а не просто творческим порывом.

Леонардо рассматривал свои художественные проекты как эксперименты, некоторые из которых он оставлял незавершенными, как и научные исследования. Он никогда не приступал к механическим, анатомическим или художественным проектам без тщательного планирования и проектирования, что подтверждают его многочисленные записные книжки. Теперь все больше этих рукописей становится доступными онлайн, что позволяет как ученым, так и обычным людям глубже понять гений Леонардо.

by emmelaich • 28 октября 2025 г. в 03:32 • 117 points

ОригиналHN

#web#html#wget#url

Комментарии (34)

  • @kragen отмечает высокое качество ресурса, но указывает на низкое разрешение изображений (пример: https://codex-atlanticus.ambrosiana.it/assets/500/000R-1.jpg), что затрудняет чтение текста и архивацию.
  • @vim-guru замечает, что некоторые страницы отображаются вверх ногами.
  • @trvz предлагает решение: использовать URL с высоким разрешением (например, https://codex-atlanticus.ambrosiana.it/assets/2000/000R-1.jpg).
  • @trvz рекомендует инструмент wget для пакетного скачивания всех изображений высокого разрешения (страницы R и V, номера 1-1119).

Why are anime catgirls blocking my access to the Linux kernel? (lock.cmpxchg8b.com) 🔥 Горячее 💬 Длинная дискуссия

Anubis — «весы душ» для HTTP-запросов, защищают сайты от ИИ-ботов. Вместо CAPTCHA требует перебора nonce, чтобы SHA-256(challenge+nonce) начиналась с 4 нулей (16 бит). Это Proof-of-Work, как в биткоине, но не майнинг.

Проблема: задача легка для дата-центра ИИ, но трудна для обычных пользователей без мощного железа.
Сайты ядра Linux (git.kernel.org, lore.kernel.org) теперь требуют этот PoW, что ломает скрипты и консольные клиенты.

Цифры

  • Сложность 4 → 2¹⁶ ≈ 65 536 SHA-256 на токен.
  • Токен живёт 7 дней.
  • 11 508 «звёзд» GitHub ≈ столько сайтов с Anubis.
  • На бесплатной e2-micro GCP: 3688 кБ/с SHA-256 → ≈ 230 000 хэшей/с.
  • Для обхода всех сайтов за неделю: 11 508 × 65 536 ≈ 754 млн хэшей → 54 минуты CPU на одном ядре.
    Цена: копейки, даже в облаке. ИИ-вендору это ничто, а владельцу VPS-128 МБ — проблема.

Альтернативы

  • Rate-limit, WAF, robots.txt, API-ключи, CDN, client-cert.
  • Использовать Tor Browser (JS включён) или Selenium.
  • Патчить curl/wget, добавляя JS-движок или готовый PoW-скрипт.
  • Прокси-браузер (Puppeteer, Playwright) в headless-режиме.

Workarounds

  • anubis-pass — консольный майнер на Go, решает задачу и выдаёт cookie.
  • Пользовательские скрипты, которые запрашивают страницу, вычисляют PoW и продолжают сессию.

by taviso • 20 августа 2025 г. в 14:54 • 726 points

ОригиналHN

#anubis#proof-of-work#sha-256#curl#wget#go#tor#puppeteer#playwright#selenium

Комментарии (770)

  • Anubis — это PoW-заглушка, которая заставляет клиента выполнить небольшой вычислительный «тест» и получить токен на неделю; таким образом сервер получает идентификатор для рейт-лимита и борется с массовым «распылением» запросов ботами.
  • Многие участники считают, что PoW легко обходится при наличии вычислительных ресурсов, но пока большинство AI-краулеров просто не стали заморачиваться, поэтому Anubis «работает» в реальности, хоть и не идеален.
  • Критика: задержки 10–20 с на слабых устройствах, проблемы с доступом без JS, «аниме-девочка» вызывает у кого-то раздражение, а у кого-то ностальгию.
  • Часть комментаторов предлагает альтернативы: микроплатежи, «человеческие» вопросы, лабиринты-ловушки, VPN-сети или просто блокировки по ASN.
  • Самое главное: Anubis не решает проблему окончательно, но добавляет достаточно трения, чтобы заставить владельцев краулеров пересмотреть объёмы сканирования.