Hacker News Digest

Тег: #web-scraping

Постов: 3

Japan's largest paper, Yomiuri Shimbun, sues Perplexity for copyright violations (niemanlab.org)

  • Истец: крупнейшая японская газета «Ёмюри симбун».
  • Ответчик: стартап Perplexity.
  • Суть: в Токийском райсуде подан первый в Японии иск к ИИ-компании о нарушении авторских прав.
  • Обвинение: Perplexity с февраля по июнь 2025 года 119 467 раз скрапил статьи «Ёмюри» и использовал их в ответах чат-бота без разрешения.

by aspenmayer • 12 августа 2025 г. в 00:07 • 143 points

ОригиналHN

#copyright#llm#web-scraping#perplexity#yomiuri-shimbun

Комментарии (64)

  • Японское право разрешает ИИ-тренировку на защищённых материалах без согласия, но запрещает прямое воспроизведение и распространение.
  • «Ёмиури» подало иск к Perplexity именно за массовое копирование статей и заголовков, а не за само обучение.
  • Участники обсуждения подчеркивают двойные стандарты: корпорации могут нарушать авторское право в большом масштабе, пока их не остановят, тогда как физлица пресекаются быстрее.
  • Некоторые считают, что выгода от ИИ концентрируется у узкого круга, в то время как тренировочные данные предоставляет общество.
  • Предлагаются идеи создать фонд для коллективных исков к разработчикам ИИ и, наоборот, фонд для защиты ИИ-разработки от «авторского максимализма».

One Million Screenshots (onemillionscreenshots.com)

Миллион скриншотов
Увеличьте главные страницы интернета.
Поиск сайта: ⌘K или случайный выбор.

by gaws • 10 августа 2025 г. в 20:30 • 243 points

ОригиналHN

#web-design#web-scraping#ssl#dns#api

Комментарии (83)

  • Проект OneMillionScreenshots показывает скриншоты топ-1 000 000 сайтов в виде интерактивной «карты».
  • Часть пользователей жалуется на SSL-ошибки, блокировку DNS и поломку кнопки «Назад».
  • Большинство отмечает однообразие современного веб-дизайна и коммерциализацию интернета.
  • Некоторые просят фильтров по нишевым или старым сайтам, а также API-фич и мозаичных раскладок.
  • Создатели подтвердили, что визуализация устарела, но данные обновляются ежемесячно и доступны через ScreenshotOf.com.

Open Lovable (github.com)

open-lovable — утилита от mendableai, клонирует любой сайт и превращает его в современное React-приложение за секунды.

Репозиторий публичный, доступен на GitHub.

by iamflimflam1 • 10 августа 2025 г. в 10:10 • 152 points

ОригиналHN

#reactjs#firecrawl#e2b.dev#github#web-scraping

Комментарии (43)

  • Проект называется «open-lovable», но не является ни клоном, ни открытой версией Lovable; требует внешние API-ключи (Firecrawl, e2b.dev) и не работает локально без них.
  • Участники спорят о допустимости имени, считая его потенциальным нарушением товарного знака и маркетинговым «рост-хаком».
  • Основная критика: жёсткая завязка на Firecrawl для скрапинга и отсутствие полностью FOSS-варианта всей цепочки.
  • Предлагают альтернативы — bolt.diy, Modal, Daytona, freestyle.sh — и способы самостоятельно развернуть e2b/Firecracker.
  • Некоторые хотели бы обратную задачу: превращение React-приложений в «нормальные» сайты без JS или в нативные веб-приложения.