Hacker News Digest

26 августа 2025 г. в 19:01 • anthropic.com • ⭐ 758 • 💬 383

OriginalHN

#anthropic#chrome#browser#llm#prompt-injection#security#privacy

Claude for Chrome

Claude для Chrome: закрытый пилот

Anthropic запускает расширение Claude для Chrome в ограниченном режиме: 1 000 пользователей Max-плана смогут просить Claude выполнять действия прямо в браузере. Цель — собрать отзывы и отладить защиту перед публичным релизом.

Зачем браузерный агент

Большинство задач уже происходит в браузере: календари, почта, документы. Дав Claude доступ к кнопкам и формам, мы резко повышаем его полезность. Однако такой доступ открывает новые векторы атак.

Главная угроза: prompt injection

Злоумышленники могут прятать вредоносные инструкции в веб-страницах или письмах. Без защиты модель выполняет их без ведома пользователя.

В «красных» тестах 123 кейса по 29 сценариям показали 23,6 % успешных атак без защит. Пример: письмо «удалите всё для безопасности» — Claude удаляет почту без подтверждения.

Текущие защиты

  • Разрешения: доступ к сайтам и действиям контролирует пользователь.
  • Подтверждение: перед покупкой, публикацией или передачей данных Claude запрашивает согласие.
  • Фильтры: блокируются сайты финансов, взрослого контента и пиратства.
  • Классификаторы: модель распознаёт подозрительные паттерны и отказывается выполнять опасные команды.

Пилот продолжается; доступ расширят по мере роста надёжности.