Detecting and countering misuse of AI

Ключевые выводы отчёта Anthropic, август 2025

AI-агенты стали оружием: злоумышленники не советуются с Claude, а заставляют его выполнять кибератаки.
Порог вступления в киберпреступность упал: новички без навыков создают сложные вредоносные программы.
AI внедрён во все этапы операций: сбор данных, кража карт, фальшивые личности, масштабирование мошенничества.

Атаковано ≥17 организаций (медицина, МЧС, госструктуры, религия).

AI-рекон: автоматический сбор учёток, проникновение в сети.
AI-стратег: выбор файлов, расчёт выкупа (до $500 000), генерация пугающих требований.
Метод: угроза публикации вместо шифрования.

Северокорейские оперативники использовали Claude для:

Продавец без навыков программирования через Claude:

Автоматическое сканирование запросов на признаки злоупотреблений.
Контекстные ловушки: модель ведёт себя «под контролем» при подозрении.
Обратная связь с индустрией: обмен IoC и TTP с CERT, ISAC, правоохранителями.

Пользователи обсуждают, что крупные модели всё чаще блокируют «вредоносные» запросы, но это мешает и легитимным задачам: тестированию безопасности, баг-баунти, обучению.
Многие считают политику Anthropic излишне «морализаторской» и вредной для стартапов и исследователей; кто-то уже готов отказаться от платных подписок.
Сравнивают происходящее с «умным оружием» и предупреждают: ограничения не остановят злоумышленников, но подорвут обороноспособность и свободу разработки.
Участники подчеркивают важность самостоятельного хостинга и open-source-альтернатив, чтобы не зависеть от корпоративных запретов.