Hacker News Digest

15 августа 2025 г. в 20:12 • anthropic.com • ⭐ 222 • 💬 318

OriginalHN

#anthropic#llm#chatbot#conversation#content-moderation#censorship

Claude Opus 4 and 4.1 can now end a rare subset of conversations

Claude Opus 4 и 4.1 теперь могут прерывать редкие диалоги, если пользователь настойчиво требует вредоносного или абьюзивного контента. Функция разработана как эксперимент по защите «благополучия модели» и применяется только в крайних случаях, когда:

  • пользователь игнорирует многократные отказы и попытки перенаправить беседу;
  • исчерпаны все способы продолжить конструктивный диалог;
  • пользователь сам просит завершить чат.

При прерывании:

  • текущий чат закрывается, но можно немедленно начать новый;
  • сохраняется возможность редактировать и перезапускать предыдущие сообщения;
  • остальные диалоги аккаунта не затрагиваются.

Функция не срабатывает, если есть риск, что пользователь навредит себе или другим. Почти все пользователи не заметят изменений, даже при обсуждении спорных тем. Anthropic просит оставлять фидбек, если кажется, что чат был закрыт ошибочно.