A PM's Guide to AI Agent Architecture

Краткий гид PM по архитектуре AI-агентов

Проблема
Агент показывает 89 % точность, но пользователи уходят после первого сложного запроса. Причина — не «ум», а архитектура доверия.

Сценарий
Пользователь: «Не могу войти и подписка странная».

Вариант А: агент сразу чинит всё.
Вариант Б: задаёт уточняющие вопросы и переводит к человеку.
Один и тот же запрос — два разных продукта.

4 слоя архитектуры

Память и контекст
- Сессионная (разговор)
- Клиентская (история обращений)
- Поведенческая (привычки)
- Контекстная (актуальное состояние аккаунта)
  Чем больше помнит — тем дороже, но «живее» выглядит.
Интеграция данных
Определяет, насколько глубоко агент лезет в CRM, биллинг, билеты. Глубже = сложнее уйти к конкуренту.
Оркестрация
- Цепочка (последовательные вызовы)
- Параллель (одновременные проверки)
- Иерархия (менеджер → специалисты)
- Аукцион (несколько моделей голосуют)
  Выбор влияет на скорость, цену и надёжность.
Доверие и управление риском
Не в том, чтобы быть правым чаще, а в том, чтобы:
- Показывать уверенность (progress bar, «я проверяю биллинг…»)
- Давать «обратный ход» (отменить последнее действие)
- Чётко объяснять, что делает и почему
- Быстро эскалировать, если не уверен

Практический чек-лист PM

Начните с минимальной памяти (сессия + аккаунт)
Подключите только 1–2 критичных API (биллинг, тикеты)
Используйте простую цепочку вызовов, добавьте fallback к человеку
Добавьте индикатор уверенности и кнопку «Поговорить с человеком»
Метрика: не точность, а % случаев, когда пользователь доволен и не требует эскалации

Итог
Пользователь не оценит 95 % точности, если при первой же ошибке потеряет контроль. Архитектируйте доверие, а не интеллект.

Участники сходятся, что «AI-first» поддержка клиентов пока чаще ухудшает UX, чем улучшает.
Основные риски: незрелые MCP/A2A-протоколы, проблемы безопасности, отсутствие калибровки уверенности LLM и разрыв между демо и реальностью.
Инженеры и security-специалисты предупреждают: давать LLM доступ к боевым данным и инструментам пока «безумие».
Предлагаемая альтернатива — не заменять людей, а усиливать их: AI подсказывает контекст и talking-points, пока человек общается с клиентом.
PM-ы же, по мнению технарей, часто не осознают техническую сложность и требуют невозможного, что ведёт к спешным патчам или легаси на MCP v0.