A PM's Guide to AI Agent Architecture
Краткий гид PM по архитектуре AI-агентов
Проблема
Агент показывает 89 % точность, но пользователи уходят после первого сложного запроса. Причина — не «ум», а архитектура доверия.
Сценарий
Пользователь: «Не могу войти и подписка странная».
- Вариант А: агент сразу чинит всё.
- Вариант Б: задаёт уточняющие вопросы и переводит к человеку.
Один и тот же запрос — два разных продукта.
4 слоя архитектуры
-
Память и контекст
- Сессионная (разговор)
- Клиентская (история обращений)
- Поведенческая (привычки)
- Контекстная (актуальное состояние аккаунта)
Чем больше помнит — тем дороже, но «живее» выглядит.
-
Интеграция данных
Определяет, насколько глубоко агент лезет в CRM, биллинг, билеты. Глубже = сложнее уйти к конкуренту. -
Оркестрация
- Цепочка (последовательные вызовы)
- Параллель (одновременные проверки)
- Иерархия (менеджер → специалисты)
- Аукцион (несколько моделей голосуют)
Выбор влияет на скорость, цену и надёжность.
-
Доверие и управление риском
Не в том, чтобы быть правым чаще, а в том, чтобы:- Показывать уверенность (progress bar, «я проверяю биллинг…»)
- Давать «обратный ход» (отменить последнее действие)
- Чётко объяснять, что делает и почему
- Быстро эскалировать, если не уверен
Практический чек-лист PM
- Начните с минимальной памяти (сессия + аккаунт)
- Подключите только 1–2 критичных API (биллинг, тикеты)
- Используйте простую цепочку вызовов, добавьте fallback к человеку
- Добавьте индикатор уверенности и кнопку «Поговорить с человеком»
- Метрика: не точность, а % случаев, когда пользователь доволен и не требует эскалации
Итог
Пользователь не оценит 95 % точности, если при первой же ошибке потеряет контроль. Архитектируйте доверие, а не интеллект.