Про проактивность AI
Все люди относятся к определённой части спектра. С одной стороны есть те, кто просто делает ровно то, что им сказали. И с другой те, кто сверху этого проявляют какое-то количество инициативы – и в рамках конкретной задачи, и в рамках процессов и проекта в целом. Первых большинство, первые надёжные и понятные. Вторые – не самые предсказуемые, но они двигатель прогресса, они наводят суету. Все остальные начинают этой суетой подпитываться, и мы все вместе движемся в какую-то правильную (или не очень) сторону. В команде всегда нужны и те и другие. Даже если и те и другие живут в рамках одного человека, ведь каждый человек между этими полярными состояниями должен балансировать.
Мы все тут уже прекрасно понимаем, что нейроночки классные и могут порешать плюс-минус любую задачу с должным уровнем декомпозиции. Но прямо сейчас у них есть фундаментальная проблема – они находятся в той части спектра, которая пальцем (или что у них там) не пошевелит, если их не пнуть. Агенты – потрясающие как исполнители, но они вообще ничего не делают проактивно.
Мне кажется это какой-то следующий этап, который перевернёт игру опять, ещё сильнее прежнего. И уже даже на самом попсовом уровне движение в эту сторону прослеживается. ChatGPT Pulse, например, который анализируя список чатов тебе проактивно присылает сообщения в духе "спишь?" и "ты интересовался римской империей, а вот интересный факт".
Но, как я и говорил, я пока не очень верю в то, что чат интерфейсы вообще способны насобирать в свою память достаточно полезного, поэтому агенты наше всё. Наш следующий шаг – сделать агентов проактивными. Давайте помечтаем и подумаем.
Нам как будто нужно ответить на четыре вопроса:
- Когда запускать агента?
- Что ему делать?
- Как ему это делать?
- Что сделать с результатом его работы?
Ну например:
- При создании мёрж реквеста в гитлабе сделать код-ревью как описано в документации и запостить результат обратно.
- Или раз в сутки по крону проанализировать интернеты на предмет интересных постов об андроиде и принести тебе саммари в виде поста в телеграм бота/канал.
- Или каждые два часа запускать агента, что делать он сам определяет по заранее определённому техническому бэклогу проекта, анализирует это, предлагает решения в виде маркдаун спеки/плана (см. sdd).
Последний вариант я у себя локально на компе поднимал с помощью launchd + backlog.md + sh скрипт для запуска claude с соответствующим промптом. Он вполне даже работает, но этим просто как-то очень неуклюже пользоваться.
Сильно не хватает какого-то приятного интерфейса-конструктора такой системы пока. По сути надо просто научиться спавнить агентов по определённым триггерам, а всё остальное у нас уже есть. Ну и чтобы вопросы задавал, перед погружением в тему, которая вообще не нужна. Навайбкодить что ли. 🤔