🧑‍💻 Вайб-кодинг стал слишком быстрым для реальности

Откровенно говоря, я, вероятно, достаточно буксую в AI-кодинге. У меня до сих пор нет нормального фреймворка для харнеса — то есть системы, где агенты друг друга погоняют, чтобы не останавливаться между задачами ради юзер-инпута, а просто работать долго.

🫠 Причины две. Во-первых, я не могу отпускать все на самотек. Как бы ты все ни распланировал, все равно где-то нужно будет вмешиваться, что-то решать и уводить агентов в другое русло. Во-вторых, в реальном мире задачи достаточно срочные. Тем более сейчас, когда их действительно стало возможно делать быстрее.

Если нужно напилить новый простой сервис или что-то похожее небольшое, то ты уже не можешь тратить на это условную неделю. В идеале через пару дней все уже должно работать. И в таком режиме очень сложно пробовать и настраивать разные подходы.

Мне нравится Swamp. Приглянулся тем, что по сути это просто набор правил, которые агенты сами себе еще и пишут при старте задачи. От тебя, по сути, ничего даже не требуется — оно будто бы работает само. Пока нравится, но серьезного эффекта от такой простой системы ожидать сложно.

🏎️ Все это не стоит на месте, а развивается быстрее, чем вообще можно за этим бежать. В Codex появилась фича «/goal», которая по сути помещает агентов в так называемую петлю Ральфа — Ralph loop. Агент делает задачу, потом другой агент выступает как судья, проверяет, все ли сделано, и принимает решение: вернуть задачу обратно на доработку или нет. В этом видео хорошо разобрана эта фича, но очень даже полезно будет тупо почитать официальную документацию.

🤡 Чуваки в твиттерах уже пишут, что благодаря «goal» их агенты работают по несколько часов и будто бы высирают что-то полезное. Мой личный рекорд работающего агента — 7 часов и 9 минут без всяких «/goal»)) Конечно же ту задачу он мог сделать значительно проще.

Я все больше склоняюсь к тому, что нужно просто пользоваться теми фичами, которые предоставляют топовые LLM-компании типа OpenAI и Anthropic, и не заморачиваться со всяким внешним тулингом. Потому что если какая-то техника оказывается очень эффективной, они просто добавят ее в свои продукты. В таком раскладе ты все еще, конечно же, переживаешь от FOMO, но в конечном итоге не многое теряешь.

🏁 В целом, если вы понимаете, о чем я тут пишу, то вы уже впереди большинства людей в области понимания AI.

Подпишешься на мой Telegram?