Keyd's Personal Blog > tech > Ship working code while you sleep with the Ralph Wiggum technique

Ship working code while you sleep with the Ralph Wiggum technique

20 мая 2026 г.

LLM анализ статьи

https://www.youtube.com/watch?v=_IK18goX4X8

Развёрнутая аннотация

Видео Matt Pocock показывает практический workflow для автономной работы AI coding agents: вместо сложных swarm/mesh/orchestrator-схем автор предлагает «Ralph Wiggum technique» — простой bash-цикл, который снова и снова запускает CLI-агента над небольшими задачами из prd.json. Центральная идея: агент должен брать ровно одну фичу, реализовывать её, проверять типы и тесты, обновлять PRD, дописывать progress.txt, делать git-commit и запускаться заново уже с чистым контекстом, но с памятью в файлах и истории git.

Pocock противопоставляет Ralph двум неудачным подходам: параллельному запуску многих агентов, который создаёт merge conflicts и проблемы зависимостей, и большим multi-phase plans, которые требуют тяжёлого upfront-планирования и плохо меняются. Ralph, по его аргументу, ближе к тому, как реально работают инженеры: взять задачу с доски, сделать, вернуться к списку, выбрать следующую.

Главный вклад видео — не «магический промпт», а инженерная обвязка: маленькие задачи, явные acceptance criteria, passes: true/false, append-only progress log, git-commits, CI, pnpm typecheck, pnpm test, browser automation и Playwright MCP. Автор также различает AFK-режим, который можно оставить на ночь, и human-in-the-loop режим через ralph-once.sh для обучения и ручного steering.

Введение и контекст

Название: “Ship working code while you sleep with the Ralph Wiggum technique”.
Канал/автор: Matt Pocock.
Дата публикации: 2026-01-05 по внешней карточке Podwise; YouTube-выдача также показывает это видео как опубликованное «4 months ago», что согласуется с текущей датой 2026-05-20. (Podwise)
Хронометраж: внешняя карточка указывает 16m; приложенный VTT заканчивается на 00:16:24.720, то есть фактический разбор длится примерно 16 минут 25 секунд. (Podwise)
Целевая аудитория: software engineers и технические лиды, которые уже используют или оценивают Claude Code, Codex, OpenCode и другие CLI-coding agents для реальной разработки, а не только для «vibe coding».
Заявленная цель: показать технику запуска coding agents, которая проще и практичнее, чем «agent swarms», «meshes» и «orchestrators», и позволяет получать рабочий код через long-running agents. Доступный фрагмент описания YouTube формулирует цель как демонстрацию техники запуска coding agents, которая делает orchestration «devilishly simple». (YouTube)
Контекст: автор связывает жизнеспособность подхода с тем, что современные модели стали достаточно сильными: в видео названы Opus 4.5 и GPT 5.2. Ralph приписывается Huntley; в VTT имя распознано как “Jeffrey Huntley”, внешние источники по теме указывают Geoffrey Huntley как автора Ralph Wiggum loop. (GitHub)
Закреплённый комментарий: в доступных данных не заявлено.
Ограничение по OCR: приложены VTT-транскрипты, но не видеофайл/кадры; поэтому неозвученный экранный текст не извлекался отдельно. Экранные элементы ниже включены только там, где они озвучены или явно присутствуют в транскрипте.

Ключевые выводы и результаты

Ralph нужен для мечты «проснуться утром к рабочему коду», но видео подчёркивает, что это работает не за счёт магии модели, а за счёт правильно устроенного цикла, маленьких задач и feedback loops.
Автор отвергает вариант с 16 AI agents, каждый из которых работает над отдельной задачей: это «hellish» из-за merge conflicts и скрытых зависимостей между задачами.
Один агент, который пытается сделать весь backlog за один контекст, тоже плохой вариант: задачи коллективно слишком велики для одного context window, агент путается и выдаёт плохой код.
Multi-phase plan лучше, чем один огромный prompt, но автор считает его неудобным: сложно добавлять новые items, нужно вручную понимать, куда они входят, и заранее выстраивать все зависимости.
Ralph ближе к реальной инженерной работе: взять item с доски, сделать, вернуться к доске, выбрать следующий highest-priority item.
В видео приведены sprint-примеры: one week sprints, two week sprints. Но для AI-coding автор говорит, что time boxing менее важен, потому что агент в теории имеет «infinite endurance».
В видео названы модели Opus 4.5 и GPT 5.2 как причина, почему простые подходы теперь становятся жизнеспособными.
В demo автор использует Opus 4.5 и говорит, что у него Claude Max 5X.
В demo распознан набор PRD items как “2123 27”; по контексту это выбранные items, после чего агент решает работать только над одной задачей: “beats display as three orange ellipses dots below clip.”
Acceptance criteria demo-фичи: под клипом должны появляться three orange dots, они должны быть orange colored и формировать ellipses pattern.
Проверки в demo: агент запускает typecheck и tests; оба проходят.
После реализации агент обновляет prd.json, дописывает progress.txt, делает commit, а затем автор вручную проверяет UI через right click → “add beat” и видит три оранжевые точки.
Quantitative/explicit values from video:
- max number of iterations — задаётся при запуске ralph.sh;
- one feature per iteration;
- one week / two week sprints как примеры;
- 16 AI agents как отвергнутый вариант;
- three orange dots как acceptance criterion;
- Opus 4.5, GPT 5.2, Claude Max 5X;
- V5 и V6 для курса AI SDK;
- 3 months ago — автор сравнивает новый стиль coding workflow с тем, что было три месяца назад;
- couple years time и 2 years from now — автор ожидает, что индустрия придёт к общему пониманию эффективного использования таких tools.
Стоимость, token usage, точные проценты успешности, скорость выполнения, SLA, benchmark-метрики и экономический эффект в видео не заявлены.

Методы и фреймворки

Ralph Wiggum technique / Ralph loop. Метод состоит в том, что CLI-agent запускается в bash-цикле, каждый раз получает PRD и progress log, делает одну задачу, фиксирует результат и завершает итерацию.
Bash loop с stop condition. Скрипт принимает maximum iterations, выполняет for loop, запускает coding agent и завершает работу либо при достижении лимита, либо при <promise>COMPLETE</promise>.
PRD as executable backlog. prd.json содержит user stories и критерии проверки. Поле passes превращает PRD в todo-list: false означает «ещё не сделано», true — «проходит в приложении».
Append-only memory. progress.txt — свободный текстовый лог, куда агент дописывает learnings. Это память между context windows.
Git history as memory. После каждой итерации агент делает commit. Следующий агент может смотреть git history и progress.txt, чтобы понять, что уже произошло.
Single-feature discipline. Каждая итерация должна делать только одну фичу. Это снижает деградацию качества из-за раздувания context window.
Feedback loops. Автор называет typecheck, unit tests, CI, browser automation и Playwright MCP как способы дать агенту объективный сигнал, что код работает.
Anthropic “Effective Harnesses for Long-Running Agents”. Автор говорит, что вдохновлялся этой статьёй, особенно идеями progress.txt, JSON-based PRD и robust feedback loops.
AFK Ralph. Асинхронный режим: агент работает без присутствия пользователя, потенциально overnight.
Human-in-the-loop Ralph / ralph-once.sh. Интерактивный одноразовый запуск: полезен для сложных фич, steering и понимания, что делает агент.
Agile/Kanban analogy. Автор использует sprint/backlog/Kanban board как метафору: Ralph не требует заранее расписанного path; он работает как инженер, который берёт следующую задачу с доски.

Ключевые идеи и концепции

Ralph ценен не тем, что он «умнее» сложных orchestrators, а тем, что снимает лишнюю сложность. Авторский тезис: для текущих сильных моделей простая петля может быть лучше тяжёлого orchestration framework.
Проблема multi-phase plan в том, что он заставляет человека заранее проектировать порядок работ и зависимости. Ralph переносит фокус с “how exactly to build” на “what should be true when done”.
Ralph отражает реальный инженерный цикл: выбрать задачу, сделать, проверить, зафиксировать, перейти к следующей.
Context window — ключевое ограничение. Если заставить LLM делать слишком много за один запуск, качество падает. Поэтому Ralph очищает context между итерациями, но сохраняет состояние в prd.json, progress.txt и git.
Важный компромисс: очистка контекста помогает избежать перегруза, но создаёт риск, что агент забудет источник плохого изменения. Поэтому каждый commit должен быть маленьким, а CI должен оставаться green.
Feedback loops важнее красивой архитектуры prompt’а. Без typecheck, tests и end-to-end verification агент может преждевременно пометить feature как complete.
Browser automation повышает качество проверки UI, но тратит context budget. Поэтому UI-задачи особенно важно дробить на маленькие pieces.
Human-in-the-loop режим не противоречит Ralph: он нужен для сложных участков, обучения и постепенного роста доверия к автономному loop.
Роль разработчика смещается: меньше ручного пошагового планирования реализации, больше формулирования требований, acceptance criteria, качества и проверки.
Автор явно снижает hype в финале: «dev branch is always wackier than the main branch». То есть текущие практики экспериментальны; часть из них сработает, часть изменится.
При этом фундамент разработки, по словам автора, остаётся прежним: переводить «weird dreams» людей в код и язык, понятный компьютерам.

Практические выводы и шаги

Создать plans/ralph.sh, который запускает CLI-coding agent в цикле и принимает maximum number of iterations.
Подготовить prd.json как structured PRD: user stories, конкретные verification steps, passes: false для невыполненных items.
Подготовить progress.txt как append-only журнал learnings.
В prompt передавать оба файла: @plans/prd.json и @plans/progress.txt.
Заставить агента выбирать highest-priority incomplete feature, а не механически первый item.
Ограничить итерацию одной feature.
После реализации запускать pnpm typecheck и pnpm test.
После успешной проверки обновлять prd.json, меняя релевантные passes на true.
Дописывать прогресс в progress.txt, а не переписывать файл целиком.
Делать git commit после каждой feature.
Добавить early stop: если PRD complete, агент выводит <promise>COMPLETE</promise>, а loop завершается.
Держать PRD items маленькими; не смешивать огромные features с мелкими задачами.
Для UI-фич добавлять browser automation / Playwright MCP, но учитывать, что это context-expensive.
Для сложных задач использовать ralph-once.sh в interactive terminal, чтобы steering оставался у человека.
После выполнения проходить код, проверять поведение вручную и при необходимости менять PRD.

Ссылки/таймкоды

00:00:00 — вступление: обещание показать способ получить working code от coding agents.
00:00:24 — ключевой тезис: вместо swarms/meshes/orchestrators можно использовать for loop.
00:00:42 — вводится название Ralph Wiggum.
00:00:58 — названы Opus 4.5 и GPT 5.2 как причина жизнеспособности простого подхода.
00:01:17 — объяснение sprint/backlog через agile terminology.
00:02:01 — почему не стоит запускать 16 AI agents параллельно.
00:02:23 — проблема одного большого context window.
00:02:36 — multi-phase plan как предыдущий подход автора.
00:03:49 — аналогия с Kanban board и реальным рабочим циклом инженера.
00:04:36 — определение Ralph: “Ralph is a bash loop.”
00:05:15 — запуск ralph.sh с maximum number of iterations.
00:05:47 — можно использовать Claude Code, OpenCode, Codex или другой CLI-agent.
00:06:00 — plans/prd.json как JSON file с user stories.
00:06:18 — пример feature “beats”: три orange ellipses dots below the clip.
00:06:37 — passes flag как индикатор прохождения/готовности.
00:07:05 — progress.txt как free text log и память спринта.
00:07:43 — шаг 1: выбрать highest-priority feature и работать только над ней.
00:08:04 — append progress to progress.txt.
00:08:21 — git commit после каждой feature.
00:08:44 — правило “only work on a single feature.”
00:09:42 — completion signal <promise>COMPLETE</promise>.
00:10:28 — feedback loops как условие working code.
00:10:33 — pnpm typecheck и pnpm test.
00:10:39 — CI must stay green.
00:11:09 — ссылка автора на Anthropic “Effective Harnesses for Long-Running Agents”.
00:11:32 — browser automation и testing “as a human user would”.
00:11:49 — Playwright MCP полезен, но context expensive.
00:12:04 — AFK Ralph / away from keyboard режим.
00:12:23 — ralph-once.sh для human-in-the-loop.
00:12:49 — demo с Opus 4.5 и Claude Max 5X.
00:13:18 — агент создаёт Beat Indicator component и внедряет его в код.
00:13:25 — typecheck и tests проходят.
00:13:43 — ручная проверка: right click → add beat → появляются три orange dots.
00:14:35 — разработчик становится requirements gatherer / product designer.
00:15:01 — нужны more tests, higher quality tests, non-flaky tests, MCP server и сильные types.
00:15:44 — автор сравнивает новый стиль с workflow «3 months ago».
00:15:52 — “dev branch is always wackier than the main branch.”
00:16:17 — финальный тезис: фундамент разработки — переводить человеческие идеи в код — не исчезает.