Один лист оценки: обязательный артефакт для честной Evaluate
Как составить одностраничный 'Лист оценки' — обязательный артефакт Evaluate, который фиксирует цель, метрики, пороги, факты, guardrails и принятое решение.
Один лист оценки: обязательный артефакт для честной Evaluate
Фаза Evaluate — это момент истины для любого продуктового изменения. Но очень часто она превращается в хаотичное обсуждение, где мнения и эмоции заглушают данные. Чтобы избежать этого, в PTOS используется простой, но мощный инструмент — «Один лист оценки».
Если результаты вашего запуска нельзя уместить на один лист, скорее всего, вы не оцениваете, а оправдываетесь.
Этот артефакт служит единым источником правды, который заставляет команду быть честной с самой собой и принимать решения на основе фактов, а не домыслов.
Зачем нужен «Один лист оценки»?
- Дисциплина: Он заставляет команду заранее определить, что такое успех и как он будет измеряться.
- Прозрачность: Вся команда — от разработчиков до стейкхолдеров — видит одну и ту же картину, без искажений и «мелкого шрифта».
- Объективность: Фиксируя критерии до начала, вы защищаете себя от «подгонки» результатов под желаемый исход.
Структура «Одного листа оценки»
Вот шаблон, который можно использовать для оценки любого запуска — от небольшой фичи до нового продукта.
1. Цель изменения: Какую проблему мы решали и какое поведение хотели изменить?
- Пример: «Мы хотели увеличить долю пользователей, успешно создающих свой первый отчёт, так как заметили высокий отвал на этом шаге».
2. Целевая метрика (Outcome Metric): Какая одна метрика лучше всего отражает желаемое изменение поведения?
- Пример: «Процент новых пользователей, создавших первый отчёт в течение 24 часов после регистрации».
3. Окно измерения: В течение какого периода мы оцениваем результат?
- Пример: «14 дней после 100% раскатки изменения».
4. Пороги (Success / Fail / Grey): Какие значения метрики будут означать успех, провал или «серую зону»? (Фиксируются до старта)
- Пример:
Success:Рост метрики на 5 п.п. и более.Fail:Рост менее 1 п.п. или падение.Grey:Рост от 1 до 5 п.п. (сигнал есть, но слабый, нужна диагностика).
5. Факты (Данные + Наблюдения): Что мы увидели по факту?
- Пример:
- Данные: «Целевая метрика выросла на 7 п.п. (с 15% до 22%)».
- Наблюдения: «Из тикетов поддержки видим, что вопросы по созданию отчётов сократились на 30%».
6. Guardrails (Охранные метрики): Что мы не должны были сломать, и что с этим по факту?
- Пример:
- Guardrail: «Среднее время создания отчёта». Факт: Не изменилось.
- Guardrail: «Количество ошибок при создании отчёта». Факт: Снизилось на 15%.
7. Решение:
Что мы делаем дальше: Scale, Iterate, Rollback или Kill?
- Пример: «Решение: Scale. Изменение признано успешным. Включаем его в основной флоу продукта и переходим к следующей гипотезе по улучшению редактора отчётов».
Как это работает на практике?
- До запуска: Заполняются пункты 1, 2, 3, 4 и 6 (только названия
guardrail-метрик). Этот документ становится частьюLaunch Brief. - После запуска: В установленное «окно измерения» (пункт 3) команда собирает данные и заполняет пункты 5 и 6 (фактические значения).
- На
Evaluate-сессии: Команда смотрит на лист и принимает решение (пункт 7), основываясь на заранее определённых порогах. Никаких споров, никаких «мне кажется». Только факты и принятое на их основе решение.
«Один лист оценки» — это не бюрократия. Это инструмент гигиены мышления, который помогает командам быстро учиться, принимать сильные решения и строить продукты, которые действительно работают.