Contexto Operação
Operação é parte do método desde o desenho. Sistemas que só podem ser explicados ou mantidos pelos construtores não estão prontos para transferência.
Responsabilidades
Seção intitulada “Responsabilidades”- activation readiness e go-live;
- configuração de SLOs, alertas e escalations;
- operação de humans, agents, workflows e integrations;
- gestão de incidentes, restrição, rollback e kill;
- monitoramento de qualidade, freshness, lineage e drift;
- budget, usage, cost allocation e capacity planning;
- outcome measurement e value reconciliation;
- revisão de autonomia e policies;
- captura de learning candidates;
- expansão, reforma ou retirada.
Operação sociotécnica
Seção intitulada “Operação sociotécnica”Incidentes podem surgir de dado, modelo, agente, processo, authority, interface, incentivo ou ambiguidade semântica. O runbook deve indicar como diferenciar essas classes e quem assume o controle.
Observability Contract
Seção intitulada “Observability Contract”Define sinais, frequência, thresholds, owners, SLOs, retention, dashboards, alerts e ações permitidas. Observabilidade sem resposta definida é apenas visualização.
Value review
Seção intitulada “Value review”A operação compara baseline, expectativa, resultado, custo e contexto. Value reconciliation não serve apenas para marketing; serve para continuar, reformar, expandir ou encerrar.
Aprendizagem
Seção intitulada “Aprendizagem”Traces e outcomes geram candidatos. Antes de virar capability ou padrão, cada candidato precisa de curadoria, anonimização quando necessária, eval e promoção. Agentes podem propor; uma authority nomeada promove.