
Construindo um Fluxo de Trabalho Confiável com LangGraph: Planejar-Executar-Validação (PEV)
A maioria dos exemplos de agentes LangGraph para na frase "olá mundo". Um planejador básico, um executor que chama uma ferramenta de busca e um resultado final impresso. Isso é bom para uma demonstração, mas no momento em que você tenta implementar um agente autônomo em produção, você imediatamente se depara com os mesmos quatro problemas:
- Como posso evitar que um agente alucine silenciosamente detalhes ausentes entre as etapas?
- Como posso construir um loop de autocorreção que capture saídas ruins de ferramentas antes que elas contaminem a resposta final?
- Como posso otimizar custos para não usar modelos de raciocínio caros para simples tarefas administrativas?
- Como posso integrar com segurança essa camada de orquestração com dados e capacidades empresariais?
Eu passei um tempo resolvendo todos esses problemas em um ambiente de produção real - uma plataforma de ciências da vida regulamentada automatizando fluxos de trabalho científicos sobre dezenas de milhões de registros de pesquisa - e empacotei o resultado como um modelo que qualquer um pode usar: langgraph-plan-execute-validate.
Este post explica as decisões por trás de cada parte.
O que é PEV e por que precisa de um modelo de produção?
O padrão padrão LangGraph de Planejar e Executar tem dois nós: Planejar e Executar. A diferença entre esse rápido início de dois nós e um serviço confiável e implantável é significativa.
Em produção, a qualidade da execução não é binária. Um agente pode tecnicamente completar uma etapa enquanto produz uma saída que é incompleta, alucinatória ou que falta um detalhe crítico. Sem um portão de qualidade, essas falhas se propagam silenciosamente para a próxima etapa.
Você precisa:
- Um Validador estruturado para pontuar saídas
- Um Roteador determinístico para lidar com tentativas e replanejamento
- Uma Trilha de Auditoria para depurar o que realmente aconteceu
- Uma estratégia de múltiplos modelos custo-efetiva
O modelo fornece tudo isso interconectado e funcionando imediatamente.
| Recurso | Padrão planejar-executar | Este modelo |
|---|---|---|
| Nó de planejamento | ✓ | ✓ |
| Nó de execução com chamadas de ferramenta | ✓ | ✓ |
| Validação + pontuação de confiança | ✗ | ✓ 0.0 – 1.0 |
| Tentativa por etapa com injeção de feedback | ✗ | ✓ configurável |
| Replanejamento automático em tentativas esgotadas | ✗ | ✓ com contexto de falha |
| Otimização de custo de múltiplos modelos | ✗ | ✓ divisão haiku/soneto |
| Trilha de auditoria completa (cada tentativa) | ✗ | ✓ operador.add acumulador |
| Saídas estruturadas (sem análise de string) | ✗ | ✓ modelos Pydantic |
A Arquitetura
O gráfico adiciona dois nós ao padrão padrão: um Validador que pontua cada saída de etapa e um Roteador (Python puro, sem LLM) que decide o que acontece a seguir.
INÍCIO
│
planejador ◄──────────────────────────────────────── (replanejar)
│
executor ◄─────────────────────────────── (tentar novamente)
│
validador
│
roteador ─── pontuação ≥ limite, mais etapas ──► executor (próxima etapa)
─── pontuação ≥ limite, última etapa ──► FIM (completo)
─── pontuação < limite, tentativas restantes ──► executor (tentar novamente)
─── pontuação < limite, tentativas esgotadas ──► planejador (replanejar)
─── todos os limites esgotados ──► FIM (falhou)
Visão Geral do Sistema
Máquina de Estados
Problema 1: Falhas Silenciosas em Fluxos de Trabalho de 2 Nós
A abordagem ingênua é passar a saída do Executor diretamente para a próxima etapa. Se a Etapa 1 retornar "Não consegui encontrar os dados", o Executor muitas vezes simplesmente passa para a Etapa 2, alucinado pelo contexto ausente.
O modelo resolve isso introduzindo um terceiro nó: um Validador estruturado que pontua cada saída de etapa (0.0–1.0) em relação à intenção original.
cfg = PEVConfig(
# Portão de qualidade
pass_threshold = 0.80, # pontuação >= isso -> etapa passa
# Guardas de Loop
max_retries = 2, # tentativas por etapa antes de escalar para replanejamento
max_replans = 1, # ciclos completos de replanejamento antes de marcar como falhado
)
Se a pontuação estiver abaixo do pass_threshold, o sistema não avança - ele se recupera. O validador produz uma saída estruturada com uma pontuação numérica e uma explicação de uma frase, que é injetada no prompt da próxima tentativa.
Problema 2: Tentativas Automáticas e Replanejamento
Quando uma execução falha na validação, lançar uma exceção ou falhar toda a execução é frágil. O LLM precisa de uma chance de se corrigir.
O modelo usa um nó Roteador em Python puro que implementa uma lógica de recuperação determinística. Quando uma etapa pontua abaixo do limite, o Roteador injeta o feedback do Validador diretamente no próximo prompt e aciona uma nova tentativa:
# O Roteador decide como se recuperar - sem LLM envolvido
if score >= cfg.pass_threshold:
next_idx = idx + 1
if next_idx >= len(plan):
return {"statusContexto Triplo UpEmpresas brasileiras que utilizam agentes de IA podem se beneficiar de um fluxo de trabalho estruturado que minimiza falhas e otimiza custos. A implementação de um sistema de validação e recuperação pode aumentar a confiabilidade dos serviços automatizados, essencial em setores regulados.
Noticias relacionadas

Além do RAG: Por que cada plataforma de busca em IA agora é agentiva e o que isso significa para seu conteúdo
A busca em IA evoluiu além do RAG simples. Entenda como os sistemas de recuperação de IA decidem se seu conteúdo será exibido ou filtrado.

Fontes Preferenciais se Expandem, Aumento de Visibilidade de Marca no Gmail, Pichai Sobre Visões Gerais de IA
Google expande Fontes Preferenciais para Visões Gerais de IA e Modo IA, destacando a importância da lealdade do leitor. Novos dados mostram que o conteúdo do Gmail aumenta a visibilidade de marca no Modo IA.

Desmistificando a Onda da IA: Um Guia para Engenheiros de Backend sobre LLMs, RAG e Agentes
Este artigo explora LLMs, RAG e o protocolo MCP, oferecendo uma visão clara para engenheiros de software sobre como construir com IA. A abordagem prática ajuda a entender como integrar agentes de IA em sistemas existentes.
Gostou do conteudo?
Receba toda semana as principais novidades sobre WebMCP.
