
Arquitetura Prática de Agentes: Estado, Recuperação de Falhas e Variáveis Ocultas de Sistemas LLM Confiáveis
Aqui está o artigo com blocos de código markdown formatados corretamente — nenhum conteúdo alterado, apenas cercaduras limpas com três crases e dicas de linguagem apropriadas:
Arquitetura Prática de Agentes: Gerenciando Estado, Sanidade e Falhas de API
Lições do desenvolvimento de LLMs multi-produto e as variáveis ocultas que ditam a confiabilidade no mundo real.
Todo Agente É uma Fórmula
Um único prompt com regras e expectativas. É só isso.
Mas aqui está a questão. Nenhuma fórmula cobre tudo.
Sempre haverá condições que o prompt do sistema não previu. Estou chamando essa lacuna de delta.
δ (delta) = o conjunto completo de condições necessárias
para um agente autônomo em auto-desenvolvimento funcionar corretamente
As empresas que estão construindo agentes hoje? Cada uma está encontrando um subconjunto de delta que impulsiona o comportamento autônomo. Está funcionando. Mas ninguém tem o conjunto completo ainda.
O Que Há Dentro do Delta?
Todos os prompts, padrões, embeddings, vetores, esquemas de uso de ferramentas, modos de pensamento, definições de habilidades são fórmulas.
Delta é a coleção de todas as suas variáveis.
fórmula = { δ }
δ = { a, b, c, … n }
onde cada variável = uma condição, uma palavra, um padrão, uma regra
Exemplo de uma variável:
a = "Toda vez que um novo código é implementado, execute testes.
Se bugs encontrados → envie para o agente de triagem de bugs."
Frase simples. Mas essa única linha é uma variável na fórmula do comportamento autônomo.
A Coisa Não É Mais Apenas um LLM
Chame de coisa, porque não é mais apenas um modelo de linguagem.
Para que essa coisa seja autônoma, ela precisa de três propriedades:
- Padrão de crescimento dinâmico — Ela adapta seu comportamento ao longo do tempo
- Direção — Ela sabe para onde está indo
- Padrão de decisão — Ela sabe como escolher o que fazer a seguir
Autonomia de propósito geral = fórmula infinita.
Na prática, trabalhamos com uma interseção:
fórmula = δ ∩ { a, b, c }
onde a, b, c = as condições que fazem o LLM
gerar as palavras-chave necessárias
para atingir os resultados esperados
Como uma Cadeia de Palavras se Torna um Programa
Quando você solicita um LLM, está enviando uma cadeia de palavras. Os pesos de atenção do modelo determinam o que importa.
Exemplo simples:
"faça uma busca na web por llms hoje?"
O sistema detecta a intenção de busca na web → injeta o esquema da ferramenta → o modelo gera:
{
"web_search": {
"query": "llms hoje 10 de junho de 2026"
}
}
O sistema chama a função. Os resultados voltam. O modelo responde — guiado pelo viés de atenção em seu prompt em direção aos tokens que tiveram as melhores pontuações.
Essa injeção, esse esquema, esse viés de atenção — todas variáveis delta.
Quatro Arquiteturas. Mesmo Delta. Tamanhos Diferentes.
Vamos rastrear o delta através de arquiteturas reais — tanto o caminho feliz quanto o triste.
1 · Chat AI (Claude, ChatGPT)
Arquitetura : LLM Sem Estado
Ferramentas : Nenhuma
Memória : Apenas janela de contexto
tamanho δ : Pequeno
Caminho feliz:
Usuário: "Explique a atenção do transformer."
→ Sinal de intenção denso
→ Prompt do sistema injetado
→ Pesos de atenção "transformer", "atenção" como alta-relevância
→ Resposta transmitida
→ Estado desaparecido ✓
Caminho triste:
Usuário: "Me fale sobre isso."
→ Sem referente
→ Janela de contexto vazia
→ Atenção não tem nada para pesar
→ Resposta genérica ou alucinação ✗
Variáveis delta:
prompt_do_sistema: Viés em cada resposta
mensagem_do_usuario: A cadeia de palavras. A densidade de informação importa
temperatura: 0 = determinístico, 1 = desvio criativo
janela_de_contexto: Turnos anteriores = sinal + ruído
2 · Agente de Email Único
Arquitetura : Loop ReAct ×1
Ferramentas : ler_email, rascunhar
Memória : Estado de turno único
tamanho δ : Médio
Caminho feliz:
"Leia meu último email da Sarah e rascunhe uma resposta."
→ read_email chamado
→ Corpo do email retornado ✓
→ Evidência pontuada: substancial + correspondência exata
→ Rascunho gerado
→ Guarda de efeito colateral: o agente afirmou que ENVIOU? Não → claro ✓
Caminho triste:
→ read_email retorna 401 Não Autorizado
→ Sem evidência
→ Agente ingênuo: inventa o conteúdo do email da Sarah e rascunha de qualquer maneira ✗
→ Agente correto: "Não consegui acessar o email. Por favor, reconecte-se." ✓
Novas variáveis delta adicionadas:
esquema_da_ferramenta: Definição JSON que o modelo gera chamadas contra
evidência_lane: Pontuação de prioridade dos resultados da ferramenta
contrato_do_loop: Emitir uma chamada de ferramenta válida OU resposta. Sem looping sem nova evidência.
guarda_de_efeito_colateral: Você afirmou a conclusão sem um resultado de ferramenta de apoio?
3 · Multi-Email + Documentos (MS Graph)
Arquitetura : ReAct loop ×N
Ferramentas : ler_email, rascunhar, acessar_documento
Memória : Estado de múltiplos turnos
tamanho δ : Grande
Empresas brasileiras que desenvolvem agentes autônomos podem se beneficiar ao entender as variáveis que influenciam o comportamento desses sistemas. A arquitetura discutida pode ajudar a otimizar a interação com usuários e melhorar a eficiência operacional. A compreensão do delta é crucial para garantir a confiabilidade e a adaptabilidade dos agentes.


