Aqui está o artigo com blocos de código markdown formatados corretamente — nenhum conteúdo alterado, apenas cercaduras limpas com três crases e dicas de linguagem apropriadas:

Arquitetura Prática de Agentes: Gerenciando Estado, Sanidade e Falhas de API

Lições do desenvolvimento de LLMs multi-produto e as variáveis ocultas que ditam a confiabilidade no mundo real.

Todo Agente É uma Fórmula

Um único prompt com regras e expectativas. É só isso.

Mas aqui está a questão. Nenhuma fórmula cobre tudo.

Sempre haverá condições que o prompt do sistema não previu. Estou chamando essa lacuna de delta.

δ (delta) = o conjunto completo de condições necessárias
            para um agente autônomo em auto-desenvolvimento funcionar corretamente

As empresas que estão construindo agentes hoje? Cada uma está encontrando um subconjunto de delta que impulsiona o comportamento autônomo. Está funcionando. Mas ninguém tem o conjunto completo ainda.

O Que Há Dentro do Delta?

Todos os prompts, padrões, embeddings, vetores, esquemas de uso de ferramentas, modos de pensamento, definições de habilidades são fórmulas.

Delta é a coleção de todas as suas variáveis.

fórmula = { δ }
       δ = { a, b, c, … n }
onde cada variável = uma condição, uma palavra, um padrão, uma regra

Exemplo de uma variável:

a = "Toda vez que um novo código é implementado, execute testes.
     Se bugs encontrados → envie para o agente de triagem de bugs."

Frase simples. Mas essa única linha é uma variável na fórmula do comportamento autônomo.

A Coisa Não É Mais Apenas um LLM

Chame de coisa, porque não é mais apenas um modelo de linguagem.

Para que essa coisa seja autônoma, ela precisa de três propriedades:

Padrão de crescimento dinâmico — Ela adapta seu comportamento ao longo do tempo
Direção — Ela sabe para onde está indo
Padrão de decisão — Ela sabe como escolher o que fazer a seguir

Autonomia de propósito geral = fórmula infinita.

Na prática, trabalhamos com uma interseção:

fórmula = δ ∩ { a, b, c }
onde a, b, c = as condições que fazem o LLM
                gerar as palavras-chave necessárias
                para atingir os resultados esperados

Como uma Cadeia de Palavras se Torna um Programa

Quando você solicita um LLM, está enviando uma cadeia de palavras. Os pesos de atenção do modelo determinam o que importa.

Exemplo simples:

"faça uma busca na web por llms hoje?"

O sistema detecta a intenção de busca na web → injeta o esquema da ferramenta → o modelo gera:

{
  "web_search": {
    "query": "llms hoje 10 de junho de 2026"
  }
}

O sistema chama a função. Os resultados voltam. O modelo responde — guiado pelo viés de atenção em seu prompt em direção aos tokens que tiveram as melhores pontuações.

Essa injeção, esse esquema, esse viés de atenção — todas variáveis delta.

Quatro Arquiteturas. Mesmo Delta. Tamanhos Diferentes.

Vamos rastrear o delta através de arquiteturas reais — tanto o caminho feliz quanto o triste.

1 · Chat AI (Claude, ChatGPT)

Arquitetura : LLM Sem Estado
Ferramentas     : Nenhuma
Memória       : Apenas janela de contexto
tamanho δ     : Pequeno

Caminho feliz:

Usuário: "Explique a atenção do transformer."
→ Sinal de intenção denso
→ Prompt do sistema injetado
→ Pesos de atenção "transformer", "atenção" como alta-relevância
→ Resposta transmitida
→ Estado desaparecido ✓

Caminho triste:

Usuário: "Me fale sobre isso."
→ Sem referente
→ Janela de contexto vazia
→ Atenção não tem nada para pesar
→ Resposta genérica ou alucinação ✗

Variáveis delta:

prompt_do_sistema: Viés em cada resposta
mensagem_do_usuario: A cadeia de palavras. A densidade de informação importa
temperatura: 0 = determinístico, 1 = desvio criativo
janela_de_contexto: Turnos anteriores = sinal + ruído

2 · Agente de Email Único

Arquitetura : Loop ReAct ×1
Ferramentas     : ler_email, rascunhar
Memória       : Estado de turno único
tamanho δ     : Médio

Caminho feliz:

"Leia meu último email da Sarah e rascunhe uma resposta."
→ read_email chamado
→ Corpo do email retornado ✓
→ Evidência pontuada: substancial + correspondência exata
→ Rascunho gerado
→ Guarda de efeito colateral: o agente afirmou que ENVIOU? Não → claro ✓

Caminho triste:

→ read_email retorna 401 Não Autorizado
→ Sem evidência
→ Agente ingênuo: inventa o conteúdo do email da Sarah e rascunha de qualquer maneira ✗
→ Agente correto: "Não consegui acessar o email. Por favor, reconecte-se." ✓

Novas variáveis delta adicionadas:

esquema_da_ferramenta: Definição JSON que o modelo gera chamadas contra
evidência_lane: Pontuação de prioridade dos resultados da ferramenta
contrato_do_loop: Emitir uma chamada de ferramenta válida OU resposta. Sem looping sem nova evidência.
guarda_de_efeito_colateral: Você afirmou a conclusão sem um resultado de ferramenta de apoio?

3 · Multi-Email + Documentos (MS Graph)

Arquitetura : ReAct loop ×N
Ferramentas     : ler_email, rascunhar, acessar_documento
Memória       : Estado de múltiplos turnos
tamanho δ     : Grande

Arquitetura Prática de Agentes: Estado, Recuperação de Falhas e Variáveis Ocultas de Sistemas LLM Confiáveis

Arquitetura Prática de Agentes: Gerenciando Estado, Sanidade e Falhas de API

Todo Agente É uma Fórmula

O Que Há Dentro do Delta?

A Coisa Não É Mais Apenas um LLM

Como uma Cadeia de Palavras se Torna um Programa

Quatro Arquiteturas. Mesmo Delta. Tamanhos Diferentes.

1 · Chat AI (Claude, ChatGPT)

2 · Agente de Email Único

3 · Multi-Email + Documentos (MS Graph)

Noticias relacionadas

Controle de Clusters Kubernetes com Agentes de IA

Quem paga quando a IA contrata outra IA?

Como construir um cérebro secundário impulsionado por Claude Code para trabalho em agência

Gostou do conteudo?