Checklist de Orçamento de Saída de Ferramenta MCP

Uma chamada de ferramenta pode estar correta e ainda assim quebrar o agente se retornar demais.

Resultados de busca, arquivos, transcrições, logs, raspagens de navegador e respostas de API aninhadas precisam de contratos de saída limitados para que o modelo receba a menor evidência segura, e não uma inundação de contexto.

Resposta rápida

A saída da ferramenta é parte do orçamento da rota. Um resultado MCP verboso pode consumir mais contexto do modelo do que a chamada que o produziu, tornando o próximo passo de planejamento mais lento, mais caro e menos recuperável.
Uma ferramenta MCP em produção precisa de um contrato de saída antes do lançamento: bytes máximos, registros máximos, formato do esquema, regra de resumo, entrega de artefato, política de redação e o exato recibo de negação ou truncamento quando a resposta excede o orçamento.
O teste útil não é se a ferramenta pode retornar um grande blob JSON. É se a mesma rota pode retornar o resultado mínimo seguro, apontar para um artefato durável quando necessário e provar o que foi omitido.
Se o rastreamento não puder explicar quantos bytes ou tokens foram retornados, por que a carga útil foi moldada dessa forma, qual artefato contém o resultado completo e como o agente pode solicitar a próxima página com segurança, a rota não está pronta para loops não supervisionados.

Lista de verificação de produção

1. Teto de saída por rota

Defina um tamanho máximo de resposta por rota, não apenas por servidor.

Um resultado de busca, resumo de arquivo, leitura de linha de banco de dados, extração de transcrição e raspagem de navegador não devem compartilhar um limite de carga útil genérico.

2. Esquema antes da prosa

Retorne campos tipados, ids estáveis, contagens de resultados, metadados de contagem omitida e cursores de próxima página antes da explicação em forma livre.

Deixe o modelo raciocinar sobre uma estrutura limitada em vez de despejos brutos.

3. Entrega de artefato

Quando a carga útil completa for muito grande, escreva-a em um artefato durável ou objeto de provedor e retorne:

referência
checksum
expiração
regra de acesso
rota de acompanhamento segura

Faça isso em vez de inundar o contexto.

4. Limite de sumarização

Nomeie se a ferramenta retornou:

dado bruto
campos extraídos
um resumo com perda
uma prévia amostrada

O recibo deve tornar a compressão com perda visível antes que o agente a trate como verdade absoluta.

5. Política de redação e uso de dados

Aplique redação antes da modelagem da carga útil.

Registre qual segredo, dados do cliente, credencial, prompt ou classe de topologia foi removida. O truncamento não é um controle de segurança.

6. Regra de paginação e reabastecimento

Exponha um cursor, intervalo, refinamento de consulta ou etapa de aprovação para mais dados.

Não deixe o agente repetir a mesma chamada excessiva esperando que a próxima resposta seja menor.

Correções de falha

Teste os casos de inundação de contexto antes que o agente os descubra em produção.

Resultado de busca excessivo

Esperado: retornar os principais resultados limitados, contagem total, contagem omitida, critérios de classificação e um cursor ou dica de refinamento. Não transmita cada correspondência para o contexto.

Arquivo ou transcrição grande

Esperado: retornar resumos de seção mais referência de artefato, intervalo de bytes, checksum e rota de extração de acompanhamento em vez de um despejo completo.

Resposta JSON aninhada

Esperado: achatar ou selecionar campos aprovados, incluir versão do esquema e recibo de objetos aninhados omitidos antes que o agente planeje a partir de dados parciais.

Campo sensível no resultado permitido

Esperado: redigir antes do truncamento e registrar a classe protegida.

Uma carga útil cortada após o segredo já retornado falha no controle.

Agente pede por “tudo” novamente

Esperado: negar ou exigir uma consulta mais restrita após a exaustão do orçamento.

O planejador não deve contornar o orçamento de saída reformulando o mesmo pedido amplo.

Campos de rastreamento

O recibo de saída deve tornar os dados omitidos auditáveis.

Uma vez que o agente avança, os operadores precisam saber se ele atuou com dados brutos, uma extração, um resumo ou uma prévia cortada. O rastreamento deve manter o tamanho da carga útil retornada, dados omitidos, redação, referências de artefato e ações permitidas em um só lugar.

Campos de rastreamento úteis:

id da rota e id da chamada da ferramenta
chamador / locatário / espaço de trabalho
classe de operação e classe de dados
teto de saída em bytes / registros / tokens
bytes reais e tokens estimados retornados
contagem bruta, contagem retornada e contagem omitida
versão do esquema e campos selecionados
regra de redação e classe protegida
modo de resumo / extração / dados brutos
id do artefato, checksum e expiração
cursor, intervalo ou rota de reabastecimento
decisão de política e código de negação / truncamento
id do recibo e ação seguinte permitida

Cartão de rota para copiar e colar

Rota MCP:
Chamador / locatário:
Classe de dados:
Bytes máximos / registros / tokens:
Campos permitidos / esquema:
Regra de resumo vs dados brutos:
Regra de entrega de artefato:
Regra de redação:
Rota de paginação / reabastecimento:
Código de negação ou truncamento de excesso:
Campos do recibo:

Erros comuns de interpretação

Otimizar as tentativas de chamada do provedor enquanto ignora que a carga útil retornada é o que realmente explode a conta do modelo.
Chamar uma ferramenta de leitura apenas e, portanto, segura, mesmo que possa vazar dados privados ou inundar o contexto com saída ilimitada.
Retornar um resumo em linguagem natural sem dizer quais campos foram descartados, amostrados, redigidos ou inferidos.
Usar truncamento como um caminho de sucesso silencioso. O agente deve saber que a resposta é parcial antes de agir.
Armazenar um artefato completo sem um checksum, expiração, regra de acesso ou rota para recuperar uma fatia mais restrita depois.
Deixar o agente tentar novamente a mesma consulta ampla após uma negação de orçamento de saída em vez de exigir uma consulta menor ou aprovação humana.

A lista de verificação completa está no Rhumb: https://rhumb.dev/blog/mcp-tool-output-budget-checklist