
Checklist de Orçamento de Saída de Ferramenta MCP
Uma chamada de ferramenta pode estar correta e ainda assim quebrar o agente se retornar demais.
Resultados de busca, arquivos, transcrições, logs, raspagens de navegador e respostas de API aninhadas precisam de contratos de saída limitados para que o modelo receba a menor evidência segura, e não uma inundação de contexto.
Resposta rápida
- A saída da ferramenta é parte do orçamento da rota. Um resultado MCP verboso pode consumir mais contexto do modelo do que a chamada que o produziu, tornando o próximo passo de planejamento mais lento, mais caro e menos recuperável.
- Uma ferramenta MCP em produção precisa de um contrato de saída antes do lançamento: bytes máximos, registros máximos, formato do esquema, regra de resumo, entrega de artefato, política de redação e o exato recibo de negação ou truncamento quando a resposta excede o orçamento.
- O teste útil não é se a ferramenta pode retornar um grande blob JSON. É se a mesma rota pode retornar o resultado mínimo seguro, apontar para um artefato durável quando necessário e provar o que foi omitido.
- Se o rastreamento não puder explicar quantos bytes ou tokens foram retornados, por que a carga útil foi moldada dessa forma, qual artefato contém o resultado completo e como o agente pode solicitar a próxima página com segurança, a rota não está pronta para loops não supervisionados.
Lista de verificação de produção
1. Teto de saída por rota
Defina um tamanho máximo de resposta por rota, não apenas por servidor.
Um resultado de busca, resumo de arquivo, leitura de linha de banco de dados, extração de transcrição e raspagem de navegador não devem compartilhar um limite de carga útil genérico.
2. Esquema antes da prosa
Retorne campos tipados, ids estáveis, contagens de resultados, metadados de contagem omitida e cursores de próxima página antes da explicação em forma livre.
Deixe o modelo raciocinar sobre uma estrutura limitada em vez de despejos brutos.
3. Entrega de artefato
Quando a carga útil completa for muito grande, escreva-a em um artefato durável ou objeto de provedor e retorne:
- referência
- checksum
- expiração
- regra de acesso
- rota de acompanhamento segura
Faça isso em vez de inundar o contexto.
4. Limite de sumarização
Nomeie se a ferramenta retornou:
- dado bruto
- campos extraídos
- um resumo com perda
- uma prévia amostrada
O recibo deve tornar a compressão com perda visível antes que o agente a trate como verdade absoluta.
5. Política de redação e uso de dados
Aplique redação antes da modelagem da carga útil.
Registre qual segredo, dados do cliente, credencial, prompt ou classe de topologia foi removida. O truncamento não é um controle de segurança.
6. Regra de paginação e reabastecimento
Exponha um cursor, intervalo, refinamento de consulta ou etapa de aprovação para mais dados.
Não deixe o agente repetir a mesma chamada excessiva esperando que a próxima resposta seja menor.
Correções de falha
Teste os casos de inundação de contexto antes que o agente os descubra em produção.
Resultado de busca excessivo
Esperado: retornar os principais resultados limitados, contagem total, contagem omitida, critérios de classificação e um cursor ou dica de refinamento. Não transmita cada correspondência para o contexto.
Arquivo ou transcrição grande
Esperado: retornar resumos de seção mais referência de artefato, intervalo de bytes, checksum e rota de extração de acompanhamento em vez de um despejo completo.
Resposta JSON aninhada
Esperado: achatar ou selecionar campos aprovados, incluir versão do esquema e recibo de objetos aninhados omitidos antes que o agente planeje a partir de dados parciais.
Campo sensível no resultado permitido
Esperado: redigir antes do truncamento e registrar a classe protegida.
Uma carga útil cortada após o segredo já retornado falha no controle.
Agente pede por “tudo” novamente
Esperado: negar ou exigir uma consulta mais restrita após a exaustão do orçamento.
O planejador não deve contornar o orçamento de saída reformulando o mesmo pedido amplo.
Campos de rastreamento
O recibo de saída deve tornar os dados omitidos auditáveis.
Uma vez que o agente avança, os operadores precisam saber se ele atuou com dados brutos, uma extração, um resumo ou uma prévia cortada. O rastreamento deve manter o tamanho da carga útil retornada, dados omitidos, redação, referências de artefato e ações permitidas em um só lugar.
Campos de rastreamento úteis:
- id da rota e id da chamada da ferramenta
- chamador / locatário / espaço de trabalho
- classe de operação e classe de dados
- teto de saída em bytes / registros / tokens
- bytes reais e tokens estimados retornados
- contagem bruta, contagem retornada e contagem omitida
- versão do esquema e campos selecionados
- regra de redação e classe protegida
- modo de resumo / extração / dados brutos
- id do artefato, checksum e expiração
- cursor, intervalo ou rota de reabastecimento
- decisão de política e código de negação / truncamento
- id do recibo e ação seguinte permitida
Cartão de rota para copiar e colar
Rota MCP:
Chamador / locatário:
Classe de dados:
Bytes máximos / registros / tokens:
Campos permitidos / esquema:
Regra de resumo vs dados brutos:
Regra de entrega de artefato:
Regra de redação:
Rota de paginação / reabastecimento:
Código de negação ou truncamento de excesso:
Campos do recibo:
Erros comuns de interpretação
- Otimizar as tentativas de chamada do provedor enquanto ignora que a carga útil retornada é o que realmente explode a conta do modelo.
- Chamar uma ferramenta de leitura apenas e, portanto, segura, mesmo que possa vazar dados privados ou inundar o contexto com saída ilimitada.
- Retornar um resumo em linguagem natural sem dizer quais campos foram descartados, amostrados, redigidos ou inferidos.
- Usar truncamento como um caminho de sucesso silencioso. O agente deve saber que a resposta é parcial antes de agir.
- Armazenar um artefato completo sem um checksum, expiração, regra de acesso ou rota para recuperar uma fatia mais restrita depois.
- Deixar o agente tentar novamente a mesma consulta ampla após uma negação de orçamento de saída em vez de exigir uma consulta menor ou aprovação humana.
A lista de verificação completa está no Rhumb: https://rhumb.dev/blog/mcp-tool-output-budget-checklist
Empresas brasileiras devem implementar contratos de saída para ferramentas MCP para evitar sobrecarga de contexto e garantir eficiência em chamadas de API. Isso é crucial para otimizar o desempenho de agentes de IA em produção, reduzindo custos e melhorando a recuperação de dados.


