
Criei um servidor MCP que cobra agentes de IA por chamada usando micropagamentos x402
Eu construí um servidor MCP que cobra agentes de IA por chamada usando micropagamentos x402
Por Toolstem
Você construiu um servidor MCP. Os agentes o chamam. Você paga os custos da API. Eles não pagam nada. Cada invocação de tools/call consome alguns centavos do seu orçamento enquanto o agente que a acionou não tem ideia — e nenhum incentivo para se importar. A resposta padrão é "embalar em uma assinatura SaaS", mas isso requer um humano no loop para se inscrever, inserir um cartão e gerenciar um relacionamento de cobrança. A maioria dos agentes não tem humanos observando cada chamada. E se o agente simplesmente pagasse por seus próprios dados, automaticamente, sem um humano em nenhum lugar do loop?
Foi isso que eu construí. Aqui está o que eu aprendi.
O que é realmente o x402
HTTP 402 — "Pagamento Necessário" — existe desde 1996. Foi reservado para uso futuro e então essencialmente esquecido por 28 anos. O protocolo x402 o revive como um padrão de pagamento máquina-a-máquina baseado no EIP-3009.
O fluxo é assim:
- O agente acessa seu endpoint com uma solicitação normal
- O servidor retorna HTTP 402 com um corpo JSON: valor do pagamento, endereço do destinatário, rede, token, nonce
- O agente assina uma
transferWithAuthorizationEIP-3009 — uma transferência USDC pré-autorizada que o servidor pode enviar em nome do agente - O agente tenta novamente a solicitação com um cabeçalho
X-Paymentcontendo a autorização assinada - O servidor verifica a assinatura na cadeia, envia a transferência e responde com os dados
- Liquidação confirmada em menos de 2 segundos na mainnet Base; o gás é aproximadamente $0.001
Sem conta Stripe. Sem fluxo OAuth. Sem inscrição humana. Sem esperar por uma fatura mensal. O agente paga exatamente o que usou, liquidado atomicamente, sem nunca precisar de ETH para gás (o servidor envia a transferência, então apenas o servidor precisa de um pequeno saldo de ETH para gás — o agente só precisa de USDC).
Esse é o "HTTP + pagamento" primitivo que deveria ter existido o tempo todo. Está pré-produto-adequação ao mercado, mas a mecânica subjacente é sólida.
A arquitetura
A infraestrutura central é um Cloudflare Worker atuando como um proxy de paywall. Ele fica entre a internet pública e seu servidor MCP upstream, interceptando cada solicitação antes de encaminhá-la.
Agente → Cloudflare Worker (paywall x402) → Servidor MCP Upstream → Fontes de dados
O Worker gerencia o ciclo de vida do pagamento:
- Recebe a solicitação
- Verifica se há um cabeçalho
X-Paymentválido - Se ausente: retorna 402 com detalhes do pagamento
- Se presente: verifica a assinatura EIP-3009, verifica a frescura do nonce e o valor, envia a transferência na cadeia
- Encaminha para o MCP upstream apenas em caso de verificação bem-sucedida
Uma restrição não óbvia: initialize e tools/list devem ser gratuitos. Os agentes precisam descobrir sua superfície de ferramentas antes de decidirem se vão pagar. Se você cobrar pela descoberta, nunca será chamado. Qualquer verificação de saúde de diretório (Glama, mcp.so, PulseMCP) também espera uma resposta gratuita de tools/list — se você colocar um paywall, você sai das listagens. O Cloudflare Worker roteia esses dois tipos de mensagens MCP para um caminho não medido.
Precificação por ferramenta é onde o modelo se torna interessante. Nosso servidor SEC EDGAR opera em três níveis:
| Ferramenta | Nível | Por chamada |
|---|---|---|
getCompanyFilingsSummary |
Barato | $0.005 |
getInsiderSignal |
Padrão | $0.05 |
getInstitutionalSignal |
Padrão | $0.05 |
getMaterialEventsDigest |
Premium | $0.50 |
compareDisclosureSignals |
Premium | $0.50 |
Um resumo de arquivamentos é uma consulta EDGAR. compareDisclosureSignals faz a referência cruzada de negociações de insiders, movimentos institucionais 13F e clusters 8-K entre várias empresas. A diferença de computação é de aproximadamente 100x — então a diferença de preço é 100x. A precificação fixa trata-os de forma idêntica, o que significa que você está subsidiando cada chamada cara com a receita das chamadas baratas.
O servidor Finance MCP (nosso primeiro servidor) foi lançado a um preço fixo de $0.005 em todas as ferramentas. Seis semanas depois, tivemos $0 de receita. Aquela tabela acima é a lição.
Código: lado do agente
A integração LangChain envolve a camada de pagamento em uma função fetch personalizada. Todo o resto é código padrão do agente.
TypeScript / LangChain.js:
import { createReactAgent } from "@langchain/langgraph/prebuilt";
import { createFinanceTools } from "langchain-toolstem/finance";
import { createX402Fetch } from "langchain-toolstem/x402";
// fetch que assina automaticamente pagamentos USDC em HTTP 402
const fetchPay = await createX402Fetch({
privateKey: process.env.X402_PRIVATE_KEY!,
maxPaymentUsd: 0.05, // limite de segurança por chamada
});
// descobre ferramentas ao vivo via MCP tools/list (gratuito)
const tools = await createFinanceTools({ fetch: fetchPay});
const agent = createReactAgent({ llm, tools });
// cada tools/call custa $0.01 USDC, liquidado na mainnet Base
O wrapper createX402Fetch intercepta qualquer resposta 402, assina a autorização EIP-3009 usando a chave privada do agente e tenta novamente de forma transparente. O limite maxPaymentUsd é uma proteção — o agente se recusa a assinar qualquer autorização acima desse limite, protegendo contra um servidor mal configurado ou malicioso que cita um preço inesperado.
As ferramentas são descobertas ao vivo via tools/list na inicialização (gratuito, não medido), então o agente sempre vê a superfície de ferramentas atual sem nada codificado no pacote.
Python / LangChain:
A implementação de micropagamentos automáticos pode revolucionar a forma como as empresas brasileiras interagem com agentes de IA, permitindo uma gestão de custos mais eficiente. Isso pode facilitar a adoção de soluções baseadas em IA, reduzindo barreiras de entrada e incentivando a inovação.
Noticias relacionadas

Como conectar Postgres ao Claude (e fazer funcionar para sua equipe)
Conectar Postgres ao Claude é simples para um usuário, mas para equipes, surgem problemas de confiabilidade e gestão. O artigo explora soluções para otimizar essa integração.

Gemini CLI e MCP Remoto: Executando Operações de Formulário pelo Terminal
O Gemini CLI se torna mais interessante ao se conectar a um servidor MCP remoto, permitindo criar e gerenciar formulários diretamente do terminal. O artigo explora a configuração e autenticação com OAuth usando o FORMLOVA como exemplo.

Usando Conectores Personalizados do ChatGPT com um Servidor de Formulário MCP Remoto
O artigo explora como o ChatGPT pode interagir com um servidor MCP remoto para criar e operar formulários, detalhando o processo de configuração e uso do FORMLOVA.
Gostou do conteudo?
Receba toda semana as principais novidades sobre WebMCP.