Agentes de IA Escolhem Ferramentas de Forma Aleatória

Conectei meu agente de IA a 3 servidores MCP.

Ele escolheu um aleatoriamente.

Ele teve um tempo limite. Então tentou um diferente. Finalmente conseguiu um que funcionou.

$ node without-xaip.js

→ Tentando: unknown-server...
  ✗ erro — pacote não encontrado (8.2s)

→ Tentando: sequential-thinking...
  ✓ conectado — mas ferramenta errada para a tarefa de docs

→ Tentando: context7...
  ✓ sucesso (3.1s)

Total: 11.3 segundos, 2 chamadas desperdiçadas

Agora há mais de 1.000 servidores MCP. Seu agente não tem como saber quais são confiáveis, quais estão quebrados e quais são os mais adequados.

Então eu construí uma solução: uma chamada de API que escolhe o servidor certo primeiro.

$ node with-xaip.js

→ XAIP selecionado: context7 (confiança: 1.0, 248 execuções verificadas)
  ✓ sucesso (3.1s)

Total: 3.1 segundos, 0 chamadas desperdiçadas

Isso é XAIP — pontuação de confiança para agentes de IA, respaldada por dados de execução reais. Não benchmarks. Não métricas auto-relatadas. Resultados reais de chamadas de ferramentas, assinados criptograficamente.

Uma API ao vivo que você pode experimentar agora

Sem cadastro, sem chave de API. Apenas curl:

# Pontuação de confiança para um servidor MCP específico
curl https://xaip-trust-api.kuma-github.workers.dev/v1/trust/context7

{
  "slug": "context7",
  "trust": 1.0,
  "verdict": "confiável",
  "receipts": 248,
  "confidence": 1,
  "source": "xaip-aggregator (quorum:1)",
  "riskFlags": [],
  "computedFrom": "248 recibos via XAIP Aggregator BFT (1 nós)"
}

Ou deixe o XAIP escolher o melhor servidor para sua tarefa:

curl -X POST https://xaip-trust-api.kuma-github.workers.dev/v1/select \
  -H "Content-Type: application/json" \
  -d '{
    "task": "Buscar documentação do React",
    "candidates": ["context7", "sequential-thinking", "unknown-server"]
  }'

{
  "selected": "context7",
  "reason": "Maior confiança (1) de 248 execuções verificadas",
  "rejected": [
    { "slug": "unknown-server", "reason": "sem pontuação — sem dados de execução" }
  ],
  "withoutXAIP": "Seleção aleatória escolheria um servidor sem pontuação 33% das vezes — sem dados de execução, sem garantia de segurança"
}

O campo withoutXAIP existe para tornar o risco visível. É a resposta para "por que eu preciso disso?".

Como funciona

XAIP tem três partes móveis:

1. API de Confiança — Retorna pontuações de confiança para servidores MCP. As pontuações vêm de dados de execução reais, não de métricas auto-relatadas.

2. Motor de Decisão — POST /v1/select recebe uma tarefa e uma lista de servidores candidatos, retorna a melhor escolha com raciocínio. Servidores sem pontuação são automaticamente excluídos.

3. Agregador — Coleta recibos de execução assinados com Ed25519. Cada chamada de ferramenta produz um recibo criptográfico que alimenta de volta nas pontuações de confiança.

O modelo de confiança é Bayesiano (distribuição Beta), ponderado pela diversidade de chamadores para evitar manipulação por um único chamador. Se apenas um chamador enviar recibos para um servidor, a pontuação reflete essa evidência limitada.

Selecionar → Executar → Relatar
  ↑                    │
  └────────────────────┘
     pontuações melhoram

Os dados são reais

Esta não é uma API simulada. As pontuações de confiança são calculadas a partir de 1.127 execuções reais de chamadas de ferramentas MCP:

Servidor	Confiança	Recibos	Veredicto
context7	1.000	248	confiável
sequential-thinking	1.000	285	confiável
filesystem	0.909	594	cuidado

Monitorado via Veridict, um monitor de execução em tempo real que rastreia taxas de sucesso, latência e tipos de falhas.

filesystem tem uma pontuação mais baixa porque tem falhas reais em seu histórico — isso é o sistema funcionando corretamente. Uma pontuação de confiança deve refletir a realidade, não otimismo.

Experimente a demonstração completa

A demonstração de dogfooding executa o ciclo completo: selecionar um servidor, executar chamadas de ferramentas MCP, enviar um recibo assinado, verificar a pontuação atualizada.

git clone https://github.com/xkumakichi/xaip-protocol.git
cd xaip-protocol/demo
npm install
npx tsx dogfood.ts

Dura cerca de 15 segundos. Você verá o XAIP selecionar context7, executar chamadas de ferramentas reais contra ele, enviar um recibo para o Agregador e imprimir a tabela de comparação.

O que vem a seguir

XAIP está na versão v0.4.0. A infraestrutura está ao vivo e os dados são reais,

Agentes de IA Escolhem Ferramentas de Forma Aleatória

Uma API ao vivo que você pode experimentar agora

Como funciona

Os dados são reais

Experimente a demonstração completa

O que vem a seguir

Noticias relacionadas

Um Curso Intensivo em MCP: Um Guia para Iniciantes Usando TypeScript

Construímos operações de dados colunares para agentes de IA — aqui está o porquê e como

Eu deduplicei todos os registros MCP em um único índice. Veja como 22.561 servidores realmente se parecem

Gostou do conteudo?