
Agentes de IA Escolhem Ferramentas de Forma Aleatória
Conectei meu agente de IA a 3 servidores MCP.
Ele escolheu um aleatoriamente.
Ele teve um tempo limite. Então tentou um diferente. Finalmente conseguiu um que funcionou.
$ node without-xaip.js
→ Tentando: unknown-server...
✗ erro — pacote não encontrado (8.2s)
→ Tentando: sequential-thinking...
✓ conectado — mas ferramenta errada para a tarefa de docs
→ Tentando: context7...
✓ sucesso (3.1s)
Total: 11.3 segundos, 2 chamadas desperdiçadas
Agora há mais de 1.000 servidores MCP. Seu agente não tem como saber quais são confiáveis, quais estão quebrados e quais são os mais adequados.
Então eu construí uma solução: uma chamada de API que escolhe o servidor certo primeiro.
$ node with-xaip.js
→ XAIP selecionado: context7 (confiança: 1.0, 248 execuções verificadas)
✓ sucesso (3.1s)
Total: 3.1 segundos, 0 chamadas desperdiçadas
Isso é XAIP — pontuação de confiança para agentes de IA, respaldada por dados de execução reais. Não benchmarks. Não métricas auto-relatadas. Resultados reais de chamadas de ferramentas, assinados criptograficamente.
Uma API ao vivo que você pode experimentar agora
Sem cadastro, sem chave de API. Apenas curl:
# Pontuação de confiança para um servidor MCP específico
curl https://xaip-trust-api.kuma-github.workers.dev/v1/trust/context7
{
"slug": "context7",
"trust": 1.0,
"verdict": "confiável",
"receipts": 248,
"confidence": 1,
"source": "xaip-aggregator (quorum:1)",
"riskFlags": [],
"computedFrom": "248 recibos via XAIP Aggregator BFT (1 nós)"
}
Ou deixe o XAIP escolher o melhor servidor para sua tarefa:
curl -X POST https://xaip-trust-api.kuma-github.workers.dev/v1/select \
-H "Content-Type: application/json" \
-d '{
"task": "Buscar documentação do React",
"candidates": ["context7", "sequential-thinking", "unknown-server"]
}'
{
"selected": "context7",
"reason": "Maior confiança (1) de 248 execuções verificadas",
"rejected": [
{ "slug": "unknown-server", "reason": "sem pontuação — sem dados de execução" }
],
"withoutXAIP": "Seleção aleatória escolheria um servidor sem pontuação 33% das vezes — sem dados de execução, sem garantia de segurança"
}
O campo withoutXAIP existe para tornar o risco visível. É a resposta para "por que eu preciso disso?".
Como funciona
XAIP tem três partes móveis:
1. API de Confiança — Retorna pontuações de confiança para servidores MCP. As pontuações vêm de dados de execução reais, não de métricas auto-relatadas.
2. Motor de Decisão — POST /v1/select recebe uma tarefa e uma lista de servidores candidatos, retorna a melhor escolha com raciocínio. Servidores sem pontuação são automaticamente excluídos.
3. Agregador — Coleta recibos de execução assinados com Ed25519. Cada chamada de ferramenta produz um recibo criptográfico que alimenta de volta nas pontuações de confiança.
O modelo de confiança é Bayesiano (distribuição Beta), ponderado pela diversidade de chamadores para evitar manipulação por um único chamador. Se apenas um chamador enviar recibos para um servidor, a pontuação reflete essa evidência limitada.
Selecionar → Executar → Relatar
↑ │
└────────────────────┘
pontuações melhoram
Os dados são reais
Esta não é uma API simulada. As pontuações de confiança são calculadas a partir de 1.127 execuções reais de chamadas de ferramentas MCP:
| Servidor | Confiança | Recibos | Veredicto |
|---|---|---|---|
| context7 | 1.000 | 248 | confiável |
| sequential-thinking | 1.000 | 285 | confiável |
| filesystem | 0.909 | 594 | cuidado |
Monitorado via Veridict, um monitor de execução em tempo real que rastreia taxas de sucesso, latência e tipos de falhas.
filesystem tem uma pontuação mais baixa porque tem falhas reais em seu histórico — isso é o sistema funcionando corretamente. Uma pontuação de confiança deve refletir a realidade, não otimismo.
Experimente a demonstração completa
A demonstração de dogfooding executa o ciclo completo: selecionar um servidor, executar chamadas de ferramentas MCP, enviar um recibo assinado, verificar a pontuação atualizada.
git clone https://github.com/xkumakichi/xaip-protocol.git
cd xaip-protocol/demo
npm install
npx tsx dogfood.ts
Dura cerca de 15 segundos. Você verá o XAIP selecionar context7, executar chamadas de ferramentas reais contra ele, enviar um recibo para o Agregador e imprimir a tabela de comparação.
O que vem a seguir
XAIP está na versão v0.4.0. A infraestrutura está ao vivo e os dados são reais,
A implementação do XAIP pode otimizar a eficiência de agentes de IA em empresas brasileiras, permitindo que eles escolham ferramentas mais confiáveis. Isso pode resultar em economia de tempo e recursos, além de aumentar a precisão nas tarefas executadas.

