Voltar as noticias
Agentes de IA Escolhem Ferramentas de Forma Aleatória
MCP ProtocolAltaEN

Agentes de IA Escolhem Ferramentas de Forma Aleatória

Dev.to - MCP·14 de abril de 2026

Conectei meu agente de IA a 3 servidores MCP.

Ele escolheu um aleatoriamente.

Ele teve um tempo limite. Então tentou um diferente. Finalmente conseguiu um que funcionou.

$ node without-xaip.js

→ Tentando: unknown-server...
  ✗ erro — pacote não encontrado (8.2s)

→ Tentando: sequential-thinking...
  ✓ conectado — mas ferramenta errada para a tarefa de docs

→ Tentando: context7...
  ✓ sucesso (3.1s)

Total: 11.3 segundos, 2 chamadas desperdiçadas

Agora há mais de 1.000 servidores MCP. Seu agente não tem como saber quais são confiáveis, quais estão quebrados e quais são os mais adequados.

Então eu construí uma solução: uma chamada de API que escolhe o servidor certo primeiro.

$ node with-xaip.js

→ XAIP selecionado: context7 (confiança: 1.0, 248 execuções verificadas)
  ✓ sucesso (3.1s)

Total: 3.1 segundos, 0 chamadas desperdiçadas

Isso é XAIP — pontuação de confiança para agentes de IA, respaldada por dados de execução reais. Não benchmarks. Não métricas auto-relatadas. Resultados reais de chamadas de ferramentas, assinados criptograficamente.

Uma API ao vivo que você pode experimentar agora

Sem cadastro, sem chave de API. Apenas curl:

# Pontuação de confiança para um servidor MCP específico
curl https://xaip-trust-api.kuma-github.workers.dev/v1/trust/context7
{
  "slug": "context7",
  "trust": 1.0,
  "verdict": "confiável",
  "receipts": 248,
  "confidence": 1,
  "source": "xaip-aggregator (quorum:1)",
  "riskFlags": [],
  "computedFrom": "248 recibos via XAIP Aggregator BFT (1 nós)"
}

Ou deixe o XAIP escolher o melhor servidor para sua tarefa:

curl -X POST https://xaip-trust-api.kuma-github.workers.dev/v1/select \
  -H "Content-Type: application/json" \
  -d '{
    "task": "Buscar documentação do React",
    "candidates": ["context7", "sequential-thinking", "unknown-server"]
  }'
{
  "selected": "context7",
  "reason": "Maior confiança (1) de 248 execuções verificadas",
  "rejected": [
    { "slug": "unknown-server", "reason": "sem pontuação — sem dados de execução" }
  ],
  "withoutXAIP": "Seleção aleatória escolheria um servidor sem pontuação 33% das vezes — sem dados de execução, sem garantia de segurança"
}

O campo withoutXAIP existe para tornar o risco visível. É a resposta para "por que eu preciso disso?".

Como funciona

XAIP tem três partes móveis:

1. API de Confiança — Retorna pontuações de confiança para servidores MCP. As pontuações vêm de dados de execução reais, não de métricas auto-relatadas.

2. Motor de DecisãoPOST /v1/select recebe uma tarefa e uma lista de servidores candidatos, retorna a melhor escolha com raciocínio. Servidores sem pontuação são automaticamente excluídos.

3. Agregador — Coleta recibos de execução assinados com Ed25519. Cada chamada de ferramenta produz um recibo criptográfico que alimenta de volta nas pontuações de confiança.

O modelo de confiança é Bayesiano (distribuição Beta), ponderado pela diversidade de chamadores para evitar manipulação por um único chamador. Se apenas um chamador enviar recibos para um servidor, a pontuação reflete essa evidência limitada.

Selecionar → Executar → Relatar
  ↑                    │
  └────────────────────┘
     pontuações melhoram

Os dados são reais

Esta não é uma API simulada. As pontuações de confiança são calculadas a partir de 1.127 execuções reais de chamadas de ferramentas MCP:

Servidor Confiança Recibos Veredicto
context7 1.000 248 confiável
sequential-thinking 1.000 285 confiável
filesystem 0.909 594 cuidado

Monitorado via Veridict, um monitor de execução em tempo real que rastreia taxas de sucesso, latência e tipos de falhas.

filesystem tem uma pontuação mais baixa porque tem falhas reais em seu histórico — isso é o sistema funcionando corretamente. Uma pontuação de confiança deve refletir a realidade, não otimismo.

Experimente a demonstração completa

A demonstração de dogfooding executa o ciclo completo: selecionar um servidor, executar chamadas de ferramentas MCP, enviar um recibo assinado, verificar a pontuação atualizada.

git clone https://github.com/xkumakichi/xaip-protocol.git
cd xaip-protocol/demo
npm install
npx tsx dogfood.ts

Dura cerca de 15 segundos. Você verá o XAIP selecionar context7, executar chamadas de ferramentas reais contra ele, enviar um recibo para o Agregador e imprimir a tabela de comparação.

O que vem a seguir

XAIP está na versão v0.4.0. A infraestrutura está ao vivo e os dados são reais,

Contexto Triplo Up

A implementação do XAIP pode otimizar a eficiência de agentes de IA em empresas brasileiras, permitindo que eles escolham ferramentas mais confiáveis. Isso pode resultar em economia de tempo e recursos, além de aumentar a precisão nas tarefas executadas.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.