
Analisamos 14.800+ Servidores MCP sobre Confiança Comportamental. Veja o que Encontramos.
O ecossistema MCP tem um problema de confiança — e escanear o código-fonte não vai resolvê-lo
O ecossistema do Protocolo de Contexto do Modelo (MCP) está crescendo rapidamente. Milhares de servidores MCP agora oferecem ferramentas que agentes de IA chamam autonomamente — executando código, consultando bancos de dados, movimentando dinheiro, gerenciando infraestrutura. Os agentes estão tomando decisões em nome dos humanos, e essas decisões dependem de servidores que eles nunca conheceram.
Recentemente, uma análise bem divulgada escaneou aproximadamente 1.800 servidores MCP e encontrou problemas de segurança em uma porcentagem significativa deles. Esse trabalho foi valioso. A análise estática captura bugs reais: vulnerabilidades de injeção, validação de entrada ausente, padrões inseguros.
Mas aqui está a pergunta que ninguém fez: o que acontece após a implantação?
Um servidor pode passar por todos os testes estáticos e ainda se comportar terrivelmente em produção — descartando solicitações, respondendo com lixo após a meia-noite, degradando silenciosamente ao longo das semanas até que um agente cometa um erro caro. A análise estática é uma foto instantânea. A produção é um filme.
Construímos Dominion Observatory para assistir ao filme.
Pontuação de confiança comportamental: o que é e por que é importante
O Dominion Observatory fornece pontuações de confiança comportamental para 14.800+ servidores MCP — quase 8 vezes a cobertura da maior análise estática publicada. Mas a cobertura não é o ponto. A metodologia é.
Em vez de ler o código-fonte, o Dominion pontua servidores com base em como eles realmente se comportam em tempo de execução:
- Taxas de sucesso — O servidor retorna respostas válidas de forma confiável, ou falha silenciosamente?
- Perfis de latência — O tempo de resposta é consistente, ou aumenta de forma imprevisível?
- Padrões de tempo de atividade — O servidor está disponível quando os agentes precisam, ou desaparece durante horários de pico?
- Histórico de interações — Como o servidor se comporta em milhares de chamadas de ferramentas reais ao longo do tempo?
- Detecção de anomalias — O comportamento do servidor mudou repentinamente de uma forma que sugere comprometimento, má configuração ou degradação?
Uma pontuação de confiança não é um simples passe/falha. É um sinal contínuo que reflete a reputação operacional de um servidor — construída a partir do comportamento observado, não da intenção assumida.
O que a pontuação comportamental realmente revela
Quando você muda de "esse código parece seguro?" para "esse servidor se comporta de forma confiável?", começa a ver padrões que a análise estática simplesmente não consegue detectar.
Degradação ao longo do tempo. Um servidor que funcionava perfeitamente há três meses pode agora estar expirando em 30% das solicitações. Nenhum código mudou — talvez a infraestrutura subjacente tenha mudado, talvez uma dependência tenha começado a limitar, talvez o mantenedor tenha saído. A análise estática vê o mesmo código limpo. A pontuação comportamental vê a degradação.
Confiabilidade inconsistente entre ferramentas. Um único servidor MCP pode expor cinco ferramentas onde quatro funcionam bem e uma está essencialmente quebrada. A pontuação comportamental opera na granularidade das interações individuais das ferramentas, não apenas no servidor como um todo.
Mudanças de comportamento anômalas. Um servidor que de repente começa a retornar respostas 10x mais rápidas do que sua linha de base histórica pode parecer uma boa notícia — ou pode significar que está retornando lixo em cache em vez de calcular resultados reais. A detecção de anomalias sinaliza desvios em ambas as direções.
Padrões de disponibilidade. Alguns servidores são sólidos durante o horário comercial dos EUA e inacessíveis em outros momentos. Para uma economia de agentes global, isso é uma preocupação de confiabilidade que só aparece através da observação contínua.
Esses não são cenários teóricos. Eles são os tipos de sinais que emergem quando você instrumenta a confiança na camada comportamental.
Da pontuação ao acerto: confiança como infraestrutura
O Dominion Observatory não é um painel que você verifica uma vez. É uma infraestrutura que os agentes consultam em tempo real, no momento da decisão.
O sistema é ele mesmo um servidor MCP (disponível via HTTP Streamable em https://dominion-observatory.sgdata.workers.dev/mcp), o que significa que qualquer agente compatível com MCP pode chamá-lo nativamente. As ferramentas principais:
-
get_trust_score— Recuperar a pontuação de confiança comportamental para qualquer servidor MCP antes de chamá-lo -
detect_anomalies— Verificar se um servidor está exibindo comportamento incomum -
get_leaderboard— Ver quais servidores estão classificados mais alto em confiabilidade em uma determinada categoria -
get_ecosystem_stats— Compreender a saúde geral do ecossistema MCP -
report_tool_outcome— Contribuir com seus próprios dados de interação de volta para o mecanismo de pontuação
O ponto de integração mais consequente é o beforeSettle hook. Em fluxos de pagamento de agente para agente — onde um agente paga outro por um serviço prestado via MCP — a pontuação de confiança pode determinar se o acerto prossegue. Se a confiança comportamental de um servidor cair abaixo de um limite, o pagamento é retido. Isso transforma a confiança de uma métrica desejável em um primitivo econômico.
Pense nisso como uma pontuação de crédito para servidores MCP. Não baseada em quem eles dizem que são, mas no que realmente fizeram.
Análise estática e comportamental são complementares, não concorrentes
Para ser claro: a análise estática é importante. Você deve absolutamente escanear servidores MCP em busca de falhas de injeção, validar seu tratamento de entrada e auditar seus modelos de permissão. Ferramentas que fazem isso bem estão realizando um trabalho necessário.
Mas a análise estática responde à pergunta: "Este servidor poderia se comportar mal?"
A pontuação comportamental responde à pergunta: "Este servidor está se comportando mal?"
A primeira é uma auditoria de segurança. A segunda é um sistema de reputação operacional. Um ecossistema MCP maduro precisa de ambos — assim como a web tradicional precisa de revisão de código e monitoramento de tempo de atividade.
A diferença se torna crítica à medida que a economia de agentes escala. Quando milhares de agentes estão selecionando autonomamente quais servidores MCP chamar, fazendo pagamentos e encadeando chamadas de ferramentas entre vários servidores, você precisa de sinais de confiança que operem na velocidade de execução e reflitam a realidade atual. Você não pode reauditar o código-fonte a cada solicitação. Você pode consultar uma pontuação de confiança comportamental em milissegundos.
A economia de agentes precisa de infraestrutura de responsabilidade
Estamos em um ponto de inflexão. A adoção do MCP está acelerando, e os servidores dos quais os agentes dependem estão sendo cada vez mais operados por terceiros desconhecidos. A economia de agentes desenvolverá uma infraestrutura de confiança robusta, ou aprenderá lições caras sobre o que acontece quando sistemas autônomos tomam decisões sem responsabilidade.
O Dominion Observatory é nossa contribuição para o primeiro resultado. É de código aberto, é componível e foi projetado para ser uma infraestrutura sobre a qual outros sistemas possam construir — não um jardim murado.
Experimente agora
Consulte diretamente. Aponte qualquer cliente MCP para https://dominion-observatory.sgdata.workers.dev/mcp usando transporte HTTP Streamable. Chame get_ecosystem_stats para ver o estado atual do ecossistema, ou get_trust_score para qualquer servidor que você esteja curioso.
Contribua com dados. O mecanismo de pontuação melhora com mais dados de interação. Use report_tool_outcome para alimentar suas próprias observações sobre o comportamento do servidor MCP. Mais dados significam sinais de confiança mais precisos para todos.
Dê uma estrela no repositório. O mecanismo é de código aberto em github.com/vdineshk/daee-engine.
As empresas brasileiras que utilizam servidores MCP precisam entender a importância da confiança comportamental para evitar decisões erradas por agentes de IA. A análise contínua do comportamento dos servidores pode prevenir falhas e garantir operações mais seguras. A adoção de infraestrutura de confiança é crucial para o crescimento do ecossistema de agentes.

