Voltar as noticias
MCP Está Morto? Uma Análise Profunda Sobre o Protocolo de Contexto de Modelo
MCP ProtocolAltaEN

MCP Está Morto? Uma Análise Profunda Sobre o Protocolo de Contexto de Modelo

Dev.to - MCP·30 de maio de 2026

O Protocolo de Contexto de Modelo (MCP) deveria ser o grande unificador — uma maneira padrão para agentes de IA se comunicarem com as ferramentas e serviços de que precisam para realizar seu trabalho. Lançado no final de 2024, foi rapidamente aclamado como "o USB-C do ecossistema de IA", adotado pela Anthropic, OpenAI e um crescente ecossistema de provedores de ferramentas.

Mas a lua de mel pode ter acabado. Uma nova análise devastadora da Quandri Engineering, combinada com um debate acalorado no Hacker News (195 pontos, 174 comentários), causou um sério dano à reputação do MCP. O veredicto? O MCP consome contexto, tem baixa confiabilidade e se sobrepõe significativamente a ferramentas CLI e API existentes que já funcionam muito bem.

Problema 1: Ele Devora a Janela de Contexto

A descoberta mais condenatória da análise da Quandri é o volume de tokens consumidos pelas definições de ferramentas do MCP. Em sua pilha do mundo real (Linear, Notion, Slack e servidores MCP do Postgres), as definições de ferramentas sozinhas consumiram mais de 21.000 tokens — isso é 10,5% de uma janela de contexto de Claude de 200K, e 16,5% do contexto de 128K do GPT-4o.

Servidor MCP Ferramentas Tokens Estimados
Linear 42 ~12.807
Notion 14 ~4.039
Slack 12 ~3.792
Postgres 9 ~438
Total 77 ~21.077

O problema é de nível arquitetônico. Cada definição de ferramenta inclui seu esquema JSON — parâmetros, descrições, tipos de retorno — e cada um é carregado no contexto, independentemente de o modelo algum dia usá-lo. O Linear sozinho envia 42 definições de ferramentas (~12.807 tokens), mesmo que você use apenas get_issue e save_issue.

Analogia de restaurante do artigo: "Você se senta e 10 cardápios estão espalhados pela mesa. Não há espaço para comida de verdade."

Atualização: Desde que essas medições foram feitas, o Claude Code lançou Busca de Ferramentas com Carregamento Diferido, que carrega esquemas de ferramentas MCP sob demanda e reduz o uso de contexto em mais de 85%. Portanto, esse problema específico está sendo mitigado — mas as preocupações arquitetônicas permanecem.

Problema 2: Baixa Confiabilidade Operacional

Os problemas de confiabilidade do MCP são mais difíceis de ignorar. A equipe da Quandri documentou vários modos de falha que decorrem da arquitetura do MCP:

Problema Detalhe
Falha de inicialização, re-autenticação repetida Requer iniciar e manter um processo separado
Respostas de IA mais lentas Viagem de ida e volta ao servidor externo em cada chamada de ferramenta
Morte de ferramenta no meio da sessão O processo do servidor MCP falha no meio da conversa
Permissões opacas Não está claro quais permissões cada ferramenta realmente possui

Os números de desempenho são alarmantes. O autor do artigo original fez um benchmark do Jira MCP contra sua API REST diretamente: o MCP era 3× mais lento por chamada e 9,4× mais lento na primeira chamada, incluindo a sobrecarga de inicialização. Este não é um problema específico do Jira — é arquitetônico. Cada servidor MCP adiciona uma camada de processo entre o LLM e a API subjacente.

Problema 3: Sobreposição com CLI/API Existentes

Talvez a crítica mais fundamental: o MCP duplica funcionalidades que já existem e funcionam melhor.

Aspecto CLI / API MCP
Paridade humano-máquina Mesmos comandos para humanos e LLMs Só existe dentro de conversas LLM
Composabilidade Pipes, jq, grep combináveis livremente Bloqueado no formato de retorno do servidor
Depuração Reproduz imediatamente no terminal Somente reproduzível dentro do contexto da conversa
Dados de treinamento Já aprendeu com páginas de manual, StackOverflow Requer definições de ferramentas separadas
Custo de instalação Principalmente já instalado Configuração do servidor, autenticação, gerenciamento de processos necessários

A comparação de tokens é brutal. Para procurar a mesma questão do Linear:

  • Abordagem CLI: ~200 tokens no total (50 para o comando curl do prompt, 150 para a resposta)
  • Abordagem MCP: ~12.957 tokens no total (12.807 para definições de ferramentas sempre carregadas, 150 para a chamada real)

Isso é 65× mais tokens para a mesma operação.

A Alternativa CLI-Primeiro

A alternativa proposta é elegantemente simples: fornecer ferramentas CLI existentes para LLMs. Os LLMs já aprenderam com páginas de manual, StackOverflow e milhões de gists do GitHub. Eles já sabem como construir comandos curl, passar por jq e filtrar resultados com grep. Nenhum novo protocolo é necessário.

# Abordagem CLI — funciona hoje, nenhum servidor MCP necessário
curl -s -H "Authorization: Bearer $LINEAR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"query":"{ issue(id: \"ISSUE-ID\") { title state { name } assignee { name } } }"}' \
  https://api.linear.app/graphql

Qual é a Verdadeira História?

Vamos ser justos: o MCP não vai a lugar nenhum da noite para o dia. O investimento no ecossistema é significativo — a Anthropic adquiriu a Stainless especificamente para acelerar as ferramentas MCP, e plataformas importantes como GitHub, Notion e Linear já lançaram servidores MCP oficiais. O protocolo resolve um problema real: fornecer uma interface padronizada para agentes de IA interagirem com serviços externos.

Mas a crítica levanta questões importantes sobre filosofia arquitetônica. A abordagem "SSH em uma caixa e usar CLI" que tornou LLMs como Claude Code e Codex tão eficazes é fundamentalmente mais simples do que o modelo de servidor MCP. Não requer nova infraestrutura, negociação de protocolo, nem gerenciamento de ciclo de vida de processos separado.

Como um comentarista do HN colocou: "O MCP parece estar resolvendo um problema que não existe — já tínhamos interfaces funcionais entre software e software. A inovação é que os LLMs agora podem usar essas mesmas interfaces."

A Conclusão

O artigo original "MCP está morto" — que dá nome a este debate — pode ser intencionalmente provocativo. Mas os dados por trás dele são reais. Para equipes que estão construindo fluxos de trabalho de agentes de IA hoje, a escolha entre MCP e acesso direto a CLI/API não é ideológica: é um custo mensurável em tokens, latência e confiabilidade.

A abordagem mais inteligente? Não escolha. Use o MCP para o que ele é bom (descoberta padronizada, prototipagem rápida, compatibilidade de ecossistema) e recorra a chamadas diretas de CLI/API para alta frequência, sensíveis à latência.

Contexto Triplo Up

As empresas brasileiras que utilizam o MCP devem reconsiderar sua adoção, dado o impacto negativo em desempenho e custos operacionais. A análise sugere que o uso de ferramentas CLI pode ser mais eficiente, economizando recursos e tempo. A transição para soluções mais diretas pode melhorar a produtividade e a confiabilidade.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.