MCP vs Skills: Por que Skills Economizam Tokens de Contexto
O MCP é útil, mas na maioria das vezes você não precisa realmente dele. Ele oferece a um agente uma maneira limpa de descobrir ferramentas, chamar APIs e trabalhar com sistemas externos. Na prática, um arquivo de habilidade pode descrever o mesmo caminho de uso sem arrastar toda a superfície do MCP para o contexto.
Mas o MCP não é gratuito; em vez do próprio MCP, o verdadeiro problema é o hábito de carregar uma grande superfície do MCP em cada sessão, não importa sobre o que a sessão realmente trata. Uma vez que uma execução do Claude Code ou Codex puxa um monte de servidores, o modelo vê essas definições de ferramentas imediatamente, mesmo que o trabalho seja apenas escrever documentos ou corrigir um pequeno bug. É aí que o desperdício começa.
O custo oculto do MCP sempre ativo
Cada servidor MCP traz metadados com ele: nomes de ferramentas, descrições, esquemas de argumentos, parâmetros aninhados, enums, exemplos e, às vezes, prompts ou recursos. Embora úteis, isso ainda é contexto.
Se você conectar um punhado de ferramentas leves, a sobrecarga é irritante, mas gerenciável. Se você conectar um verdadeiro conjunto de serviços, o custo se acumula rapidamente.
Na prática, você acaba pagando por:
- descoberta de ferramentas antes que a tarefa comece
- texto de esquema que o modelo pode nunca usar
- carregamento repetido em sessões não relacionadas
- pressão extra de contexto que empurra para fora o trabalho real
Esse último ponto importa mais do que as pessoas pensam. O contexto atua como o conjunto de trabalho ativo que o modelo usa para raciocinar. Quanto mais você queima em catálogos de ferramentas estáticas, menos espaço você tem para o pedido do usuário, o estado do repositório, raciocínios anteriores e a resposta real.
A Anthropic já escreveu sobre esse problema diretamente no contexto do MCP. O post de engenharia deles sobre execução de código com MCP destaca a inflação de definições de ferramentas e mostra como chamadas diretas de ferramentas podem consumir muito contexto antes que o modelo comece a fazer o trabalho real. A lista de ferramentas não é apenas ruído de configuração; é parte do custo da sessão.
Por que as habilidades são mais baratas
As habilidades seguem um caminho diferente. Um arquivo de habilidade mantém a parte sempre carregada pequena. Normalmente, isso significa apenas o nome da habilidade e uma breve descrição na parte frontal. As instruções detalhadas ficam em SKILL.md e só são carregadas quando o modelo realmente precisa delas. Essa divulgação progressiva é o truque todo:
- O modelo vê um nome de habilidade leve e uma descrição logo de cara.
- Se a tarefa corresponder, ele carrega o arquivo de habilidade.
- Se a habilidade precisar de arquivos de suporte, esses são lidos apenas quando necessário.
Para conhecimento operacional repetido, essa é uma troca muito melhor do que despejar toda a superfície de ferramentas do MCP em cada sessão. Você obtém a orientação quando importa, e não gasta tokens nisso quando não importa.
É por isso que as habilidades são um padrão melhor para:
- procedimentos específicos da equipe
- modelos de prompt
- listas de verificação de revisão
- convenções internas
- instruções de tarefa reutilizáveis
- conhecimento de “como fazemos isso aqui”
Elas não estão tentando ser integrações ao vivo. Elas estão tentando ser contexto reutilizável e barato.
As habilidades podem substituir a camada MCP
As habilidades são para instruções, tomada de decisão e o padrão de uso real, enquanto o MCP geralmente é apenas uma superfície de protocolo extra. Na prática, isso significa que as habilidades podem substituir o MCP para a parte com a qual os humanos realmente interagem. O modelo não precisa de um catálogo completo de ferramentas no contexto apenas para saber como usar um serviço.
Se o agente precisa usar um banco de dados, acessar uma API SaaS ou fazer solicitações autenticadas em tempo real, a habilidade ainda pode descrever o fluxo claramente e manter o modelo no caminho estreito que ele precisa.
Se o agente só precisa saber como sua equipe quer que ele se comporte, uma habilidade é a melhor forma. Na maioria das vezes, esse é o trabalho todo.
O erro é manter uma camada de protocolo pesada quando um arquivo de habilidade pode fazer o mesmo trabalho com muito menos contexto.
Uma regra simples
Use habilidades por padrão.
Trate o MCP como opcional, não fundamental.
Isso soa óbvio, mas muitas configurações de agentes borram a linha. Elas enchem cada sessão com todas as ferramentas possíveis e depois se perguntam por que o modelo fica mais lento, mais caro e mais difícil de direcionar.
Como isso se parece na prática
Se você tem um serviço que expõe 40 ou 50 ferramentas MCP, pode ser bom para um desenvolvedor que o usa todos os dias. Mas a maioria das sessões não precisa de todas as 50 ferramentas. Muitas vezes, o agente só precisa de um procedimento estreito, como procurar um usuário, atualizar um registro, criar um ticket ou formatar uma solicitação com segurança.
A habilidade pode dizer ao modelo exatamente como lidar com a tarefa, quais campos importam, o que não fazer e quais casos extremos observar. O modelo não precisa de um enorme catálogo de ferramentas MCP sempre ativo para fazer isso bem.
Esse é o verdadeiro salvamento de tokens. Você para de pagar pela superfície completa de tempo de execução quando tudo o que você precisava era o manual de operação.
Como converter MCP em uma habilidade
Se você tem um servidor MCP que se comporta principalmente como um wrapper de API reutilizável, você deve transformar as partes úteis em uma habilidade.
A maneira mais fácil de inspecionar o que você realmente precisa é usar a ferramenta MCPViewer.
Aqui está o fluxo de trabalho:
- Abra a ferramenta MCPViewer.
- Cole a URL do servidor MCP.
- Clique em Analisar.
- Role para baixo e clique em Baixar especificação.
- Copie o JSON baixado.
- Cole-o em um arquivo
SKILL.mdcomo a referência de conteúdo da habilidade. - Defina a descrição da habilidade para algo como
Como usar APIs para o serviço <nome do serviço>.
Esse fluxo extrai o conhecimento útil do serviço em uma habilidade mais leve e reutilizável que o modelo pode carregar apenas quando necessário, em vez de tentar preservar todas as ferramentas para sempre.
Se o serviço muda com frequência, mantenha a habilidade estreita e atualize-a quando a API mudar. Se o serviço for estável, a habilidade se torna um lar melhor para as instruções do que toda a superfície do MCP.
Um bom padrão para equipes
Para a maioria das equipes, a melhor configuração é habilidades em todos os lugares, usando arquivos de habilidade para as coisas que devem ser lembradas:
- como formatar solicitações
- como revisar saídas
- convenções da equipe
- regras de aprovação
- procedimentos operacionais seguros
Se um serviço ainda precisa de execução ao vivo, a habilidade pode descrever esse caminho sem arrastar toda a sua superfície de protocolo para cada sessão. Isso mantém o agente enxuto e torna o sistema mais fácil de manter, porque o conhecimento procedural não está mais espalhado por um grande registro de ferramentas.
É também mais fácil raciocinar sobre falhas. Se a habilidade estiver errada, você atualiza as instruções. Se você precisar mudar como um serviço é usado, você atualiza a habilidade. Esses são trabalhos diferentes, e ajuda mantê-los separados.
O verdadeiro objetivo: menos desperdício de contexto
O problema não é apenas o custo de tokens no sentido de cobrança. É desperdício de contexto. Cada definição de ferramenta extra que você coloca em uma sessão é mais uma coisa que o modelo tem que carregar enquanto resolve a tarefa real.
As habilidades permitem que você adie esse custo até que o modelo realmente precise da informação. Elas são uma boa opção para fluxos de trabalho repetidos, conhecimento da empresa e regras operacionais reutilizáveis.
Se o MCP é o transporte, as habilidades são a memória.
Leitura relacionada
- Como Usar Claude Code com uma Equipe: Contexto Compartilhado, Permissões e MCP
- O Guia Completo para Claude Code: Configuração, Habilidades, Hooks e o Loop do Agente
- Por que Seu Agente de IA Nunca Deve Ver Suas Chaves de API
FAQ
Empresas brasileiras podem otimizar o uso de agentes de IA ao adotar skills em vez de depender do MCP, reduzindo custos operacionais e melhorando a eficiência. Essa mudança pode facilitar a integração de serviços e a manutenção de sistemas, tornando-os mais ágeis.


