
Classificamos 117.854 habilidades de agentes de IA. Aqui está o que encontramos.
Apenas 17,7% do catálogo é popular o suficiente para ser classificado, 1 em 32 habilidades classificadas é insegura, e o risco reside na cauda longa — além de uma nova superfície de ataque nativa do agente.
A parte desconfortável não são as habilidades que são inseguras. É quão poucas foram verificadas.
Instalar uma habilidade de agente de IA ou um servidor MCP significa entregar código não confiável ao seu shell, suas variáveis de ambiente e, cada vez mais, a configuração e a memória do seu próprio agente. A descoberta é fácil — há dezenas de milhares para escolher. Saber se a que você encontrou é segura para executar não é.
Então, escaneamos todo o catálogo. Aqui está a imagem honesta.
📄 Este é um cross-post. Versão canônica (com gráficos): agentskillshub.top/blog/securing-117k-ai-skills
Como escaneamos
Um scanner baseado em regras, modelado no Framework de Segurança de Agentes da SlowMist e suas 11 categorias de bandeira vermelha. Ele executa verificações estáticas sobre o README e o código de cada habilidade, procurando padrões concretos: exfiltração de dados de saída (curl -d $(...)), coleta de credenciais (env | grep -i token), leitura de .env / .ssh / .aws, scripts de instalação curl | sh, escalonamento de privilégios, persistência e combinações de exfiltração de segredos. Cada habilidade recebe uma classificação — segura / cautela / insegura / rejeitar — além das bandeiras específicas que acionou. Habilidades sem README ou muito novas para serem verificadas permanecem desconhecidas.
Isso é deliberadamente uma primeira camada: captura padrões, não intenções. Em uma escala de 117K, a camada de padrões é o que torna o catálogo auditável.
Descoberta 1 — 82% do catálogo nunca foi classificado
Das 117.854 habilidades indexadas, apenas 20.853 (17,7%) alcançam 5 estrelas — o limite onde uma habilidade é popular o suficiente para valer a pena ser classificada. As outras ~97.000 são efetivamente não auditadas.
"Temos 117K habilidades" não é uma característica. O número que importa é quantas você pode realmente confiar, e para a cauda longa a resposta honesta é: ninguém olhou.
Descoberta 2 — Entre as habilidades classificadas, 1 em 32 é insegura ou pior
| Classificação | Participação |
|---|---|
| 🟢 segura | 85,5% |
| 🟡 cautela | 5,3% |
| 🔴 insegura | 3,0% |
| ⛔ rejeitar | 0,1% |
| ⚪ desconhecida | 6,1% |
8,4% apresentam uma preocupação de segurança. 3,1% — cerca de 1 em 32 — são inseguras ou rejeitadas. Na escala deste catálogo, isso representa ~650 habilidades classificadas que você realmente não deve executar sem cuidado, aparecendo nos mesmos resultados de busca que todas as outras.
Descoberta 3 — A popularidade prevê a segurança. O risco reside na cauda longa.
| Estrelas | Insegura / rejeitar |
|---|---|
| 5–20★ | 4,1% |
| 20–100★ | 3,7% |
| 100–1.000★ | 0,9% |
| 1.000★+ | 0,4% |
A habilidade que você ouviu falar é quase certamente segura. O perigo está no repositório obscuro de 7 estrelas que você pegaria de uma busca por uma tarefa de nicho — exatamente no momento em que um diretório deveria ajudar, e geralmente não ajuda.
Descoberta 4 — As bandeiras vermelhas incluem uma nova superfície de ataque nativa do agente
As bandeiras mais comuns entre uma amostra de 1.000 habilidades sinalizadas:
| Bandeira | Contagem |
|---|---|
| uso de sudo | 483 |
| instalação de serviço em segundo plano | 152 |
| curl | shell | 99 |
| roubo de configuração do agente | 87 |
| serviço de túnel | 66 |
| eval() | 52 |
| variáveis de ambiente sensíveis | 34 |
| roubo de memória do agente | 23 |
| instalação de backdoor | 11 |
Os riscos clássicos do shell dominam. Mas observe o roubo de configuração do agente (87) e roubo de memória do agente (23): habilidades que leem a configuração e os arquivos de memória do seu agente. Isso não é uma exploração de servidor — é uma nova superfície de ataque que só existe porque você está executando um agente. Sua configuração do Claude/MCP, seu contexto armazenado, suas credenciais por proxy. O modelo de ameaça mudou, e a maioria dos diretórios não percebeu.
O que fazer a respeito
Verifique o sinal de confiança antes de instalar, de onde você já trabalha:
npx @agentskillshub/cli search "postgres mcp" --safe
npx @agentskillshub/cli audit owner/repo
Cada resultado carrega sua classificação e as bandeiras específicas que acionou. --safe oculta qualquer coisa não auditada ou pior.
As advertências honestas (porque esse é o ponto)
- Nossos 3% são um piso, não um teto. Análise profunda acadêmica (Liu et al., 2026, arXiv:2601.10338) coloca a taxa de vulnerabilidade das habilidades de agente em 26,1%, porque analisam semântica, não apenas padrões. Nossa primeira passagem baseada em regras deliberadamente subestima. Leia 3% como o limite inferior de um problema maior.
- ⚪ desconhecido não é "provavelmente bom". Isso significa ninguém verificou. 97K do catálogo é desconhecido. Nós o rotulamos como cinza e não o disfarçamos.
- Todos os números são reproduzíveis. Cada classificação é visível no site e via CLI. Reproduza-os você mesmo.
Uma camada de confiança que apenas lhe contasse as boas notícias não seria uma. A coisa mais útil que podemos dizer sobre 97.000 habilidades é que ainda não sabemos — e diremos isso na sua cara.
Escrita completa com gráficos: Nós classificamos 117.854 habilidades de agentes de IA.
O artigo destaca a importância da segurança na implementação de habilidades de agentes de IA, um aspecto crítico para empresas brasileiras que buscam adotar essa tecnologia. A falta de auditoria em 97.000 habilidades pode representar riscos significativos. As empresas devem priorizar a verificação de segurança antes de integrar essas habilidades em seus sistemas.

