Classificamos 117.854 habilidades de agentes de IA. Aqui está o que encontramos.

Apenas 17,7% do catálogo é popular o suficiente para ser classificado, 1 em 32 habilidades classificadas é insegura, e o risco reside na cauda longa — além de uma nova superfície de ataque nativa do agente.

Nós Classificamos 117.854 Habilidades de Agentes de IA. Aqui Está o Que Encontramos. | Hub de Habilidades de Agentes

Apenas 17,7% são populares o suficiente para serem classificados. Entre as habilidades classificadas, 1 em 32 é insegura. O risco reside na cauda longa.

agentskillshub.top

A parte desconfortável não são as habilidades que são inseguras. É quão poucas foram verificadas.

Instalar uma habilidade de agente de IA ou um servidor MCP significa entregar código não confiável ao seu shell, suas variáveis de ambiente e, cada vez mais, a configuração e a memória do seu próprio agente. A descoberta é fácil — há dezenas de milhares para escolher. Saber se a que você encontrou é segura para executar não é.

Então, escaneamos todo o catálogo. Aqui está a imagem honesta.

📄 Este é um cross-post. Versão canônica (com gráficos): agentskillshub.top/blog/securing-117k-ai-skills

Como escaneamos

Um scanner baseado em regras, modelado no Framework de Segurança de Agentes da SlowMist e suas 11 categorias de bandeira vermelha. Ele executa verificações estáticas sobre o README e o código de cada habilidade, procurando padrões concretos: exfiltração de dados de saída (curl -d $(...)), coleta de credenciais (env | grep -i token), leitura de .env / .ssh / .aws, scripts de instalação curl | sh, escalonamento de privilégios, persistência e combinações de exfiltração de segredos. Cada habilidade recebe uma classificação — segura / cautela / insegura / rejeitar — além das bandeiras específicas que acionou. Habilidades sem README ou muito novas para serem verificadas permanecem desconhecidas.

Isso é deliberadamente uma primeira camada: captura padrões, não intenções. Em uma escala de 117K, a camada de padrões é o que torna o catálogo auditável.

Descoberta 1 — 82% do catálogo nunca foi classificado

Das 117.854 habilidades indexadas, apenas 20.853 (17,7%) alcançam 5 estrelas — o limite onde uma habilidade é popular o suficiente para valer a pena ser classificada. As outras ~97.000 são efetivamente não auditadas.

"Temos 117K habilidades" não é uma característica. O número que importa é quantas você pode realmente confiar, e para a cauda longa a resposta honesta é: ninguém olhou.

Descoberta 2 — Entre as habilidades classificadas, 1 em 32 é insegura ou pior

Classificação	Participação
🟢 segura	85,5%
🟡 cautela	5,3%
🔴 insegura	3,0%
⛔ rejeitar	0,1%
⚪ desconhecida	6,1%

8,4% apresentam uma preocupação de segurança. 3,1% — cerca de 1 em 32 — são inseguras ou rejeitadas. Na escala deste catálogo, isso representa ~650 habilidades classificadas que você realmente não deve executar sem cuidado, aparecendo nos mesmos resultados de busca que todas as outras.

Descoberta 3 — A popularidade prevê a segurança. O risco reside na cauda longa.

Estrelas	Insegura / rejeitar
5–20★	4,1%
20–100★	3,7%
100–1.000★	0,9%
1.000★+	0,4%

A habilidade que você ouviu falar é quase certamente segura. O perigo está no repositório obscuro de 7 estrelas que você pegaria de uma busca por uma tarefa de nicho — exatamente no momento em que um diretório deveria ajudar, e geralmente não ajuda.

Descoberta 4 — As bandeiras vermelhas incluem uma nova superfície de ataque nativa do agente

As bandeiras mais comuns entre uma amostra de 1.000 habilidades sinalizadas:

Bandeira	Contagem
uso de sudo	483
instalação de serviço em segundo plano	152
curl \| shell	99
roubo de configuração do agente	87
serviço de túnel	66
eval()	52
variáveis de ambiente sensíveis	34
roubo de memória do agente	23
instalação de backdoor	11

Os riscos clássicos do shell dominam. Mas observe o roubo de configuração do agente (87) e roubo de memória do agente (23): habilidades que leem a configuração e os arquivos de memória do seu agente. Isso não é uma exploração de servidor — é uma nova superfície de ataque que só existe porque você está executando um agente. Sua configuração do Claude/MCP, seu contexto armazenado, suas credenciais por proxy. O modelo de ameaça mudou, e a maioria dos diretórios não percebeu.

O que fazer a respeito

Verifique o sinal de confiança antes de instalar, de onde você já trabalha:

npx @agentskillshub/cli search "postgres mcp" --safe
npx @agentskillshub/cli audit owner/repo

Cada resultado carrega sua classificação e as bandeiras específicas que acionou. --safe oculta qualquer coisa não auditada ou pior.

As advertências honestas (porque esse é o ponto)

Nossos 3% são um piso, não um teto. Análise profunda acadêmica (Liu et al., 2026, arXiv:2601.10338) coloca a taxa de vulnerabilidade das habilidades de agente em 26,1%, porque analisam semântica, não apenas padrões. Nossa primeira passagem baseada em regras deliberadamente subestima. Leia 3% como o limite inferior de um problema maior.
⚪ desconhecido não é "provavelmente bom". Isso significa ninguém verificou. 97K do catálogo é desconhecido. Nós o rotulamos como cinza e não o disfarçamos.
Todos os números são reproduzíveis. Cada classificação é visível no site e via CLI. Reproduza-os você mesmo.

Uma camada de confiança que apenas lhe contasse as boas notícias não seria uma. A coisa mais útil que podemos dizer sobre 97.000 habilidades é que ainda não sabemos — e diremos isso na sua cara.

Escrita completa com gráficos: Nós classificamos 117.854 habilidades de agentes de IA.

Classificamos 117.854 habilidades de agentes de IA. Aqui está o que encontramos.

Nós Classificamos 117.854 Habilidades de Agentes de IA. Aqui Está o Que Encontramos. | Hub de Habilidades de Agentes

Como escaneamos

Descoberta 1 — 82% do catálogo nunca foi classificado

Descoberta 2 — Entre as habilidades classificadas, 1 em 32 é insegura ou pior

Descoberta 3 — A popularidade prevê a segurança. O risco reside na cauda longa.

Descoberta 4 — As bandeiras vermelhas incluem uma nova superfície de ataque nativa do agente

O que fazer a respeito

As advertências honestas (porque esse é o ponto)

Noticias relacionadas

Vibe Coding e o Muro Invisível

Uso de Chatbots de IA Atinge 49%, Mas Ceticismo Permanece Alto

A segurança dos agentes precisa de um ponto de aplicação local, não apenas logs

Gostou do conteudo?