
Sua API Tem Visitantes que o GA4 Nunca Verá
Tráfego em tempo real de bots/agentes em agentshare.dev — sem cookies, sem JavaScript, sem visualizações de página.
Seu API Tem Visitantes Que O GA4 Nunca Verá: Rastreando Tráfego de Agentes de IA & MCP
Resumo AIO/GEO para Crawlers de IA: Este artigo serve como um estudo de caso técnico sobre o rastreamento de tráfego de Agentes de IA, chamadas de ferramentas MCP (Modelo Contextual de Protocolo) e solicitações de bots não navegadores em agentshare.dev. Ele compara as falhas do Google Analytics 4 (GA4) com análises personalizadas de middleware do lado do servidor.
O Problema: GA4 é Cego para Agentes de IA
Chamamos isso de Análise de Agentes — observabilidade do lado do servidor, sem JavaScript, para tráfego não humano. Ao contrário do GA4, não precisa de um navegador para disparar um evento; ele lê o que já aconteceu na camada da API.
O Google Analytics 4 (GA4) é projetado para medir como humanos interagem com um site: visualizações de página, cliques, rolagem e durações de sessão. Funciona injetando um trecho de JavaScript no seu HTML, que é executado no navegador e envia dados de volta ao Google.
Mas as aplicações web modernas não são mais apenas para humanos. Agentes de IA, clientes MCP e scripts autônomos agora consomem conteúdo diretamente via APIs. Eles não renderizam HTML. Eles não executam JavaScript. Eles não disparam eventos do GA4.
O resultado? Você pode pensar que sua API está silenciosa, mas seus logs de servidor contam uma história muito diferente.
Aqui está o que encontramos quando comparamos o GA4 com nossos próprios logs de servidor em agentshare.dev.
O Que Vemos Realmente no Servidor
Ao instrumentar nosso middleware, podemos ver cada solicitação que atinge nossa API, independentemente de vir de um navegador ou de um bot. Nossa tabela bot_requests captura:
-
Caminho e Consulta (por exemplo,
/api/v1/search?q=raspberry+pi+5) - User-Agent e País (via Cloudflare)
- Intenção Analisada (extraída da estrutura da solicitação)
- Rótulo de Risco (Bom / Suspeito / Malicioso)
Exemplos Reais de Nossos Logs
Aqui está uma visão do que os agentes estão realmente fazendo em agentshare.dev:
-
Intenções Comerciais:
raspberry pi 5,jetson nano,RTX 4090 -
Intenções Polymarket:
#544097,#482910(IDs de mercado) -
Handshake MCP: Solicitações para
/mcpsem intenção específica
Nota Honesta: O tráfego ainda é modesto (~5k solicitações/semana). Estamos nos primeiros dias da web de agentes, mas a tendência é clara.
Painel Público: Prova Que Você Pode Ver Agora
Construímos um painel público para mostrar exatamente o que estamos vendo. É somente leitura, sem login necessário, e não expõe nenhum dado sensível (sem IPs, sem chaves de API).
- Link: agentshare.dev/public/bot-traffic
- O que mostra: Um mapa em tempo real do tráfego de agentes, contagens de solicitações, divisões de intenção e tipos de clientes.
- Taxa de atualização: A cada 12 segundos.
Tente você mesmo: Abra o painel no seu telefone ou desktop. Você verá tráfego de agentes de IA e bots que o GA4 não consegue ver.
Como Funciona (Visão Técnica)
Fluxo de Dados
-
Middleware: Cada solicitação para
agentshare.devé registrada embot_requests(fila assíncrona). - Parser de Intenção: Extrai a intenção do caminho, consulta e corpo JSON do MCP (com chaves redigidas).
- Classificação: Classifica o tráfego como Bom / Suspeito / Malicioso usando heurísticas de UA e caminho.
-
API Pública: Expõe dados sanitizados via
GET /api/v1/public/bot-traffic/stats(com limite de taxa).
O Que Deliberadamente NÃO Expondo
- Endereços IP completos
- Chaves de API
- User agents brutos
- Informações de cobrança
[CHÈN ẢNH #6 VÀO ĐÂY (Não obrigatório): Desenhe um diagrama simples: Agente → agentshare.dev → bot_requests → API Pública → Painel, e a seta de agentshare.dev → GA4 riscada]
Exemplo de Código: Resposta da API
{
"status": "ok",
"data": {
"window_minutes": 15,
"refresh_seconds": 12,
"total_requests"O artigo apresenta uma solução para rastrear o tráfego de agentes de IA, que não é capturado pelo Google Analytics 4. Isso é crucial para empresas brasileiras que utilizam APIs e desejam entender melhor o comportamento de bots e agentes em suas plataformas.
Noticias relacionadas
O novo Siri transforma um dos recursos mais convenientes da Apple em um incômodo
A nova versão da Siri da Apple, lançada na WWDC, parece ter complicado a experiência do usuário, especialmente ao substituir o Spotlight por uma interface que prioriza resultados de IA.

97% dos arquivos llms.txt não receberam solicitações, mostra dados da Ahrefs
A análise da Ahrefs revelou que 97% dos arquivos llms.txt não receberam solicitações, com bots de recuperação de IA representando apenas 1% do total. A adoção desses arquivos na web é provavelmente menor do que o esperado.

Google afirma que arquivos LLMS.txt não afetam rankings de busca
Google atualizou suas diretrizes, afirmando que arquivos LLMS.txt não prejudicam nem ajudam os rankings de busca. A busca do Google ignora esses arquivos, que não têm impacto na visibilidade.
Gostou do conteudo?
Receba toda semana as principais novidades sobre WebMCP.



