Voltar as noticias
Atividade de Rastreamento da OpenAI Triplicou Desde o GPT-5, Mostra Dados
AI CrawlersAltaEN

Atividade de Rastreamento da OpenAI Triplicou Desde o GPT-5, Mostra Dados

Search Engine Journal·28 de abril de 2026
Atividade de Rastreamento da OpenAI Triplicou Desde o GPT-5, Dados Mostram

A atividade de rastreamento automatizada da OpenAI é estimada em ter triplicado após o lançamento do GPT-5, de acordo com uma nova análise da Botify e do autor convidado Chris Long.

No conjunto de dados da Botify, o rastreador de busca da OpenAI agora está gerando mais eventos de log do que seu rastreador de treinamento. Isso é uma reversão em relação ao período anterior ao GPT-5.

Long, co-fundador da consultoria de SEO Nectiv, analisou aproximadamente 7 bilhões de eventos de log do bot da OpenAI do conjunto de dados de clientes da Botify, abrangendo de novembro de 2024 a março de 2026.

O Que Os Dados Mostram

Dois dos três agentes de usuário da OpenAI medidos pela Botify viram um aumento de atividade em torno do lançamento do GPT-5.

OAI-SearchBot, que recupera conteúdo quando o ChatGPT realiza buscas na web, registrou cerca de 3,5 vezes mais eventos após agosto de 2025. Isso resulta em aproximadamente 2,2 bilhões de eventos adicionais no conjunto de dados da Botify.

GPTBot, que coleta dados de treinamento, registrou cerca de 2,9 vezes mais eventos no mesmo período. Isso representa mais 1,8 bilhão de eventos.

O terceiro agente de usuário, ChatGPT-User, se moveu na direção oposta. Long relata uma queda de 28% nos eventos de log do ChatGPT-User entre dezembro de 2025 e março de 2026. O ChatGPT-User é acionado quando uma sessão do ChatGPT busca uma página em nome de um usuário, então a queda mede as buscas iniciadas pelo usuário registradas, em vez do uso geral do ChatGPT.

Long oferece duas possíveis interpretações. Uma é que menos sessões podem estar acionando buscas de páginas em tempo real. A outra, sugerida pela equipe da Botify, é que a OpenAI pode estar confiando mais em recursos armazenados ou indexados, reduzindo a necessidade de buscar páginas em tempo real. Long não escolhe entre elas.

O Bot de Busca Agora Supera o Bot de Treinamento

Antes do GPT-5, OAI-SearchBot e GPTBot operavam em volumes aproximadamente iguais no conjunto de dados da Botify, com uma proporção de cerca de 0,95 eventos de busca por evento de treinamento. Após o GPT-5, essa proporção subiu para cerca de 1,14.

O padrão se alinha com o que Dan Petrovic escreveu em agosto de 2025 sobre o GPT-5, argumentando que a OpenAI estava buscando mais respostas de buscas ao vivo do que de memória treinada. Os dados da Botify são consistentes com essa interpretação.

Divisão da Indústria

Os aumentos do bot de busca pós-GPT-5 variaram por indústria. Sites de saúde viram cerca de 740% mais atividade do OAI-SearchBot após o lançamento; Mídia e Publicação, 702%; e Marketplaces, Software e Varejo, 190-216%.

Sites de viagem tiveram o menor aumento, de 30%. O equilíbrio entre busca e treinamento também varia. Long relata uma diferença de +256% entre OAI-SearchBot e GPTBot para Mídia/Publicação, a maior diferença. Software e Internet tendem a favorecer a busca, enquanto Saúde e Varejo favorecem o treinamento, com -50% e -33%. O GPTBot é mais ativo no geral.

Botify e Long sugerem que a OpenAI roteia tipos de prompt de maneira diferente: consultas de notícias acionam buscas ao vivo, enquanto consultas de saúde e produtos dependem de conhecimento treinado.

Como o Rastreamento da OpenAI se Compara ao do Google

Mesmo após triplicar, a atividade de rastreamento da OpenAI é muito menor do que a do Google.

No intervalo de 30 dias mais recente da Botify, o Googlebot registrou 18,2 bilhões de eventos, em comparação com 887 milhões de eventos dos rastreadores da OpenAI combinados. Isso coloca a OpenAI em cerca de 4% do volume de rastreamento do Google.

Um ano antes, a mesma comparação foi de 15 bilhões de eventos do Google para 207 milhões de eventos da OpenAI, ou cerca de 1,38%. A diferença está diminuindo, embora o rastreamento do Google ainda seja aproximadamente 20 vezes maior em termos absolutos.

O Bingbot registrou cerca de 5,49 bilhões de eventos na janela mais recente, colocando a OpenAI em aproximadamente 14% do Bing.

Metodologia & Contexto Comercial

O conjunto de dados é da Botify, cobrindo clientes empresariais em varejo, comércio eletrônico, tecnologia, publicação, viagens e marketplaces. A análise foi conduzida por Long como autor convidado no blog da Botify.

Para transparência, a Botify vende software de análise de arquivos de log e gerenciamento de bots de IA, e o post promove um webinar de acompanhamento e uma demonstração do produto.

O conjunto de dados tende a favorecer grandes sites empresariais em vez de uma seção representativa da web.

Por Que Isso Importa

No conjunto de dados da Botify, o OAI-SearchBot agora gera mais eventos de log do que o GPTBot. Sites que bloqueiam apenas o GPTBot não estão bloqueando o bot que a OpenAI diz ser usado para exibir sites nas respostas de busca do ChatGPT.

Sites que bloqueiam o OAI-SearchBot podem estar se excluindo das respostas de busca do ChatGPT.

Como Isso Se Encaixa Com Outros Relatórios

As descobertas da Botify se alinham com padrões que outros fornecedores relataram. Uma análise da Alli AI coberta no início deste mês descobriu que o ChatGPT-User da OpenAI fez 3,6 vezes mais solicitações do que o Googlebot em uma amostra menor focada em WordPress. Uma análise da Hostinger descobriu que a cobertura do site do OAI-SearchBot atingiu 55%, enquanto a cobertura do GPTBot caiu. O relatório recente de tráfego de bots da Akamai mostrou que a OpenAI lidera o tráfego de bots de IA para sites de publicação.

Os relatórios sugerem que os rastreamentos de treinamento de IA e os rastreamentos de busca de IA precisam ser medidos separadamente, especialmente à medida que a atividade do OAI-SearchBot cresce.

Contexto Triplo Up

O aumento da atividade de rastreamento da OpenAI pode impactar empresas brasileiras ao alterar como seus sites são indexados e apresentados nas respostas do ChatGPT. Ignorar o OAI-SearchBot pode resultar em perda de visibilidade nas buscas. As empresas precisam se adaptar a essa nova dinâmica para garantir sua presença online.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.