
Google adiciona verificação de llms.txt ao Chrome Lighthouse

As novas auditorias “Navegação Agente” do Lighthouse do Google agora verificam a presença de um arquivo llms.txt. A nova documentação experimental do Lighthouse enquadra o llms.txt como um sinal de descobribilidade e eficiência para agentes de IA, não como uma diretiva tradicional de rastreamento.
- As auditorias fazem parte da nova categoria “Navegação Agente” do Chrome, que avalia se os sites estão estruturados para interação com máquinas.
- Este documento vem menos de uma semana após o Google publicar novas orientações sobre como otimizar para recursos de busca de IA, como Visões Gerais de IA e Modo IA, nas quais disse que você não precisa de arquivos llms.txt em uma seção de desmistificação de seu novo guia sobre otimização para recursos de IA generativa.
O que o Lighthouse agora verifica. A categoria de Navegação Agente do Lighthouse avalia “quão bem seu site está construído para interação com máquinas” usando auditorias determinísticas, de acordo com a documentação do Google. Entre as verificações:
- Integração WebMCP.
- Integridade da árvore de acessibilidade.
- Estabilidade de layout através do CLS.
- Presença de um arquivo llms.txt.
O Lighthouse verifica “a presença de um resumo legível por máquina na raiz do domínio.” O Google também explicou por que o arquivo é importante para os agentes:
“Sem llms.txt, os agentes podem gastar mais tempo rastreando o site para entender sua estrutura de alto nível e conteúdo principal.”
A categoria de auditoria não produz uma pontuação tradicional do Lighthouse (0-100). Em vez disso, o Google apresenta uma razão de aprovação fracionária junto com verificações de aprovação/reprovação ligadas a sinais de prontidão agente.
A tensão. A nova documentação do Lighthouse não entra em conflito direto com o conselho do Google sobre como otimizar seu site para recursos de IA generativa, pois essas auditorias se concentram em agentes de IA e ferramentas de navegador, não em classificações de busca do Google. No entanto, ver o llms.txt mencionado nas próprias verificações de prontidão do Chrome pode fazer com que alguns SEOs repensem dúvidas anteriores sobre o arquivo.
Otimização de motor agente. As auditorias do Lighthouse também estão alinhadas com as ideias que o diretor de engenharia de IA do Google Cloud, Addy Osmani, delineou em abril sobre Otimização de Motor Agente. Osmani disse que agentes de IA com janelas de contexto limitadas podem cortar páginas longas ou perder informações importantes enterradas muito profundamente no conteúdo. Entre suas recomendações:
- Estrutura semântica mais limpa.
- Conteúdo eficiente em tokens.
- Entrega em Markdown.
- Camadas de descoberta llms.txt.
- Arquivos de sinalização de capacidade, como AGENTS.md.
SEO vs. llms.txt. Aqui está exatamente o que o Google recomenda em Desmistificando a busca de IA generativa: o que você não precisa fazer:
- Arquivos LLMS.txt e outras marcações “especiais”: Você não precisa criar novos arquivos legíveis por máquina, arquivos de texto de IA, marcações ou Markdown para aparecer na busca de IA generativa. Note que o Google pode descobrir, rastrear e indexar muitos tipos de arquivos além de HTML em um site: isso não significa que o arquivo é tratado de uma maneira especial.
Aqui está o que John Mueller, do Google, disse sobre o uso do llms.txt pelo Google, em resposta a Lily Ray perguntando a ele no Bluesky “Ei @johnmu.com – se você puder responder, muitas pessoas estão apontando a ironia de que o Google usa arquivos LLMs.txt, além de páginas em markdown, apesar de também dizer que essas coisas não são necessárias para desempenho na busca. Você poderia compartilhar por que o Google poderia publicar esses arquivos, se não for para facilitar o rastreamento dessas páginas/sites? (Tenho certeza de que vou receber essa pergunta muitas vezes em breve!)”:
A resposta curta é que não é feito para busca. Há mais em sites do que apenas SEO :-).
A versão mais longa e nuançada é que vale a pena separar “descoberta” (encontrar o site ou páginas com um mecanismo de busca global) vs “funcionalidade” (provavelmente há um termo mais preciso para isso, mas basicamente: uma vez que alguém encontrou a página, ajudando-os a fazer melhor a tarefa que desejam realizar).
Talvez isso seja semelhante a CTAs em páginas tradicionais? Você não “faz isso” para SEO (para ser encontrado), mas se você é responsável pelo site como um todo, garantir uma alta “taxa de descoberta” (SEO) junto com uma alta taxa de conversão é útil para justificar seu trabalho.
Para voltar ao site developers.google.com, a codificação de IA se tornou muito popular, e esses sistemas de codificação podem ser (eu acho) eficientes e precisos com o código que produzem se puderem ler/interpretar facilmente material de referência, como documentação para desenvolvedores.
Nesses casos, pode ajudar dar a eles uma maneira de entender o contexto da documentação que estão analisando, bem como uma versão simplificada da página de referência (por exemplo, em markdown). É CLARO que eles podem ler HTML muito bem, então isso é, na minha opinião, mais uma muleta temporária, talvez para economizar alguns tokens.
Para sites que não são de desenvolvedores, não acho que isso faça muito sentido, mesmo com mais tráfego agente no futuro (e se você verificar seus logs, você não está recebendo muito disso no momento). Fazer uma versão em markdown das especificações de um sapato não vai te trazer mais vendas (os concorrentes apreciam isso, no entanto).
E (eu sei, ninguém lê até aqui), se você acha que isso é importante se preparar para quando os agentes estiverem em toda parte: seu site (todos os sites) têm coisas muito mais importantes a fazer para SEO do que se preparar para uma situação futura potencial que pode ou não acontecer. Priorize necessidades antes de sonhos.
O que o Google diz que os agentes dependem. Além do llms.txt, a nova categoria do Lighthouse do Google enfatiza fortemente a acessibilidade e a estabilidade da interface. A documentação diz que os agentes dependem da árvore de acessibilidade como seu “modelo de dados primário.” O Lighthouse avalia especificamente:
- Rótulos programáticos para elementos interativos.
- Estrutura válida da árvore de acessibilidade.
- Se o conteúdo interativo está oculto de sistemas assistivos.
- Estabilidade de layout através do CLS.
O Google também alerta que ferramentas WebMCP registradas dinamicamente e grandes mudanças no DOM podem afetar os resultados da auditoria.
Por que nos importamos. O Google diz que você não precisa de llms.txt para Busca, mas o Chrome agora está verificando se o arquivo existe. Ao mesmo tempo, o Google
A nova verificação do Lighthouse pode impactar como as empresas brasileiras estruturam seus sites para interação com agentes de IA. A presença do llms.txt pode influenciar a eficiência do rastreamento por esses agentes, tornando-se um fator a ser considerado na otimização de sites.
