
Construindo com Claude Agent SDK? Aqui está a Pilha de Ferramentas MCP que Oferece Prova Visual
Construindo com o Claude Agent SDK? Aqui está a pilha de ferramentas MCP que lhe dá prova visual
Você está construindo com o Claude Agent SDK. Você o escolheu porque é nativo do MCP — o que significa que você não está preso a um ecossistema fechado. Você quer ferramentas MCP que ampliem o que seu agente pode fazer.
Mas aqui está a lacuna: Claude pode usar ferramentas. Claude pode chamar APIs. Claude pode navegar em aplicativos da web. Mas quando você pergunta "o que meu agente realmente viu?" — a saída de log do Claude não responde a isso.
É aí que o PageBolt se encaixa na sua pilha MCP.
O Problema da Pilha de Ferramentas MCP
O Claude Agent SDK fornece a infraestrutura do agente. Você adiciona ferramentas através dos servidores MCP. Uma pilha típica se parece com:
- Servidor MCP principal — sua lógica de agente personalizada
- Ferramenta de navegação na web — automação de navegador (Puppeteer, Playwright)
- Ferramentas de busca de dados — APIs, bancos de dados
- Ferramentas de ação — operações de escrita, exclusão, modificação
Mas ninguém pergunta: "O agente realmente viu o que esperávamos?" Você tem logs. Você tem respostas de API. Você não tem prova.
PageBolt como a Camada de Prova Visual
PageBolt é um servidor MCP que adiciona três capacidades críticas:
1. Captura de tela — Claude pode chamar capture_screenshot em qualquer etapa e obter um PNG do estado atual da página.
@mcp.tool()
async def capture_screenshot(url: str, selector: str = None) -> str:
"""Capture visual proof of what the agent sees."""
2. Repetição de etapas — Grave a execução passo a passo completa como vídeo. Veja o momento exato em que um agente navega, preenche um formulário ou encontra um erro.
3. Trilhas de auditoria — Cada captura de tela é carimbada com data e armazenada com seus logs. Correlacione a prova visual com os rastros de execução do agente.
Adicionando PageBolt à Sua Pilha de Agentes Claude
Uma instalação:
npm install pagebolt-mcp
Registre-o como uma ferramenta MCP na configuração do seu agente:
{
"mcp_servers": [
{
"name": "pagebolt",
"command": "npx",
"args": ["pagebolt-mcp"],
"env": {
"PAGEBOLT_API_KEY": "your_api_key"
}
}
]
}
Agora seu agente Claude tem acesso a:
-
capture_screenshot(url)— Obtenha um PNG do estado atual -
record_video(start_step, end_step)— Grave um fluxo de trabalho como vídeo -
inspect_page(url)— Inspeção leve do DOM (60-80% mais barato em custo de token do que capturas completas)
Exemplo Prático
Fluxo de trabalho do agente: "Navegar para o GitHub, verificar o status do PR, relatar descobertas."
1. O agente navega para https://github.com/my-org/my-repo/pulls
2. O agente chama: capture_screenshot("https://github.com/my-org/my-repo/pulls")
→ Retorna PNG do quadro de PR atual
3. O agente analisa a página e identifica PRs abertos
4. O agente navega para cada PR
5. O agente captura a captura de tela de cada página de detalhes do PR
6. O agente compila o relatório: "3 PRs abertos, todos passando nos testes"
7. Você revisa: capturas de tela originais provam que o agente viu a interface real do GitHub, não uma falsa
Nenhum log pode lhe dar essa confiança. Capturas de tela sim.
Por Que Isso Importa para Desenvolvedores do Claude Agent SDK
Você escolheu o Claude Agent SDK por sua flexibilidade e arquitetura nativa do MCP. Você quer ferramentas que controla, não uma plataforma bloqueada.
PageBolt é uma ferramenta nativa do MCP que respeita essa filosofia. Não substitui sua estrutura de agente. Adiciona uma única e poderosa capacidade: prova visual.
Quando auditores perguntam "seu agente fez o que você diz que fez?" você mostra a eles a linha do tempo das capturas de tela. Quando você está depurando por que um agente falhou, você vê exatamente como a página estava no momento em que falhou.
Essa é a camada de prova visual que sua pilha precisa.
Começando
- Instale o PageBolt MCP:
npm install pagebolt-mcp - Adicione à configuração do seu agente (veja acima)
- Defina
PAGEBOLT_API_KEY(plano gratuito: 100 solicitações/mês) - Chame
capture_screenshotem seus fluxos de trabalho de agente em etapas críticas - Armazene capturas de tela ao lado dos logs para conformidade de auditoria
Seu Claude Agent SDK agora tem prova visual integrada.
PageBolt MCP é de código aberto e totalmente compatível com auto-hospedagem. Plano gratuito: 100 solicitações/mês. Comece agora.
Para empresas brasileiras que utilizam o Claude Agent SDK, a integração do PageBolt pode aumentar a confiança nas operações automatizadas. A capacidade de fornecer provas visuais pode ser crucial para auditorias e para a validação de processos, melhorando a transparência e a eficiência.


