Voltar as noticias
Integre YouTube com Claude usando MCP
MCP ProtocolAltaEN

Integre YouTube com Claude usando MCP

Dev.to - MCP·3 de junho de 2026

Oi 👋 — compartilhando algo em que estive trabalhando ultimamente, caso seja útil para alguém que esteja fazendo coisas semelhantes.

Contexto rápido: eu uso o Claude muito para explorar o YouTube — palestras de conferências, tutoriais, o ocasional podcast de 2 horas. E o fluxo de trabalho sempre era a mesma dança irritante: abrir o vídeo, clicar em "Mostrar transcrição", copiar a parede de texto, colar no Claude, fazer minha pergunta. Toda. Santa. Vez. E você perde os timestamps, então quando o Claude diz "eles mencionam X por volta do meio", você não consegue voltar facilmente e verificar.

Em algum momento, isso me incomodou o suficiente para eu construir uma coisinha para consertar. É um servidor MCP — basicamente um pequeno programa que fornece ao Claude (ou Cursor / Windsurf) um conjunto de ferramentas do YouTube para que ele possa simplesmente... fazer a busca por conta própria. Eu o chamei de Scribefy. (Atenção: é meu próprio projeto, então leve a propaganda com uma pitada de sal — mas as partes sobre como funciona se aplicam a qualquer servidor MCP do YouTube.)

O que ele realmente faz

Uma vez conectado, o assistente recebe quatro ferramentas:

  • search_videos — pesquisar no YouTube
  • get_video_metadata — título, canal, duração, se tem legendas
  • get_related_videos — a lista de "próximos"
  • extract_transcript — a transcrição completa, com timestamps

Então agora eu só colo uma URL e digo "resuma isso com timestamps", ou até "me encontre 3 vídeos sobre X e me diga onde eles discordam" — e ele descobre o resto. Sem copiar e colar.

Para quem isso é realmente útil

Começou como uma coisa de "coçar minha própria coceira", mas os casos de uso acabaram sendo muito mais amplos do que eu esperava. Alguns que continuam surgindo:

  • Estudantes — coloque uma palestra de 90 minutos e obtenha as 10 coisas que você realmente precisa para o exame, com timestamps das partes que valem a pena rever. Melhor do que ficar arrastando a barra de progresso em busca daquele slide que você meio que se lembra.
  • Pesquisadores — trate uma pilha de palestras/entrevistas como uma mini revisão de literatura: "o que esses cinco vídeos concordam e discordam?" — e obtenha citações que você pode referenciar até o segundo exato.
  • Criadores de conteúdo — veja o que já foi dito sobre um tópico antes de filmar, ou transforme um dos seus próprios vídeos em notas de apresentação, um post de blog e um thread em uma única passada. (A jogada de reaproveitar um vídeo em cinco formatos.)
  • Traders iniciantes — o canto de forex/trading do YouTube é infinito com vídeos de análise de uma hora. Em vez de reassistir, você pode extrair a configuração real, regras e níveis que um vídeo apresenta e fazer perguntas de acompanhamento. (Não é conselho financeiro, obviamente — apenas uma maneira muito mais rápida de digerir o conteúdo educacional.)

Pessoas diferentes, mesma truque central: deixe a IA ler o vídeo para que você não precise assistir a tudo.

Se você quiser experimentar

É um pacote npx, mesma configuração no Claude Desktop, Cursor e Windsurf:

{
"mcpServers": {
"scribefy": {
"command": "npx",
"args": ["-y", "scribefy-mcp"],
"env": { "SCRIBEFY_API_KEY": "sk_live_…" }
}
}
}

(Claude Desktop → Configurações → Desenvolvedor → Editar Config. Cursor → ~/.cursor/mcp.json. Windsurf → ~/.codeium/windsurf/mcp_config.json, então Atualizar.) Reinicie e as ferramentas aparecerão. Há uma chave + alguns créditos gratuitos para brincar.

A parte que eu realmente acho interessante

Não se trata realmente de uma transcrição. É que o assistente pode pesquisar um tópico inteiro por conta própria — procurar candidatos, olhar os metadados para descartar os de 3 horas, e então apenas puxar transcrições para o punhado que vale a pena ler. A pesquisa e os metadados são gratuitos, então explorar um tópico continua barato e você só "gasta" nos vídeos que realmente usa.

E os timestamps importam mais do que eu esperava — o Claude pode dizer "às 12:40 eles argumentam..." e eu posso clicar diretamente lá para verificar, em vez de confiar em um resumo de vibra de um vídeo de 40 minutos.

As partes honestas (porque eu odeio posts que pulam isso)

  • É apenas para YouTube, e o vídeo precisa ter legendas (as geradas automaticamente contam). Ele não faz sua própria conversão de fala para texto, então um vídeo sem legendas é um não-go.
  • Existem também servidores MCP do YouTube gratuitos e de código aberto. Se você está sensível a custos e não se importa com a quebra ocasional quando o YouTube muda algo por trás das câmeras, esses são um caminho totalmente legítimo. O meu é uma coisa hospedada/paga que troca dinheiro por confiabilidade (passa por um proxy residencial para não ser bloqueado por bots) além das ferramentas extras de pesquisa/metadados.

Então — não é mágica, não é para todo mundo. Mas se o YouTube faz parte de como você aprende ou trabalha, ter a IA fazendo a visualização e a extração foi uma atualização genuinamente agradável.

Onde estou

Está bem novo — acabei de listá-lo no registro oficial do MCP e estou lentamente contando às pessoas. Honestamente, ainda estou descobrindo o que as pessoas realmente querem que ele faça, então se você experimentar (ou se você construiu algo semelhante), eu adoraria ouvir quais ferramentas você gostaria que seu agente tivesse para o YouTube.

De qualquer forma — essa é a coisa. De volta à construção. 🛠️

Contexto Triplo Up

A integração do MCP com YouTube pode revolucionar a forma como empresas e profissionais brasileiros consomem conteúdo educacional. Com a automação da extração de dados, é possível economizar tempo e aumentar a produtividade. Isso é especialmente útil em setores como educação e marketing digital.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.