Voltar as noticias
O CEO da Y Combinator Criou Seu Próprio Cérebro de IA e Tornou-o Open Source
Agentic SEOAltaEN

O CEO da Y Combinator Criou Seu Próprio Cérebro de IA e Tornou-o Open Source

Dev.to - MCP·23 de abril de 2026

Introdução

"Este não é um experimento. Este é o sistema de produção que eu realmente uso."

Este é o artigo No.46 da série "Um Projeto de Código Aberto por Dia". O projeto de hoje é GBrain (GitHub).

Comece com quem o construiu, porque isso importa: Garry Tan é o atual Presidente e CEO da Y Combinator. Ele co-fundou a Initialized Capital (gerenciando $700M em seu auge), escreveu o primeiro cheque semente para a Coinbase em 2012, liderou investimentos iniciais na Instacart e Flexport, e apareceu na lista Midas da Forbes de principais investidores globais todos os anos desde 2018.

Essa pessoa se sentou, escreveu código, construiu um sistema de memória de IA e o tornou de código aberto.

O que torna isso ainda mais impressionante: este não é um projeto de demonstração. O GBrain é o sistema de produção que Tan usa todos os dias. Ele atualmente gerencia 17.888 documentos, 4.383 contatos e 723 empresas — toda a sua rede de conhecimento de empresas do portfólio, relacionamentos com fundadores e sinais de mercado. Quando um VC de alto nível aposta sua infraestrutura intelectual central em uma ferramenta de código aberto, essa é a endosse mais credível possível.

10k+ Estrelas, 1.2k+ Forks — o projeto de código aberto mais carregado de identidade no espaço de memória de IA atualmente.

O Que Você Vai Aprender

  • Filosofia de design "Brain-First" do GBrain: por que você consulta a memória local antes de chamar APIs externas
  • Arquitetura de busca híbrida: fusão de vetor + palavra-chave RRF alcançando 95% Recall@5
  • Auto-conexão de gráfico de conhecimento Zero-LLM: 5 tipos de relacionamento extraídos com regex puro
  • Fila de tarefas Minions: operações determinísticas 13x mais rápidas que sub-agentes LLM
  • Padrão de "página compilada": rastreamento da evolução do conhecimento semelhante ao Git

Pré-requisitos

  • Compreensão básica de Agentes de IA e limitações da janela de contexto
  • Fundamentos de TypeScript/JavaScript (opcional)
  • Familiaridade com Obsidian, Notion ou ferramentas PKM similares (ajuda com o contexto do caso de uso)

Contexto do Projeto

O Que É?

GBrain é um sistema de memória persistente e gerenciamento de conhecimento de Agente de IA que dá aos assistentes de IA um "cérebro" semântico pesquisável entre sessões via o padrão MCP (Modelo de Contexto de Protocolo).

Filosofia de design: Brain-First

Fluxo de trabalho tradicional do Agente:
  Recebe pergunta → Chama diretamente API externa (busca/banco de dados/ferramentas)
  Problema: Puxa dados de fora toda vez — repetitivo, caro, sem acumulação

Fluxo de trabalho Brain-First do GBrain:
  Recebe pergunta → Consulta o cérebro local (gráfico de conhecimento indexado) primeiro
                   → Acertou? Responde diretamente, custo adicional zero
                   → Errou? Chama API externa → Escreve resultado de volta para o cérebro → Acertou da próxima vez
  Resultado: O cérebro fica mais inteligente e mais barato a cada uso

Sobre o Autor: Garry Tan

O histórico de Garry Tan tem mais profundidade técnica do que a maioria dos VCs:

  • BS em Engenharia de Sistemas de Computador pela Stanford; após a graduação, juntou-se à Microsoft, depois se tornou o 10º funcionário da Palantir
  • Co-fundou a plataforma de blogs Posterous em 2008; adquirida pelo Twitter por $20M em 2012
  • Entrou na YC como Parceiro de Design; pessoalmente escreveu o primeiro cheque semente para a Coinbase em 2012
  • Co-fundou a Initialized Capital, gerenciou $700M, liderou investimentos na Instacart, Flexport, Coinbase
  • Nomeado para a lista Midas da Forbes todos os anos desde 2018
  • Se tornou CEO da Y Combinator em janeiro de 2023, lançou uma iniciativa de captação de recursos de $2B

Ele manteve um canal ativo no YouTube compartilhando conteúdo técnico ao longo do tempo — ele é uma das poucas pessoas em VC que ainda realmente escreve código. O GBrain é o produto direto dessa dupla identidade.

Estatísticas do Projeto

  • Estrelas do GitHub: 10.400+
  • 🍴 Forks: 1.200+
  • 🐛 Problemas Abertos: 75+
  • 📦 Última Versão: v0.16.4
  • 📄 Licença: MIT
  • 🌐 Linguagem principal: TypeScript (runtime Bun)
  • 🧠 Uso ao vivo do autor: 17.888 páginas / 4.383 pessoas / 723 empresas

Principais Recursos

Busca Híbrida: Fusão RRF, 95% Recall@5

O mecanismo de recuperação do GBrain combina busca vetorial e busca por palavra-chave usando Fusão de Classificação Recíproca (RRF):

Pontuação RRF = Σ 1/(60 + classificação)

Exemplo:
  Busca vetorial retorna:   [Doc A #1, Doc B #2, Doc C #5]
  Busca por palavra-chave retorna:  [Doc B #1, Doc D #2, Doc A #4]

  Doc A: 1/(60+1) + 1/(60+4) = 0.01639 + 0.01538 = 0.03177
  Doc B: 1/(60+2) + 1/(60+1) = 0.01613 + 0.01639 = 0.03252  ← combinado no topo

Comparado à busca vetorial pura:

Métrica Vetorial Puro Híbrido GBrain
Recall@5 83% 95%
Precisão@5 39% 45%
F1 do gráfico de conhecimento 57.8% (grep) 86.6%

Auto-Conexão de Gráfico de Conhecimento Zero-LLM

Uma das escolhas de design mais interessantes do GBrain: extração automática de relacionamentos de entidades sem chamadas LLM.

Regex/matching de padrões extrai 5 tipos de relacionamento de texto Markdown:

Relacionamento     Exemplos de padrões de gatilho
atendeu       "encontrou X em...", "participou do X..."
trabalha_em       "X é [cargo] em Y..."
investiu_em    "liderou a Série A de Y..."
fundou        "X fundou Y..."
advisou        "X atua como conselheiro de Y..."

Na prática: quando Garry Tan escreve em suas anotações "chamada matinal com Brian Armstrong sobre o novo produto da Coinbase", o sistema cria automaticamente a aresta [garry-tan] --atendeu--> [brian-armstrong] em seu gráfico de conhecimento — sem gastar um único token.

Fila de Tarefas Minions: 13x Mais Rápida Que Sub-Agentes LLM

O GBrain divide o trabalho em duas faixas:

Operações determinísticas (Minions):
  Analisar Markdown, construir links, sincronizar arquivos, extrair relações
  Latência de execução: 753ms
  Custo de token: zero

Raciocínio não determinístico (Agente LLM):
  Resumir, responder perguntas, gerar insights
  Latência de execução: 10+ segundos
  Custo de token: dinheiro real

Minions operam em uma fila de tarefas persistente nativa do Postgres — segura contra falhas, auto-recuperável, sem trabalhos perdidos. A percepção chave: a maioria das operações de gerenciamento de conhecimento são determinísticas. Elas não precisam de um LLM. O GBrain elimina esse custo para zero.

26 Habilidades: Cobertura Completa de Memória de IA

Categoria de Habilidade Exemplos
Sempre Ativo Detecção de sinal (reconhecimento automático de entidades), ciclo de leitura-enriquecimento-escrita do cérebro
Ingestão de Dados Processamento de ideias, ingestão de mídia, transcrição de reuniões, importação de dados estruturados
Operações do Cérebro Enriquecimento de conhecimento, consulta inteligente, manutenção, reparo de citações
Operações de Tarefas Gerenciamento de tarefas, agendamento, relatórios, gatilhos de webhook
Gerenciamento de Identidade Auditoria de alma, inicialização, migração de dados, briefing diário
Contexto Triplo Up

O GBrain representa uma inovação significativa na gestão de conhecimento para empresas, permitindo que agentes de IA operem de forma mais eficiente e econômica. A adoção de sistemas como o GBrain pode transformar a forma como as empresas brasileiras gerenciam informações e interações com clientes. Isso pode resultar em uma vantagem competitiva no mercado.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.