
O CEO da Y Combinator Criou Seu Próprio Cérebro de IA e Tornou-o Open Source
Introdução
"Este não é um experimento. Este é o sistema de produção que eu realmente uso."
Este é o artigo No.46 da série "Um Projeto de Código Aberto por Dia". O projeto de hoje é GBrain (GitHub).
Comece com quem o construiu, porque isso importa: Garry Tan é o atual Presidente e CEO da Y Combinator. Ele co-fundou a Initialized Capital (gerenciando $700M em seu auge), escreveu o primeiro cheque semente para a Coinbase em 2012, liderou investimentos iniciais na Instacart e Flexport, e apareceu na lista Midas da Forbes de principais investidores globais todos os anos desde 2018.
Essa pessoa se sentou, escreveu código, construiu um sistema de memória de IA e o tornou de código aberto.
O que torna isso ainda mais impressionante: este não é um projeto de demonstração. O GBrain é o sistema de produção que Tan usa todos os dias. Ele atualmente gerencia 17.888 documentos, 4.383 contatos e 723 empresas — toda a sua rede de conhecimento de empresas do portfólio, relacionamentos com fundadores e sinais de mercado. Quando um VC de alto nível aposta sua infraestrutura intelectual central em uma ferramenta de código aberto, essa é a endosse mais credível possível.
10k+ Estrelas, 1.2k+ Forks — o projeto de código aberto mais carregado de identidade no espaço de memória de IA atualmente.
O Que Você Vai Aprender
- Filosofia de design "Brain-First" do GBrain: por que você consulta a memória local antes de chamar APIs externas
- Arquitetura de busca híbrida: fusão de vetor + palavra-chave RRF alcançando 95% Recall@5
- Auto-conexão de gráfico de conhecimento Zero-LLM: 5 tipos de relacionamento extraídos com regex puro
- Fila de tarefas Minions: operações determinísticas 13x mais rápidas que sub-agentes LLM
- Padrão de "página compilada": rastreamento da evolução do conhecimento semelhante ao Git
Pré-requisitos
- Compreensão básica de Agentes de IA e limitações da janela de contexto
- Fundamentos de TypeScript/JavaScript (opcional)
- Familiaridade com Obsidian, Notion ou ferramentas PKM similares (ajuda com o contexto do caso de uso)
Contexto do Projeto
O Que É?
GBrain é um sistema de memória persistente e gerenciamento de conhecimento de Agente de IA que dá aos assistentes de IA um "cérebro" semântico pesquisável entre sessões via o padrão MCP (Modelo de Contexto de Protocolo).
Filosofia de design: Brain-First
Fluxo de trabalho tradicional do Agente:
Recebe pergunta → Chama diretamente API externa (busca/banco de dados/ferramentas)
Problema: Puxa dados de fora toda vez — repetitivo, caro, sem acumulação
Fluxo de trabalho Brain-First do GBrain:
Recebe pergunta → Consulta o cérebro local (gráfico de conhecimento indexado) primeiro
→ Acertou? Responde diretamente, custo adicional zero
→ Errou? Chama API externa → Escreve resultado de volta para o cérebro → Acertou da próxima vez
Resultado: O cérebro fica mais inteligente e mais barato a cada uso
Sobre o Autor: Garry Tan
O histórico de Garry Tan tem mais profundidade técnica do que a maioria dos VCs:
- BS em Engenharia de Sistemas de Computador pela Stanford; após a graduação, juntou-se à Microsoft, depois se tornou o 10º funcionário da Palantir
- Co-fundou a plataforma de blogs Posterous em 2008; adquirida pelo Twitter por $20M em 2012
- Entrou na YC como Parceiro de Design; pessoalmente escreveu o primeiro cheque semente para a Coinbase em 2012
- Co-fundou a Initialized Capital, gerenciou $700M, liderou investimentos na Instacart, Flexport, Coinbase
- Nomeado para a lista Midas da Forbes todos os anos desde 2018
- Se tornou CEO da Y Combinator em janeiro de 2023, lançou uma iniciativa de captação de recursos de $2B
Ele manteve um canal ativo no YouTube compartilhando conteúdo técnico ao longo do tempo — ele é uma das poucas pessoas em VC que ainda realmente escreve código. O GBrain é o produto direto dessa dupla identidade.
Estatísticas do Projeto
- ⭐ Estrelas do GitHub: 10.400+
- 🍴 Forks: 1.200+
- 🐛 Problemas Abertos: 75+
- 📦 Última Versão: v0.16.4
- 📄 Licença: MIT
- 🌐 Linguagem principal: TypeScript (runtime Bun)
- 🧠 Uso ao vivo do autor: 17.888 páginas / 4.383 pessoas / 723 empresas
Principais Recursos
Busca Híbrida: Fusão RRF, 95% Recall@5
O mecanismo de recuperação do GBrain combina busca vetorial e busca por palavra-chave usando Fusão de Classificação Recíproca (RRF):
Pontuação RRF = Σ 1/(60 + classificação)
Exemplo:
Busca vetorial retorna: [Doc A #1, Doc B #2, Doc C #5]
Busca por palavra-chave retorna: [Doc B #1, Doc D #2, Doc A #4]
Doc A: 1/(60+1) + 1/(60+4) = 0.01639 + 0.01538 = 0.03177
Doc B: 1/(60+2) + 1/(60+1) = 0.01613 + 0.01639 = 0.03252 ← combinado no topo
Comparado à busca vetorial pura:
| Métrica | Vetorial Puro | Híbrido GBrain |
|---|---|---|
| Recall@5 | 83% | 95% |
| Precisão@5 | 39% | 45% |
| F1 do gráfico de conhecimento | 57.8% (grep) | 86.6% |
Auto-Conexão de Gráfico de Conhecimento Zero-LLM
Uma das escolhas de design mais interessantes do GBrain: extração automática de relacionamentos de entidades sem chamadas LLM.
Regex/matching de padrões extrai 5 tipos de relacionamento de texto Markdown:
Relacionamento Exemplos de padrões de gatilho
atendeu "encontrou X em...", "participou do X..."
trabalha_em "X é [cargo] em Y..."
investiu_em "liderou a Série A de Y..."
fundou "X fundou Y..."
advisou "X atua como conselheiro de Y..."
Na prática: quando Garry Tan escreve em suas anotações "chamada matinal com Brian Armstrong sobre o novo produto da Coinbase", o sistema cria automaticamente a aresta [garry-tan] --atendeu--> [brian-armstrong] em seu gráfico de conhecimento — sem gastar um único token.
Fila de Tarefas Minions: 13x Mais Rápida Que Sub-Agentes LLM
O GBrain divide o trabalho em duas faixas:
Operações determinísticas (Minions):
Analisar Markdown, construir links, sincronizar arquivos, extrair relações
Latência de execução: 753ms
Custo de token: zero
Raciocínio não determinístico (Agente LLM):
Resumir, responder perguntas, gerar insights
Latência de execução: 10+ segundos
Custo de token: dinheiro real
Minions operam em uma fila de tarefas persistente nativa do Postgres — segura contra falhas, auto-recuperável, sem trabalhos perdidos. A percepção chave: a maioria das operações de gerenciamento de conhecimento são determinísticas. Elas não precisam de um LLM. O GBrain elimina esse custo para zero.
26 Habilidades: Cobertura Completa de Memória de IA
| Categoria de Habilidade | Exemplos |
|---|---|
| Sempre Ativo | Detecção de sinal (reconhecimento automático de entidades), ciclo de leitura-enriquecimento-escrita do cérebro |
| Ingestão de Dados | Processamento de ideias, ingestão de mídia, transcrição de reuniões, importação de dados estruturados |
| Operações do Cérebro | Enriquecimento de conhecimento, consulta inteligente, manutenção, reparo de citações |
| Operações de Tarefas | Gerenciamento de tarefas, agendamento, relatórios, gatilhos de webhook |
| Gerenciamento de Identidade | Auditoria de alma, inicialização, migração de dados, briefing diário |
O GBrain representa uma inovação significativa na gestão de conhecimento para empresas, permitindo que agentes de IA operem de forma mais eficiente e econômica. A adoção de sistemas como o GBrain pode transformar a forma como as empresas brasileiras gerenciam informações e interações com clientes. Isso pode resultar em uma vantagem competitiva no mercado.
