
Criei uma memória persistente para Claude por $0/mês usando Cloudflare
Eu dei ao Claude uma memória persistente por $0/mês usando Cloudflare
Claude é ótimo. Mas toda vez que você começa uma nova conversa, ele esquece tudo. Seus projetos, suas preferências, o que você decidiu na semana passada — desaparecido.
A funcionalidade oficial de memória existe, mas é vaga e você não pode realmente controlá-la. Você não pode consultá-la, etiquetá-la ou pesquisá-la semanticamente. É uma caixa-preta que ocasionalmente revela algo útil.
Então eu construí a minha própria.
O que é
É um servidor MCP auto-hospedado que roda em Cloudflare Workers. Quatro ferramentas: remember, recall, list_recent, forget. Claude as chama automaticamente. Você nunca pensa sobre isso.
A parte interessante é como o recall funciona — não é uma busca por palavras-chave. Cada nota é incorporada como um vetor de 384 dimensões usando bge-small-en-v1.5 no Workers AI. Quando você pergunta algo ao Claude, ele busca por significado, não por palavras exatas.
Armazenar: "os usuários desistem na etapa de pagamento."
Consulta: "problemas de integração."
Ele encontra. Nenhuma sobreposição de palavras-chave necessária.
Por que Cloudflare
Honestamente, custo. Todo o stack — Workers, D1 (SQLite), Vectorize, embeddings do Workers AI — roda no nível gratuito do Cloudflare em escala pessoal. Você não precisa nem de um cartão de crédito para começar.
A outra razão é a implantação. Há um botão de implantação com um clique que provisiona tudo automaticamente. Leva cerca de 3 minutos para ir de zero a um cérebro secundário em funcionamento conectado ao Claude Desktop.
Como configurá-lo
1. Implantar — clique no botão no repositório, o Cloudflare provisiona D1 + Vectorize e implanta o Worker.
2. Execute o esquema — um trecho SQL no painel do Cloudflare.
3. Defina seu token de autenticação — um comando com o wrangler.
4. Conecte o Claude Desktop — adicione algumas linhas ao seu JSON de configuração:
{
"mcpServers": {
"second-brain": {
"command": "npx",
"args": ["mcp-remote", "https://<seu-url-do-worker>/mcp"]
}
}
}
É isso. Claude agora tem memória persistente em todas as conversas.
Para o que eu realmente uso
Eu configurei o Claude para chamar recall no início de cada conversa, antes de dizer qualquer coisa. Então, quando eu abro um novo chat e digo "continue o trabalho de integração da semana passada", ele já sabe o que isso significa.
Eu também capturo de todos os lugares — há um bookmarklet do navegador que salva qualquer texto ou página destacada com um clique, e atalhos do iOS para captura de voz em movimento. "Ei Siri, despejo de cérebro" e eu posso ditar uma nota que aparece imediatamente na memória do Claude.
O que ele não faz (ainda)
Não há uma interface para navegar pela sua memória. Você pode acessar o endpoint /list, mas é JSON bruto. Eu quero construir um painel adequado eventualmente — algo que mostre sua memória visualmente, permita editar ou excluir entradas, talvez mostre o que Claude recordou com mais frequência.
Além disso, a experiência de desenvolvimento local é um pouco irritante porque Vectorize e Workers AI não rodam localmente — você acaba apontando para recursos remotos para testes reais. Não é um obstáculo, mas vale a pena saber.
O repositório
Tudo é open source sob a licença MIT. Implantação com um clique, instruções de configuração manual, modelos de atalhos do iOS, fonte do bookmarklet — está tudo lá.
→ github.com/rahilp/second-brain-cloudflare
Se você usar, eu realmente gostaria de saber o que você acaba armazenando nele. Essa é a parte que mais me intriga — o que as pessoas realmente acham que vale a pena lembrar.
A implementação de uma memória persistente para agentes de IA como Claude pode melhorar a experiência do usuário e a eficiência em projetos. Empresas brasileiras podem se beneficiar ao integrar soluções semelhantes para otimizar interações com clientes e processos internos.


