Voltar as noticias
Seu agente de codificação de IA tem amnésia. Aqui está como eu consertei isso em todas as ferramentas.
MCP ProtocolAltaEN

Seu agente de codificação de IA tem amnésia. Aqui está como eu consertei isso em todas as ferramentas.

Dev.to - MCP·22 de junho de 2026

Agentes de codificação esquecem tudo entre as sessões e não compartilham nada entre as ferramentas. Aqui está o padrão que resolve isso: uma camada de memória sobre o MCP.

Você abre o Cursor na segunda-feira. Ele não tem ideia do que você decidiu na sexta.
Então você cola a arquitetura novamente. Você explica, novamente, por que não está usando aquela biblioteca. Você assiste ele cometer exatamente o mesmo erro que você corrigiu na semana passada, totalmente confiante sobre isso. Então você muda
para o Claude Code para algum trabalho no terminal e faz toda a dança novamente, porque o Cursor e o Claude Code não compartilham uma única coisa que sabem sobre seu projeto.

Cada sessão começa do zero. Cada agente entra cego.
O modelo não é o problema. Os modelos são ótimos. Eles simplesmente não têm memória. E a janela de contexto não é memória; é papel de rascunho. Ela é apagada quando a sessão termina, e você paga tokens
para preenchê-la novamente toda vez.

"Basta usar uma janela de contexto maior"

Esse é o reflexo. Maior contexto, prompt de sistema mais longo, cole todo o repositório e reze.

Isso não se sustenta:
• Ele reinicia. Feche a sessão; está perdido.
• Ele não viaja. O que o Cursor sabe e o que o Claude Code sabe são dois universos separados.
• É caro e perde informações. Você está pagando para reenviar as mesmas coisas, e o modelo ainda tem que procurar pela linha que importava.

Contexto é o que o modelo está olhando agora. Memória é o que ele sabe ao longo do tempo. Duas coisas diferentes. Agentes vêm com a primeira e agem como se isso fosse suficiente.

A solução real: uma camada de memória com a qual o agente se comunica através do MCP

Aqui está o movimento. Pare de empurrar memória para o prompt. Coloque-a atrás de algo que o agente possa ler e escrever, e exponha isso através de um protocolo que os agentes já falam: MCP, o Protocolo de Contexto do Modelo.

Se você já usou o Cursor, Claude Code, Cline ou Windsurf, você já usou o MCP, ou está a um bloco de configuração dele. É o padrão aberto que essas ferramentas usam para acessar dados externos. Um servidor de memória é apenas um servidor MCP com algumas ferramentas nele. Uma para salvar algo, uma para puxar as partes certas de volta mais tarde.

Agora o ciclo se inverte. Antes que o agente responda, ele pega o que já sabe sobre seu projeto.

Depois que ele faz algo que importa, ele escreve isso de volta. A memória fica fora de qualquer ferramenta específica, então cada agente que você executa puxa do mesmo lugar.

A memória não é uma coisa só

Esse é o ponto que a maioria das pessoas erra. Elas tratam a memória como um grande monte de texto.

São três coisas, e você quer as três:
• Semântica. O que é verdade sobre seu projeto? As decisões, as restrições, como as peças se encaixam
juntas. Um gráfico, não uma transcrição.
• Episódica. O que aconteceu e quando? O rastro com data e hora. Este é o que responde "espera,
por que foi construído assim" seis semanas depois.
• Procedimental. Como as coisas são feitas por aqui. Suas convenções, os passos que realmente funcionaram, a configuração que ninguém se lembra até sexta.

Um monte plano de anotações não lhe dá nada disso de forma clara. Dividi-lo em três é o que transforma "pesquisar minhas conversas antigas" em algo que o agente pode raciocinar.

Conectando tudo

Um bloco de configuração. Pegue uma chave de platform.octamem.com e aponte seu cliente para o servidor.
Cursor, ou qualquer coisa que leia uma configuração mcpServers, em .cursor/mcp.json:

*JSON · .cursor/mcp.json
*
{
"mcpServers": {
"octamem": {
"url": "https://mcp.octamem.com",
"headers": {
"Authorization": "Bearer ${OCTAMEM_API_KEY}"
}
}
}
}

Claude Code, uma linha:

BASH

servidor hospedado, então transporte HTTP

claude mcp add --transport http octamem https://mcp.octamem.com \
--header "Authorization: Bearer $OCTAMEM_API_KEY"

adicione --scope user se você quiser que esteja em todos os projetos, não apenas neste

claude mcp add --scope user --transport http octamem https://mcp.octamem.com \
--header "Authorization: Bearer $OCTAMEM_API_KEY"

Reinicie o cliente, execute /mcp para verificar se está conectado, pronto. O agente agora tem ferramentas de armazenamento e recuperação. Depois disso, é apenas solicitar. Ele decide quando escrever algo e quando puxá-lo de volta.

Aquele endpoint é o OctaMem, a coisa que estou construindo. Mais sobre isso no final. O padrão funciona com qualquer servidor de memória MCP, incluindo um improvisado que você escreva em uma tarde.

As partes difíceis, porque alguém nos comentários vai perguntar

Não vou agir como se isso estivesse resolvido e fácil. Os verdadeiros problemas começam depois que funciona.

Esquecimento. Memória que nunca esquece é uma responsabilidade. Se você decidiu algo há três meses e reverteu na semana passada, o agente não pode continuar citando a versão antiga. Ele tem que decair e atualizar, não apenas acumular.

Confiar no que ele puxou. Quando o agente recupera algo, você quer ver o que ele pegou e por quê. Isso se torna sério rapidamente, quanto mais próximo você estiver de uma base de código regulamentada, onde "a IA fez isso" não é
uma frase que você quer dizer a um auditor. A recuperação tem que ser algo que você possa realmente olhar.

Acesso. No momento em que a memória é compartilhada entre ferramentas e pessoas, você tem que decidir quem lê o quê. Um cérebro compartilhado é ótimo até que ele coloque o contexto errado na sessão errada.

Essa última é a maior parte do que eu trabalho.

De onde estou vindo

Estou construindo o OctaMem. Camada de memória independente do modelo, fala através do MCP, os três tipos de memória e a trilha de auditoria embutida.

Então sim, eu tenho interesse no jogo, não estou fingindo o contrário.
Mas o ponto não é "use minha coisa." É que a memória é sua própria camada. Não é o modelo, não é o editor, é sua própria coisa. No momento em que você a trata dessa forma, toda a configuração se acalma. Um cérebro, todas as ferramentas, mantendo ao longo do tempo.

Então, como você está fazendo isso agora? Scripts, um arquivo de notas que você continua colando, um servidor MCP real, nada disso? Curioso sobre o que está funcionando para as pessoas. Diga-me nos comentários.

Contexto Triplo Up

A implementação de uma camada de memória sobre o MCP pode revolucionar a forma como as empresas brasileiras utilizam agentes de IA. Isso permite que os agentes retenham conhecimento entre sessões, melhorando a eficiência e a colaboração em projetos de desenvolvimento.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.