Voltar as noticias
OpsLens - Um Sistema Autônomo de Resposta a Incidentes que Transforma o Notion em um Centro de Comando
Casos de UsoAltaEN

OpsLens - Um Sistema Autônomo de Resposta a Incidentes que Transforma o Notion em um Centro de Comando

Dev.to - MCP·7 de março de 2026

O que eu construí

Eu construí OpsLens, um orquestrador autônomo de resposta a incidentes que usa o Notion MCP como sua camada de dados central.

Aqui está o problema que eu estava resolvendo: quando um incidente de produção ocorre às 3 da manhã, o engenheiro de plantão precisa fazer seis coisas ao mesmo tempo. Triar o alerta. Procurar por incidentes passados. Encontrar o runbook. Verificar implantações recentes. Notificar a equipe. Documentar tudo para o postmortem. Cada passo é manual, espalhado por diferentes ferramentas, e fácil de errar quando você está funcionando com duas horas de sono.

OpsLens pega o alerta, executa cinco agentes de IA contra ele e escreve tudo de volta no Notion. O engenheiro abre sua página de incidente e encontra: avaliação de severidade, incidentes passados relacionados, etapas de runbook aplicáveis, um rascunho de postmortem e uma lista de quem notificar. Tudo em um só lugar, tudo pesquisável, tudo aconteceu em segundos.

Mas a parte da qual mais me orgulho é que não é um tubo unidirecional. OpsLens observa edições humanas no Notion. Se você discordar da triagem da IA e mudar a severidade de P2 para P0, o sistema detecta isso em 30 segundos e reexecuta os agentes relevantes com o contexto atualizado. A IA propõe. O humano decide. O sistema se adapta.

O que ele realmente faz

Ingestão de Alertas: Aceita cargas úteis de webhook reais do Prometheus AlertManager, Grafana, PagerDuty ou qualquer fonte JSON personalizada. Normaliza-as em um formato canônico, deduplica e agrupa alertas relacionados em um único incidente.

Cinco Agentes de IA executam em sequência em cada novo incidente:

  1. Agente de Triagem - Valida a severidade, identifica o serviço afetado, avalia o raio de impacto
  2. Agente de Correlação - Pesquisa incidentes passados, conversas no Slack, documentos do Google Drive, tickets do Jira via busca de ferramentas conectadas do Notion MCP
  3. Agente de Remediação - Encontra runbooks aplicáveis, propõe comandos específicos e etapas de rollback
  4. Agente de Comunicações - Orquestra notificações e escalonamentos
  5. Agente de Postmortem - Gera um postmortem sem culpa quando o incidente é resolvido

Cada agente escreve sua análise como um comentário estruturado na página de incidente do Notion. Isso não é despejado em um banco de dados em algum lugar. Vive no Notion, pesquisável, compartilhável e visível para todos.

Comandante de Incidentes: Um co-piloto de IA contextual embutido no painel. Durante um incidente ativo, você pode fazer perguntas como "O que mudou recentemente neste serviço?" ou "Encontre o runbook para isso." Ele pesquisa no Notion, busca páginas, verifica incidentes passados e retorna com respostas específicas e botões de ação clicáveis (pesquisar, escalar, mudar status, notificar alguém, executar uma etapa de remediação).

Sincronização Bidirecional com o Notion: O Observador do Notion verifica páginas de incidentes ativos a cada 30 segundos. Ele detecta quando um humano muda a severidade, atualiza o status, adiciona uma causa raiz ou escreve um comentário de escalonamento diretamente no Notion. Quando detecta uma mudança, dispara o callback apropriado, reexecuta os agentes e atualiza o painel via WebSocket.

Painel em Tempo Real: Frontend React com atualizações ao vivo. Lista de incidentes com filtros, visualização de linha do tempo completa, feed de atividade dos agentes, trilha de auditoria, busca semântica pelo Notion, um playground de webhook para testes e página de configurações para integrar, tudo conectado via WebSocket para atualizações instantâneas.

Integrações Empresariais: Salas de guerra do Slack, correlação de implantações do GitHub, criação de tickets do Jira, rastreamento de problemas do Linear e webhooks de saída com lógica de repetição.

A arquitetura em uma imagem

Prometheus/Grafana/PagerDuty
        |
        v (webhooks)
+------------------+       JSON-RPC 2.0       +------------------+
|  OpsLens Backend |  <------------------->   |  Notion MCP      |
|  (FastAPI)       |   Streamable HTTP        |  Server (:3100)  |
|                  |                          |                  |
|  - Gerente de Incidentes  |                          +--------+---------+
|  - 5 Agentes de IA   |                                   |
|  - Observador do Notion |                                   v
|  - Hub WebSocket  |                          +------------------+
+--------+---------+                          |  Notion          |
         |                                    |  - Banco de Incidentes  |
         v                                    |  - Banco de Runbooks   |
+------------------+                          |  - Banco de Serviços   |
|  Painel React |                          |  - Postmortems   |
|  - Lista de Incidentes |                          |  - Banco de On-Call    |
|  - Comandante     |                          +------------------+
|  - Feed de Agentes    |
|  - Trilha de Auditoria   |
+------------------+

Demonstração em Vídeo

Mostre-nos o código

OpsLens

Orquestrador Autônomo de Resposta a Incidentes alimentado pelo Notion MCP

OpsLens transforma o Notion em um centro de comando de incidentes alimentado por IA. Ele ingere alertas de ferramentas de monitoramento, executa um pipeline de agentes de IA especializados para triagem, correlação, remediação e geração de postmortem, e escreve cada descoberta de volta no Notion como conhecimento estruturado e pesquisável. Os engenheiros interagem através de um painel em tempo real ou diretamente no Notion. O sistema observa edições humanas e reage, criando um verdadeiro fluxo de trabalho de resposta a incidentes com a intervenção humana.

Construído para o Desafio Notion MCP no DEV.to.

Tabela de Conteúdos

Contexto Triplo Up

O OpsLens pode revolucionar a forma como as empresas brasileiras gerenciam incidentes, reduzindo o tempo de resposta e aumentando a eficiência. A integração com ferramentas populares e a capacidade de adaptação em tempo real tornam-no uma solução valiosa para equipes de TI. Isso pode melhorar a continuidade dos negócios e a satisfação do cliente.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.