
Pare de Pedir Respostas à IA. Comece a Perguntar se as Evidências Estão Prontas.
A maioria dos agentes de IA é otimizada para produzir uma resposta.
Mas em fluxos de trabalho sérios, a resposta não é a parte difícil.
A parte difícil é saber se essa resposta é suficientemente apoiada para que um humano confie nela, aja com base nela ou a escale.
Esse é o problema que estou trabalhando com Agenda Intelligence MD:
Um runtime de prontidão de evidências e roteamento de confiança para decisões assistidas por IA de alto risco.
GitHub: vassiliylakhonin/agenda-intelligence-md
O problema: IA pode resumir antes de ser confiável
Resumir é útil.
Mas muitas decisões do mundo real não estão bloqueadas pela falta de um resumo. Elas estão bloqueadas pela incerteza:
- Quais alegações são realmente apoiadas?
- Quais alegações são fracas?
- Quais categorias de fontes estão faltando?
- Quem precisa agir a seguir?
- Este arquivo está pronto para revisão?
- Isso deve ser escalado antes que uma decisão seja tomada?
Isso importa em fluxos de trabalho como:
- revisão de evidências de fornecedores;
- análise de RFP e compras;
- diligência devida de fornecedores de IA;
- salas de projetos de infraestrutura estratégica;
- prontidão para entrada no mercado;
- triagem de exposição adjacente a sanções;
- arquivos de risco de corredor, marítimo e contraparte.
Nesses ambientes, um memorando gerado por IA polido pode ser perigoso se esconder lacunas de evidências.
Agenda Intelligence MD é construído em torno de uma ideia diferente:
A próxima camada de infraestrutura de agentes não é uma melhor sumarização. É saber quando um resumo gerado por IA não está pronto para ser confiável.
O que Agenda Intelligence MD faz
Agenda Intelligence MD transforma pacotes de entrada bagunçados em pacotes estruturados para revisão humana.
As entradas podem ser coisas como:
- respostas de RFP;
- alegações de fornecedores;
- pacotes de fontes;
- arquivos de risco;
- cartões de modelo;
- notas de projeto;
- atualizações de status semanais;
- documentação pública;
- briefings no estilo de analistas.
A saída não é apenas um resumo.
É uma camada de revisão estruturada que destaca:
- alegações apoiadas;
- alegações fracas ou com pouca fonte;
- categorias de evidências faltando;
- diagnósticos de cobertura de fontes;
- ações do proprietário;
- roteamento de prontidão para decisão;
- sinais de escalonamento;
- pontuação heurística.
O objetivo não é substituir o julgamento humano.
O objetivo é tornar a superfície de revisão mais clara antes que um humano tome uma decisão.
O que o torna diferente de um normal resumidor de IA?
Um resumidor normal pergunta:
“O que este documento diz?”
Agenda Intelligence MD pergunta:
“Este documento está pronto para apoiar uma decisão?”
Essa distinção muda a arquitetura.
Em vez de tratar a saída da IA como o produto final, o projeto a trata como algo que deve passar por uma camada de prontidão.
Por exemplo, um fornecedor pode alegar que seu produto de IA é seguro para uso em empresas regulamentadas.
Um resumidor pode comprimir essa alegação em um belo parágrafo.
Agenda Intelligence MD é projetado para fazer um conjunto de perguntas mais úteis:
- A alegação está vinculada a evidências?
- As evidências são de primeira parte, terceira parte, desatualizadas, faltando ou incompletas?
- Estão faltando padrões, artefatos de auditoria, documentos de segurança ou materiais de governança?
- Isso precisa de um proprietário de compras, revisor legal, revisor técnico ou escalonamento de conformidade?
- O resumo está pronto para uma decisão ou apenas pronto para mais perguntas?
Essa é a diferença entre gerar texto e roteamento de confiança.
Arquitetura
O projeto é implementado como um pacote Python com várias superfícies de entrega em torno de uma camada de serviço central.
Inclui:
- um CLI;
- um servidor MCP stdio;
- uma shell de API HTTP;
- um adaptador A2A;
- esquemas JSON;
- validadores;
- auditoria de evidências;
- diagnósticos de cobertura de fontes;
- pontuação heurística;
- perfis de trabalhadores verticais.
Isso o torna utilizável em vários modos diferentes.
Você pode inspecioná-lo localmente através do CLI.
Você pode integrá-lo em um fluxo de trabalho de agente através do MCP.
Você pode expor comportamentos estruturados via HTTP.
Você pode experimentar com roteamento de agentes no estilo A2A.
A parte interessante não é apenas que essas interfaces existem. É que elas apontam para a mesma ideia de produto: a prontidão da evidência deve ser uma camada reutilizável, não um prompt único.
Início rápido
Após a instalação do pacote, o fluxo básico local se parece com isto:
pip install agenda-intelligence-md
agenda-intelligence doctor
agenda-intelligence validate-brief examples/agenda-brief.json
agenda-intelligence score examples/agenda-brief.json --evidence examples/source/evidence-pack.json
agenda-intelligence weekly-delta examples/strategic-infrastructure-bankability/status.synthetic.md
Os comandos são projetados para responder a perguntas práticas:
- O pacote está instalado corretamente?
- Este resumo corresponde ao esquema?
- Quão forte é a estrutura / evidência / prontidão para decisão?
- O que mudou em uma atualização de status semanal?
- Quais alegações são inseguras para repetir?
- Que evidências ainda estão faltando?
A última pergunta é a mais importante.
Porque em fluxos de trabalho de decisão reais, “o que está faltando?” é muitas vezes mais valioso do que “qual é a resposta?”
Exemplo: prontidão de evidências de fornecedores de IA
Uma das atuais áreas de descoberta para o projeto é a prontidão de evidências de fornecedores de IA para compras regulamentadas.
Imagine um comprador revisando um fornecedor de IA para um ambiente empresarial ou regulamentado.
O comprador tem:
- uma RFP;
- alegações de fornecedores;
- documentação pública;
- páginas de segurança;
- cartões de modelo;
- referências de padrões;
- talvez alguns materiais faltando ou vagos.
Um assistente de IA normal pode resumir o fornecedor.
Mas um comprador não precisa apenas de um resumo.
Ele precisa de um pacote de revisão:
- Quais alegações são apoiadas?
- Quais alegações são linguagem de marketing?
- Quais documentos de segurança ou governança estão faltando?
- Quais perguntas do comprador permanecem sem resposta?
- O que deve ser escalado antes da aprovação?
- O que pode ser revisado agora e o que não pode?
Esse é o tipo de fluxo de trabalho que Agenda Intelligence MD foi projetado para suportar.
Não está tentando ser o tomador de decisões.
Está tentando preparar a superfície de decisão.
Perfis verticais
O repositório também inclui perfis verticais e superfícies de demonstração para vários fluxos de trabalho de alto risco, incluindo:
- Portão de Risco de Negócio do Corredor do Meio;
- Exposição a Sanções Secundárias CIS;
- Portão de Confiança de Interação Agente;
- Portão de Exposição Marítima do Golfo;
- Portão de Prontidão para Entrada no Mercado do Cazaquistão.
Esses não são perfis genéricos de chatbot.
São superfícies de raciocínio estruturado para fluxos de trabalho de revisão pesados em evidências.
O padrão é:
pacote de entrada -> pacote de revisão estruturado -> lacunas de evidência -> ações do proprietário -> rota de prontidão para decisão
Esse padrão é útil porque muitos fluxos de trabalho de alto risco falham na mão
Empresas brasileiras que utilizam IA em processos decisórios podem se beneficiar do Agenda Intelligence MD, que ajuda a garantir que as informações apresentadas sejam confiáveis e bem fundamentadas. Isso é crucial em setores regulados onde decisões erradas podem ter consequências significativas. A abordagem proposta melhora a transparência e a confiança nas decisões assistidas por IA.

