Pare de Pedir Respostas à IA. Comece a Perguntar se as Evidências Estão Prontas.

A maioria dos agentes de IA é otimizada para produzir uma resposta.

Mas em fluxos de trabalho sérios, a resposta não é a parte difícil.

A parte difícil é saber se essa resposta é suficientemente apoiada para que um humano confie nela, aja com base nela ou a escale.

Esse é o problema que estou trabalhando com Agenda Intelligence MD:

Um runtime de prontidão de evidências e roteamento de confiança para decisões assistidas por IA de alto risco.

GitHub: vassiliylakhonin/agenda-intelligence-md

O problema: IA pode resumir antes de ser confiável

Resumir é útil.

Mas muitas decisões do mundo real não estão bloqueadas pela falta de um resumo. Elas estão bloqueadas pela incerteza:

Quais alegações são realmente apoiadas?
Quais alegações são fracas?
Quais categorias de fontes estão faltando?
Quem precisa agir a seguir?
Este arquivo está pronto para revisão?
Isso deve ser escalado antes que uma decisão seja tomada?

Isso importa em fluxos de trabalho como:

revisão de evidências de fornecedores;
análise de RFP e compras;
diligência devida de fornecedores de IA;
salas de projetos de infraestrutura estratégica;
prontidão para entrada no mercado;
triagem de exposição adjacente a sanções;
arquivos de risco de corredor, marítimo e contraparte.

Nesses ambientes, um memorando gerado por IA polido pode ser perigoso se esconder lacunas de evidências.

Agenda Intelligence MD é construído em torno de uma ideia diferente:

A próxima camada de infraestrutura de agentes não é uma melhor sumarização. É saber quando um resumo gerado por IA não está pronto para ser confiável.

O que Agenda Intelligence MD faz

Agenda Intelligence MD transforma pacotes de entrada bagunçados em pacotes estruturados para revisão humana.

As entradas podem ser coisas como:

respostas de RFP;
alegações de fornecedores;
pacotes de fontes;
arquivos de risco;
cartões de modelo;
notas de projeto;
atualizações de status semanais;
documentação pública;
briefings no estilo de analistas.

A saída não é apenas um resumo.

É uma camada de revisão estruturada que destaca:

alegações apoiadas;
alegações fracas ou com pouca fonte;
categorias de evidências faltando;
diagnósticos de cobertura de fontes;
ações do proprietário;
roteamento de prontidão para decisão;
sinais de escalonamento;
pontuação heurística.

O objetivo não é substituir o julgamento humano.

O objetivo é tornar a superfície de revisão mais clara antes que um humano tome uma decisão.

O que o torna diferente de um normal resumidor de IA?

Um resumidor normal pergunta:

“O que este documento diz?”

Agenda Intelligence MD pergunta:

“Este documento está pronto para apoiar uma decisão?”

Essa distinção muda a arquitetura.

Em vez de tratar a saída da IA como o produto final, o projeto a trata como algo que deve passar por uma camada de prontidão.

Por exemplo, um fornecedor pode alegar que seu produto de IA é seguro para uso em empresas regulamentadas.

Um resumidor pode comprimir essa alegação em um belo parágrafo.

Agenda Intelligence MD é projetado para fazer um conjunto de perguntas mais úteis:

A alegação está vinculada a evidências?
As evidências são de primeira parte, terceira parte, desatualizadas, faltando ou incompletas?
Estão faltando padrões, artefatos de auditoria, documentos de segurança ou materiais de governança?
Isso precisa de um proprietário de compras, revisor legal, revisor técnico ou escalonamento de conformidade?
O resumo está pronto para uma decisão ou apenas pronto para mais perguntas?

Essa é a diferença entre gerar texto e roteamento de confiança.

Arquitetura

O projeto é implementado como um pacote Python com várias superfícies de entrega em torno de uma camada de serviço central.

Inclui:

um CLI;
um servidor MCP stdio;
uma shell de API HTTP;
um adaptador A2A;
esquemas JSON;
validadores;
auditoria de evidências;
diagnósticos de cobertura de fontes;
pontuação heurística;
perfis de trabalhadores verticais.

Isso o torna utilizável em vários modos diferentes.

Você pode inspecioná-lo localmente através do CLI.

Você pode integrá-lo em um fluxo de trabalho de agente através do MCP.

Você pode expor comportamentos estruturados via HTTP.

Você pode experimentar com roteamento de agentes no estilo A2A.

A parte interessante não é apenas que essas interfaces existem. É que elas apontam para a mesma ideia de produto: a prontidão da evidência deve ser uma camada reutilizável, não um prompt único.

Início rápido

Após a instalação do pacote, o fluxo básico local se parece com isto:

pip install agenda-intelligence-md

agenda-intelligence doctor
agenda-intelligence validate-brief examples/agenda-brief.json
agenda-intelligence score examples/agenda-brief.json --evidence examples/source/evidence-pack.json
agenda-intelligence weekly-delta examples/strategic-infrastructure-bankability/status.synthetic.md

Os comandos são projetados para responder a perguntas práticas:

O pacote está instalado corretamente?
Este resumo corresponde ao esquema?
Quão forte é a estrutura / evidência / prontidão para decisão?
O que mudou em uma atualização de status semanal?
Quais alegações são inseguras para repetir?
Que evidências ainda estão faltando?

A última pergunta é a mais importante.

Porque em fluxos de trabalho de decisão reais, “o que está faltando?” é muitas vezes mais valioso do que “qual é a resposta?”

Exemplo: prontidão de evidências de fornecedores de IA

Uma das atuais áreas de descoberta para o projeto é a prontidão de evidências de fornecedores de IA para compras regulamentadas.

Imagine um comprador revisando um fornecedor de IA para um ambiente empresarial ou regulamentado.

O comprador tem:

uma RFP;
alegações de fornecedores;
documentação pública;
páginas de segurança;
cartões de modelo;
referências de padrões;
talvez alguns materiais faltando ou vagos.

Um assistente de IA normal pode resumir o fornecedor.

Mas um comprador não precisa apenas de um resumo.

Ele precisa de um pacote de revisão:

Quais alegações são apoiadas?
Quais alegações são linguagem de marketing?
Quais documentos de segurança ou governança estão faltando?
Quais perguntas do comprador permanecem sem resposta?
O que deve ser escalado antes da aprovação?
O que pode ser revisado agora e o que não pode?

Esse é o tipo de fluxo de trabalho que Agenda Intelligence MD foi projetado para suportar.

Não está tentando ser o tomador de decisões.

Está tentando preparar a superfície de decisão.

Perfis verticais

O repositório também inclui perfis verticais e superfícies de demonstração para vários fluxos de trabalho de alto risco, incluindo:

Portão de Risco de Negócio do Corredor do Meio;
Exposição a Sanções Secundárias CIS;
Portão de Confiança de Interação Agente;
Portão de Exposição Marítima do Golfo;
Portão de Prontidão para Entrada no Mercado do Cazaquistão.

Esses não são perfis genéricos de chatbot.

São superfícies de raciocínio estruturado para fluxos de trabalho de revisão pesados em evidências.

O padrão é:

pacote de entrada -> pacote de revisão estruturado -> lacunas de evidência -> ações do proprietário -> rota de prontidão para decisão

Esse padrão é útil porque muitos fluxos de trabalho de alto risco falham na mão

Pare de Pedir Respostas à IA. Comece a Perguntar se as Evidências Estão Prontas.

O problema: IA pode resumir antes de ser confiável

O que Agenda Intelligence MD faz

O que o torna diferente de um normal resumidor de IA?

Arquitetura

Início rápido

Exemplo: prontidão de evidências de fornecedores de IA

Perfis verticais

Noticias relacionadas

Um guia prático para defender a memória do seu agente contra ataques.

A Redefinição da Redação de Propostas com Infraestrutura de IA

Percepção Estruturada em Tempo de Execução: O Que os Agentes Estão Perdendo

Gostou do conteudo?