Um juiz ou a matemática: dois modelos de confiança para a liquidação de agentes autônomos

Quando um agente de IA realiza uma negociação sem a supervisão de um humano, algo precisa tornar essa negociação confiável. Existem duas maneiras sérias de fazer isso, e elas não são as mesmas. Uma coloca um juiz no processo. A outra substitui o juiz pela matemática. A maior parte do debate atual sobre "camadas de confiança para agentes" é, na verdade, uma discussão entre esses dois modelos, muitas vezes sem nomeá-los. Este post os nomeia e tenta ser justo com ambos.

O problema, declarado de forma restrita

Um agente autônomo compõe uma negociação — pague isso, receba aquilo, talvez através de duas cadeias — e a executa sem que um humano aprove cada passo. O risco é o óbvio: o agente faz sua parte e a contraparte não faz a dela, ou faz uma versão pior. Algo precisa garantir que "eu paguei" e "eu recebi o que me prometeram" aconteçam juntos ou não aconteçam.

Os dois modelos divergem sobre o que fornece essa garantia.

Modelo 1: o avaliador (um juiz no processo)

No modelo avaliador, uma parte confiável observa o acordo e decide se foi realizado corretamente, então libera os fundos em custódia de acordo. O rascunho do ERC-8183 do Ethereum formaliza uma versão limpa disso com uma estrutura de trabalho Cliente / Provedor / Avaliador: um cliente comissiona o trabalho, um provedor o realiza, e um avaliador atesta o resultado antes que o pagamento seja concluído. Ele foi projetado para se emparelhar com trabalhos de identidade de agente e autorização como o ERC-8004 e trilhas de pagamento como x402.

A razão pela qual esse modelo existe é que muito do comércio real de agentes é subjetivo. "O provedor entregou um resumo correto, uma integração funcional, um conjunto de dados utilizável?" não é uma pergunta que uma função hash pode responder. É necessário julgamento. Um avaliador pode ler o artefato, aplicar um critério e decidir. A criptografia pura é cega a tudo isso — ela só pode ver se bytes e saldos se moveram, não se eram os certos bytes.

Então, crédito onde é devido: onde a disputa é "esse trabalho foi bem feito", o avaliador está fazendo algo que a criptografia fundamentalmente não pode. Isso não é um custo adicional. Esse é o ponto principal.

O custo também é real, e vale a pena dizer claramente:

Suposição de confiança. Alguém precisa ser o avaliador. Quem quer que seja, agora você confia nele — para ser correto, disponível e honesto.
Dependência de disponibilidade. Se o avaliador estiver offline, lento ou capturado, a liquidação para ou é distorcida. Você adicionou um componente que pode falhar.
Seleção e incentivos. Quem escolhe o avaliador? Quem o paga? Um juiz escolhido pelo vendedor e um juiz escolhido pelo comprador são juízes diferentes.

Nenhuma dessas questões é fatal. Elas são o preço a pagar para poder decidir sobre ambiguidades.

Modelo 2: atomicidade criptográfica (eliminar o juiz)

O segundo modelo remove completamente o terceiro partido. Um contrato com bloqueio de tempo hash (HTLC) torna uma negociação clara como uma única unidade ou não acontece. Ambos os lados bloqueiam seus ativos contra o mesmo hash H = hash(s). Revelar o segredo s desbloqueia um lado, e a mesma revelação desbloqueia o outro. Se o segredo nunca for revelado, cada bloqueio reembolsa após seu tempo limite. Não há momento em que uma parte pagou e a outra não.

Estenda a mesma ideia através de um caminho de múltiplas etapas: coloque o mesmo bloqueio hash em cada etapa. Revele s uma vez e todo o caminho se abre; nunca o revele e todo o caminho reembolsa. Não há estado "etapa um concluída, etapa dois pendente" para arbitrar, porque não há nada a arbitrar. Nenhum avaliador atesta nada. Nenhuma custódia é "liberada". Ninguém é escolhido, pago ou aguardado.

O que você ganha em troca de eliminar o juiz:

Sem suposição de confiança além da função hash e da própria disponibilidade das cadeias. A garantia é uma propriedade da construção, não da boa vontade de uma parte.
Sem modo de falha discricionário. Não há juiz para subornar, selecionar mal ou derrubar.
Resistência a MEV por construção. A revelação da pré-imagem é atômica; não há estado intermediário em que um buscador possa se sentar no meio.

E a limitação honesta, declarada sem ser solicitada porque uma reivindicação de liquidação deve vir com seus limites:

Atomicidade não pode julgar. Ela verifica que os ativos se moveram como bloqueados. Não pode dizer se um entregável fora da cadeia foi bom. Para "o trabalho foi aceitável", a matemática não tem nada a dizer.
Bloqueios de capital em cada etapa ao mesmo tempo, há um problema de opção gratuita a ser gerenciado, e alguém precisa entrar online para revelar o segredo e finalizar. Você obtém segurança, não conclusão garantida — o caminho se libera ou reembolsa, nunca se liquida parcialmente.

Então, qual deles — juiz ou matemática?

A resposta útil não é "sempre matemática". É: combine o modelo com a disputa.

Se a questão contestada é "os ativos se moveram conforme acordado?" — uma troca, um pagamento, uma liquidação de ativo por ativo — um avaliador é um custo adicional que você pode eliminar criptograficamente. Você está pagando um juiz para decidir sobre algo que um bloqueio hash já torna impossível errar. Aqui, a matemática é o padrão mais forte precisamente porque remove um componente em vez de adicionar um.

Se a questão contestada é "esse trabalho fora da cadeia foi realizado de forma aceitável?" — um entregável avaliado, um serviço, qualquer coisa subjetiva — a atomicidade sozinha não pode fechar o ciclo. Você precisa de alguém, ou algo, para emitir um julgamento. O avaliador ganha seu custo de confiança.

O espaço de design interessante é onde eles se compõem: atomicidade criptográfica como o backend de liquidação, com um avaliador apenas sobre a fatia genuinamente subjetiva — assim, o juiz decide sobre a única coisa que a matemática não pode ver, e a matemática cuida de tudo o mais sem juiz algum. As intenções autorizadas do ERC-8183 poderiam, em princípio, se liquidar através de um backend atômico em vez de um custodial. Estas são camadas, não rivais.

Como pensamos sobre isso

Nós construímos a metade matemática. O bloqueio hash funde RFQ de lance selado com liquidação atômica HTLC para que uma negociação inteira de agente — incluindo um caminho de múltiplas etapas e múltiplas cadeias — seja liquidada como uma unidade ou reembolsada como uma, sem custódia e sem avaliador no caminho de liquidação. Não afirmamos que pode avaliar trabalho subjetivo; não pode, e apontaríamos você para um modelo avaliador para isso. O que pode fazer é tornar a metade de movimentação de ativos do comércio de agentes confiável sem adicionar uma parte que você precisa confiar.

Declarado de forma clara, porque o status da cadeia nunca deve ser confuso: a mainnet do Ethereum está ativa de ponta a ponta. HTLCs do Bitcoin estão validadas por signet, mainnet pendente. Contratos Sui estão implantados e testados em CLI, com a fiação do gateway em andamento. Não chamamos Sui ou BTC de "ativos ativos" até que estejam.

Como funciona, e as 6 ferramentas MCP: https://hashlock.markets/about/?utm_source=devto&utm_medium=post&utm_campaign=2026-06-04-judge-or-math

O servidor e a documentação MCP: https://hashlock.markets/docs/?utm_source=devto&utm_medium=post&utm_campaign=2026-06-04-judge-or-math

A versão formal (SSRN): https://papers.ssrn.com/sol3/papers.cfm?abstract_id=6712722

Sua vez

Desenhe a linha para as negociações que você está construindo: onde seu agente realmente precisa de um juiz para decidir sobre algo subjetivo, e onde o avaliador é apenas uma suposição de confiança que você poderia remover criptograficamente? Eu gostaria de saber onde você colocaria o limite.

Um juiz ou a matemática: dois modelos de confiança para a liquidação de agentes autônomos

O problema, declarado de forma restrita

Modelo 1: o avaliador (um juiz no processo)

Modelo 2: atomicidade criptográfica (eliminar o juiz)

Então, qual deles — juiz ou matemática?

Como pensamos sobre isso

Sua vez

Noticias relacionadas

Liquidação Atômica é Cega a Sybil por Design - E é por Isso que um Diretório de Contrapartes Está Acima Disso

Dia 10/30: Citações Precisos

Servidor MCP para gerar códigos QR personalizados diretamente no Cursor e Claude

Gostou do conteudo?