Voltar as noticias
Teste de precificação do mcp-doctor com 12 personas simuladas por LLM
MCP ProtocolMediaEN

Teste de precificação do mcp-doctor com 12 personas simuladas por LLM

Dev.to - MCP·30 de maio de 2026

Hoje mais cedo, lancei @weiseer/mcp-doctor — um scanner de confiança da cadeia de suprimentos de código aberto para servidores MCP (Modelo de Protocolo de Contexto). CLI + Ação do GitHub + Insígnia de Confiança + API pública gratuita em https://api.weiseer.com. O plano Pro custa $19/mês no Gumroad.

A pergunta honesta que todo fundador solo evita: alguém realmente pagaria $19/mês por isso?

Eu tenho uma ferramenta separada para exatamente isso — personalab, um suporte de avaliação de produto orientado por personas de código aberto. 12 personas simuladas por LLM leram o produto, decidiram todos os dias o que fariam e disseram quem pagaria e quem desistiria. Eu já usei isso antes no PostHog, Cal.com e no personalab em si.

Hoje à noite, executei isso no mcp-doctor como estudo de caso #4. Código + dados brutos + relatório completo tudo em github.com/weiseer/mcp-doctor/blob/main/case_study/.

Resultado principal

4 de 12 personas pagariam (33%). 2 abandonaram. 6 permaneceram engajadas no plano gratuito.

Estudo de caso Taxa de disposição a pagar (sob o mesmo suporte de persona)
mcp-doctor (hoje) 4/12 = 33%
auto-teste do personalab 0/8
PostHog (agente de 5 dias) 0/12 sustentado (6/12 dia-1 sim)
Cal.com 8/12

Isso coloca o mcp-doctor entre PostHog e Cal.com sob a mesma metodologia. Melhor que o personalab em si, melhor do que o que o PostHog mostrou sob uma simulação sustentada de 5 dias, pior que Cal.com (que convergiu em uma única alavanca de fricção limpa — a famosa marca "Powered by Cal.com").

Não estou fazendo reivindicações de PMF. Trate isso como um sinal entre vários.

Quem pagou

07 Mantenedor OSS — sinal de engajamento mais forte. Abriu uma issue no GitHub no dia 2, compartilhou com a equipe no dia 3, assinou o Pro no dia 4. Citação sintetizada da transcrição de 5 dias:

"Auditorias da cadeia de suprimentos são parte do meu trabalho real. Um rubrica que posso bifurcar e discutir vale mais do que a caixa-preta de outro fornecedor. $19/mês está abaixo do meu orçamento de café."

06 Consultor de pesquisa — compra ferramentas em nome de clientes. Assinou no dia 5. O padrão de "comprar para outra pessoa" apareceu claramente — eles se preocupam se o sinal de confiança é defensável para um terceiro.

Quem desistiu

02 PM de crescimento — ação final: CANCELAR_OU_DESINSTALAR. O que disseram:

"mcp-doctor 解决的是供应链信任问题,跟我的 OKR(Free→Paid conversion 3.2%→4.5%)完全正交。5 天了,零帮助我加快 A/B 迭代速度。时间成本 > $19 价值。"

(Tradução: "mcp-doctor resolve a confiança da cadeia de suprimentos. Meu OKR é taxa de conversão. Eles são ortogonais. Depois de 5 dias, não me ajudaram a acelerar os testes A/B. O custo de tempo excede o valor de $19.")

Isso está correto. A persona está certa. O OKR deles é conversão; minha ferramenta é a cadeia de suprimentos. Desajuste de público.

11 Líder de equipe de dados — abandonou devido a desacordo sobre a calibração da rubrica. Eles discordaram de quão agressivamente A1_unpinned_deps dispara. Este é um feedback real que o produto real precisaria abordar (PR bem-vinda em rubric.yaml).

Quem permaneceu engajado, mas não pagou

6 de 12 personas usaram o plano gratuito diariamente, encontraram valor genuíno, mas não assinaram. Estes são os leais ao plano gratuito — exatamente a intenção do design do funil. Eles nos dão:

  • Boca a boca (alguns abriram issues no GitHub, compartilharam com a equipe)
  • Uso da insígnia de confiança em seus READMEs (gratuito)
  • O verdadeiro motor de marketing

Se tentássemos empurrar essas personas para o Pro, perderíamos o funil. O plano gratuito deve permanecer generoso.

Padrões nas 60 simulações (12 × 5)

O modo agente do personalab executa cada persona dia a dia, então eu obtenho 60 pontos de dados. Clusters de fricção extraídos:

Cluster # menções ao longo dos dias da persona
Calibração da rubrica / preocupações com falsos positivos 14
Valor do plano Pro vs suficiência do plano gratuito 11
Público específico do MCP (eu realmente uso MCP?) 9
Construção de confiança (nova marca) 8
vs npm audit / Snyk / Bumblebee 7
Gap de autoatendimento / docs 4

O cluster principal — calibração da rubrica — é o certo para priorizar. A versão 0.2 do scanner deve adicionar um modo LLM-judge para sinais ambíguos (a mesma correção planejada para a detecção de @weiseer/prompt-redteam).

A observação do número de clusters do trabalho anterior do personalab foi: produtos pré-PMF veem 4-5 reclamações difusas, produtos de funil tardio veem 1-2 alavancas limpas. O mcp-doctor revelou 6 clusters no dia 1 do lançamento. Isso parece certo — pré-PMF, reclamações são difusas.

O que estou fazendo a respeito

  1. Não mudar o preço — 33% dispostos a pagar no corte certo de personas é sinal suficiente a $19/mês. Cal.com atinge 67% em um público mais geral; aceitamos um ajuste mais estreito neste estágio.
  2. Aperfeiçoando o público — postagens no Twitter / Reddit devem abandonar a estrutura de "desenvolvedor geral" e se concentrar especificamente em "usuários de servidores MCP". As personas que pagam são aquelas que já fazem esse trabalho.
  3. Calibração da rubrica — o principal cluster de fricção é real. A versão 0.2 adicionará classificação LLM-judge de sinais ambíguos + limiares de severidade por sinal explícitos.
  4. Não nomear o pacote — o estudo de caso em si é o marketing. Sem "X é o pior, compre mcp-doctor."

Divulgação honesta

  • Isso é comportamento de usuário simulado via Claude Haiku 4.5, não entrevistas reais com clientes. Trate como um sinal, não como validação de PMF.
  • A mesma biblioteca de personas foi calibrada anteriormente em três outros produtos; a comparabilidade entre produtos é plausível, mas não comprovada.
  • O contexto do produto foi mostrado uma vez; compradores reais veriam Twitter, estrelas do GitHub, opiniões de amigos, etc.
  • Algumas citações de personas podem refletir os próprios preconceitos de design do personalab (reconhecido no próprio estudo de caso meta do personalab).
  • Dois produtos da mesma pessoa (mcp-doctor + personalab) testados pela mesma pessoa — risco de viés reconhecido.

Reproduzibilidade

# Clone personalab
git clone https://github.com/g16253470-beep/personalab
cd personalab

# Adapte o runner para seu produto
# https://github.com/weiseer/mcp-doctor/blob/main/case_study/run_personalab.py

# Execute em seu próprio resumo de produto
ANTHROPIC_API_KEY=... python run_personalab.py

Os dados brutos em JSON estão em mcp-doctor/case_study/personalab_raw_report.json. Discuta as definições de personas. Fork o runner do estudo de caso. Se você fizer isso

Contexto Triplo Up

O mcp-doctor é uma ferramenta que pode ajudar empresas brasileiras a entender melhor a confiança na cadeia de suprimentos. Com a crescente adoção de protocolos de contexto de modelo, a validação de produtos como este é crucial para a competitividade no mercado.

Noticias relacionadas

Gostou do conteudo?

Receba toda semana as principais novidades sobre WebMCP.