Teste de precificação do mcp-doctor com 12 personas simuladas por LLM

Hoje mais cedo, lancei @weiseer/mcp-doctor — um scanner de confiança da cadeia de suprimentos de código aberto para servidores MCP (Modelo de Protocolo de Contexto). CLI + Ação do GitHub + Insígnia de Confiança + API pública gratuita em https://api.weiseer.com. O plano Pro custa $19/mês no Gumroad.

A pergunta honesta que todo fundador solo evita: alguém realmente pagaria $19/mês por isso?

Eu tenho uma ferramenta separada para exatamente isso — personalab, um suporte de avaliação de produto orientado por personas de código aberto. 12 personas simuladas por LLM leram o produto, decidiram todos os dias o que fariam e disseram quem pagaria e quem desistiria. Eu já usei isso antes no PostHog, Cal.com e no personalab em si.

Hoje à noite, executei isso no mcp-doctor como estudo de caso #4. Código + dados brutos + relatório completo tudo em github.com/weiseer/mcp-doctor/blob/main/case_study/.

Resultado principal

4 de 12 personas pagariam (33%). 2 abandonaram. 6 permaneceram engajadas no plano gratuito.

Estudo de caso	Taxa de disposição a pagar (sob o mesmo suporte de persona)
mcp-doctor (hoje)	4/12 = 33%
auto-teste do personalab	0/8
PostHog (agente de 5 dias)	0/12 sustentado (6/12 dia-1 sim)
Cal.com	8/12

Isso coloca o mcp-doctor entre PostHog e Cal.com sob a mesma metodologia. Melhor que o personalab em si, melhor do que o que o PostHog mostrou sob uma simulação sustentada de 5 dias, pior que Cal.com (que convergiu em uma única alavanca de fricção limpa — a famosa marca "Powered by Cal.com").

Não estou fazendo reivindicações de PMF. Trate isso como um sinal entre vários.

Quem pagou

07 Mantenedor OSS — sinal de engajamento mais forte. Abriu uma issue no GitHub no dia 2, compartilhou com a equipe no dia 3, assinou o Pro no dia 4. Citação sintetizada da transcrição de 5 dias:

"Auditorias da cadeia de suprimentos são parte do meu trabalho real. Um rubrica que posso bifurcar e discutir vale mais do que a caixa-preta de outro fornecedor. $19/mês está abaixo do meu orçamento de café."

06 Consultor de pesquisa — compra ferramentas em nome de clientes. Assinou no dia 5. O padrão de "comprar para outra pessoa" apareceu claramente — eles se preocupam se o sinal de confiança é defensável para um terceiro.

Quem desistiu

02 PM de crescimento — ação final: CANCELAR_OU_DESINSTALAR. O que disseram:

"mcp-doctor 解决的是供应链信任问题，跟我的 OKR（Free→Paid conversion 3.2%→4.5%）完全正交。5 天了，零帮助我加快 A/B 迭代速度。时间成本 > $19 价值。"

(Tradução: "mcp-doctor resolve a confiança da cadeia de suprimentos. Meu OKR é taxa de conversão. Eles são ortogonais. Depois de 5 dias, não me ajudaram a acelerar os testes A/B. O custo de tempo excede o valor de $19.")

Isso está correto. A persona está certa. O OKR deles é conversão; minha ferramenta é a cadeia de suprimentos. Desajuste de público.

11 Líder de equipe de dados — abandonou devido a desacordo sobre a calibração da rubrica. Eles discordaram de quão agressivamente A1_unpinned_deps dispara. Este é um feedback real que o produto real precisaria abordar (PR bem-vinda em rubric.yaml).

Quem permaneceu engajado, mas não pagou

6 de 12 personas usaram o plano gratuito diariamente, encontraram valor genuíno, mas não assinaram. Estes são os leais ao plano gratuito — exatamente a intenção do design do funil. Eles nos dão:

Boca a boca (alguns abriram issues no GitHub, compartilharam com a equipe)
Uso da insígnia de confiança em seus READMEs (gratuito)
O verdadeiro motor de marketing

Se tentássemos empurrar essas personas para o Pro, perderíamos o funil. O plano gratuito deve permanecer generoso.

Padrões nas 60 simulações (12 × 5)

O modo agente do personalab executa cada persona dia a dia, então eu obtenho 60 pontos de dados. Clusters de fricção extraídos:

Cluster	# menções ao longo dos dias da persona
Calibração da rubrica / preocupações com falsos positivos	14
Valor do plano Pro vs suficiência do plano gratuito	11
Público específico do MCP (eu realmente uso MCP?)	9
Construção de confiança (nova marca)	8
vs npm audit / Snyk / Bumblebee	7
Gap de autoatendimento / docs	4

O cluster principal — calibração da rubrica — é o certo para priorizar. A versão 0.2 do scanner deve adicionar um modo LLM-judge para sinais ambíguos (a mesma correção planejada para a detecção de @weiseer/prompt-redteam).

A observação do número de clusters do trabalho anterior do personalab foi: produtos pré-PMF veem 4-5 reclamações difusas, produtos de funil tardio veem 1-2 alavancas limpas. O mcp-doctor revelou 6 clusters no dia 1 do lançamento. Isso parece certo — pré-PMF, reclamações são difusas.

O que estou fazendo a respeito

Não mudar o preço — 33% dispostos a pagar no corte certo de personas é sinal suficiente a $19/mês. Cal.com atinge 67% em um público mais geral; aceitamos um ajuste mais estreito neste estágio.
Aperfeiçoando o público — postagens no Twitter / Reddit devem abandonar a estrutura de "desenvolvedor geral" e se concentrar especificamente em "usuários de servidores MCP". As personas que pagam são aquelas que já fazem esse trabalho.
Calibração da rubrica — o principal cluster de fricção é real. A versão 0.2 adicionará classificação LLM-judge de sinais ambíguos + limiares de severidade por sinal explícitos.
Não nomear o pacote — o estudo de caso em si é o marketing. Sem "X é o pior, compre mcp-doctor."

Divulgação honesta

Isso é comportamento de usuário simulado via Claude Haiku 4.5, não entrevistas reais com clientes. Trate como um sinal, não como validação de PMF.
A mesma biblioteca de personas foi calibrada anteriormente em três outros produtos; a comparabilidade entre produtos é plausível, mas não comprovada.
O contexto do produto foi mostrado uma vez; compradores reais veriam Twitter, estrelas do GitHub, opiniões de amigos, etc.
Algumas citações de personas podem refletir os próprios preconceitos de design do personalab (reconhecido no próprio estudo de caso meta do personalab).
Dois produtos da mesma pessoa (mcp-doctor + personalab) testados pela mesma pessoa — risco de viés reconhecido.

Reproduzibilidade

# Clone personalab
git clone https://github.com/g16253470-beep/personalab
cd personalab

# Adapte o runner para seu produto
# https://github.com/weiseer/mcp-doctor/blob/main/case_study/run_personalab.py

# Execute em seu próprio resumo de produto
ANTHROPIC_API_KEY=... python run_personalab.py

Os dados brutos em JSON estão em mcp-doctor/case_study/personalab_raw_report.json. Discuta as definições de personas. Fork o runner do estudo de caso. Se você fizer isso

Teste de precificação do mcp-doctor com 12 personas simuladas por LLM

Resultado principal

Quem pagou

Quem desistiu

Quem permaneceu engajado, mas não pagou

Padrões nas 60 simulações (12 × 5)

O que estou fazendo a respeito

Divulgação honesta

Reproduzibilidade

Noticias relacionadas

Liquidação Atômica é Cega a Sybil por Design - E é por Isso que um Diretório de Contrapartes Está Acima Disso

Dia 10/30: Citações Precisos

Servidor MCP para gerar códigos QR personalizados diretamente no Cursor e Claude

Gostou do conteudo?