
Construindo um Servidor MCP para Remoção de Fundo Acelerado por GPU em Python
Eu redigi um post de blog destacando seu projeto recém-publicado: bg-vanish-mcp. Ele cobre a motivação, a pilha tecnológica (DirectML + U2NET), detalhes de implementação e como usá-lo.
Construindo um Servidor MCP de Remoção de Fundo Acelerado por GPU Local em Python
À medida que assistentes de IA como Claude e Windsurf se tornam mais integrados em nossos fluxos de trabalho diários, equipá-los com capacidades locais (via o Modelo Contextual de Protocolo ou MCP) muda o jogo.
Hoje, estamos anunciando bg-vanish-mcp—um servidor MCP de remoção de fundo acelerado por GPU e de primeira local que permite que seus assistentes de IA isolem sujeitos de imagens instantaneamente, completamente offline e gratuitamente.
Aqui está uma visão sobre por que o construímos, como funciona e como você pode executá-lo você mesmo.
Por que Local-Primeiro & Acelerado por GPU?
Embora existam APIs de remoção de fundo baseadas em nuvem, elas vêm com desvantagens:
- Custo: Estruturas de pagamento por imagem rapidamente somam.
- Privacidade: Fazer upload de imagens sensíveis para servidores de terceiros nem sempre é ideal.
- Velocidade & Latência: Enviar imagens de alta resolução de um lado para o outro pela rede é lento.
bg-vanish-mcp resolve isso executando modelos U2NET localmente usando a biblioteca rembg. Para manter os tempos de processamento abaixo de um segundo, ele aproveita o DirectML via ONNX Runtime, permitindo aceleração de hardware em GPUs NVIDIA, AMD e Intel nativamente no Windows—sem necessidade de CUDA ou configuração complexa de SDK.
Como Funciona: As Ferramentas
O servidor MCP expõe duas ferramentas principais para o assistente de IA:
-
remove_background(input_path, output_path, return_base64)- Propósito: Opera diretamente no sistema de arquivos do host. A IA passa um caminho de imagem local, e a saída do servidor salva um PNG limpo e transparente no mesmo diretório.
-
remove_background_base64(image_base64)- Propósito: Permite a passagem direta de dados. A IA pode enviar dados de imagem codificados em base64 em contexto, receber o sujeito isolado como uma string base64 e renderizá-lo diretamente na interface de chat.
Sob o Capô: O Código
O servidor é implementado em Python usando o SDK oficial FastMCP. A configuração do provedor de execução central ativa seletivamente a GPU:
import os
import rembg
from mcp.server.fastmcp import FastMCP
mcp = FastMCP("bg-vanish-mcp")
# Ler configuração do ambiente alvo
use_gpu = os.environ.get("USE_GPU", "false").lower() in ("true", "1", "yes")
if use_gpu:
# Tentar aceleração de GPU via CUDA ou DirectML, voltar para CPU
providers = ['CUDAExecutionProvider', 'DmlExecutionProvider', 'CPUExecutionProvider']
else:
providers = ['CPUExecutionProvider']
# Inicializar a sessão ONNX
session = rembg.new_session(providers=providers)
Ao solicitar o DmlExecutionProvider (DirectML) antes de voltar para a CPU, o servidor ganha acesso à aceleração de hardware nativa do DirectX 12 no Windows.
Comece em Segundos
Publicamos bg-vanish-mcp no PyPI para que você possa executá-lo instantaneamente sem configurar ambientes Python locais.
1. Instale & Execute via uvx
Certifique-se de ter uv instalado, então adicione este bloco à sua configuração do Claude Desktop (%APPDATA%\Claude\claude_desktop_config.json):
{
"mcpServers": {
"bg-vanish-mcp": {
"command": "uvx",
"args": ["bg-vanish-mcp"],
"env": {
"USE_GPU": "true"
}
}
}
}
2. Execute Localmente com Pip
Se você preferir o pip padrão:
pip install "bg-vanish-mcp[dml]"
E aponte seu cliente MCP para:
bg-vanish-mcp
Na primeira execução, o servidor fará o download automaticamente do modelo U2NET ONNX, se conectará à sua GPU e estará pronto para começar a remover fundos em milissegundos.
Confira o Código
O projeto é totalmente open source. Confira o repositório, envie problemas ou contribua com novos recursos:
- G
O bg-vanish-mcp oferece uma solução prática para empresas que necessitam de processamento de imagens de forma rápida e segura. Com a remoção de fundo local, as empresas podem garantir a privacidade dos dados e reduzir custos com serviços em nuvem. Essa tecnologia pode ser integrada em fluxos de trabalho de marketing e design, aumentando a eficiência.

