Como construir um servidor MCP

Autores

Ash Minhas

Manager, Technical Content | AI Advocate

IBM

PJ Hagerty

Lead, AI Advocacy

IBM

Erika Russi

Data Scientist

IBM

Neste tutorial, você criará um Model Context Protocol (MCP) simples, que expõe uma única ferramenta para pesquisar tutoriais da IBM. Ao usar o framework "fastmcp" e a biblioteca de solicitações, o script faz download de um índice JSON de tutoriais de uma URL remota. Em seguida, procura correspondências com a consulta de um usuário e retorna uma lista de resultados formatada de forma organizada. Você também adicionará o tratamento de erros para problemas de rede, JSON ruim e problemas inesperados, tornando a ferramenta robusta e amigável para iniciantes. Por fim, você executará o servidor MCP para que ele possa ser conectado e testado com um cliente como o Cursor.

O que é MCP?

Desenvolvedores e startups estão desenvolvendo cada vez mais soluções orientadas por [inteligência artificial] generativa (https://www.ibm.com/br-pt/think/topics/artificial-intelligence) (IA). Para tornar suas soluções mais úteis, elas precisam de informações atualizadas e de contexto. [Modelos] de aprendizado de máquina (https://www.ibm.com/br-pt/think/topics/ai-model) precisam interoperar com ferramentas, interfaces de programação de aplicativos(APIs), kits de desenvolvimento de software (SDKs) e sistemas front-end para que isso aconteça.

O MCP padroniza a forma como o contexto é transmitido entre os modelos de IA e sistemas. Simplifica a coordenação em um grande modelo de linguagem (LLM) e fontes e ferramentas de dados externas. Uma analogia comum é pensar no MCP como uma porta USB-C para um LLM. Ele torna um LLM muito mais útil porque o modelo tem acesso a recursos e dados que não faziam parte do treinamento do modelo. Essa capacidade é especialmente útil na criação de agentes de IA.

O MCP foi desenvolvido pela Anthropic e adotado pelos principais provedores de IA, incluindo OpenAI, Google DeepMind e o setor em geral. Ele oferece uma maneira segura e padronizada para os modelos de IA acessarem e usarem dados, recursos (como modelos de prompt) e ferramentas externos.

Além disso, integrated development environments (IDEs), como Cursor e Visual Studio Code, também adotaram o MCP, permitindo que seus assistentes de IA acessem servidores MCP para tornar seu uso mais relevante em contexto e amigável para desenvolvedores. Criadas como um padrão aberto, as organizações usam o MCP para atuar como uma ponte entre o mundo estocástico da IA generativa e o mundo determinístico da maioria dos sistemas empresariais atuais. O MCP fornece ao LLM informações contextuais de forma semelhante a outros padrões de design que começaram a surgir, como retrieval augmented generation (RAG), tool calling e agentes de IA.

Algumas vantagens de usar o MCP em comparação com essas outras soluções são:

- Escala: os servidores MCP podem ser definidos e hospedados uma vez e usados por muitos sistemas de IA. Essa capacidade limita a necessidade de definir o acesso aos mesmos dados de origem, recursos e ferramentas de IA para vários sistemas de IA generativa.

- Recuperação de dados: ao contrário da RAG, onde a recuperação de dados exige pré-processamento e vetorização antes da consulta, o MCP é dinâmico e permite flutuações e atualizações de fontes de informações em tempo real.

- Complexidade: o MCP é bastante simples de configurar e incorporar nas aplicações de IA, como demonstramos aqui. Você pode usar arquivos de configuração facilmente para tornar um servidor MCP portátil em todos os ambientes.

- Independente de plataforma: além do fato de que você pode construir servidores MCP com Python, TypeScript ou outras linguagens, eles também não estão acoplados a uma solução LLM específica.

- Depuração por meio de um modelo cliente/servidor: o cliente MCP envia solicitações ao servidor MCP, que em seguida busca os dados necessários de vários sistemas e fontes externas, sejam APIs, bancos de dados ou arquivos locais. Essa abordagem estruturada garante que o modelo de IA receba contexto consistente e relevante, levando a produções mais precisas e confiáveis. O MCP usa JSON-RPC para codificar mensagens e é compatível com dois mecanismos de transporte, stdio e HTTP transmitível. Em iterações anteriores do protocolo, ele também suportava HTTP com eventos enviados pelo servidor (SSE)

A necessidade de se manter constantemente atualizado com as últimas informações de que sua empresa precisa pode ser assustador. O MCP pode ajudar a criar contexto e incorporar novas informações para contratos à medida que eles são executados, informações legadas que estão sendo digitalizadas, mas não necessariamente digeríveis e muito mais. Essas informações podem ser internas e externas, mas adicionar contexto ignora a necessidade demorada de retreinar um LLM para ser útil.

Há muitos servidores MCP remotos disponíveis, bem como muitas implementações de referência em github.com

Etapas

Este guia passo a passo pode ser encontrado em nosso repositório do GitHub junto com o script server.py ao qual você fará referência ao criar seu servidor MCP. Neste tutorial, mostraremos como criar um servidor MCP personalizado básico que pode:

Conectar-se a nosso repositório GitHub de tutoriais
Realizar uma busca de tópicos que podem interessar ao usuário
Devolver os resultados com links para o tutorial

Para facilitar este tutorial, criamos um mecanismo pelo qual o servidor que você vai construir pode consumir facilmente nosso conteúdo do tutorial sem a necessidade de autenticação.

Etapa 1. Configure seu ambiente

- ‌Python 3.11 ou mais recente instalado no seu computador (verifique executando python3 --version em seu terminal).

- O módulo venv integrado está disponível (vem com o Python na maioria dos sistemas; em algumas distribuições do Linux, talvez seja necessário instalá-lo separadamente com sudo apt install python3-venv).

- Um terminal de linha de comando (CLI):

- macOS ou Linux: use seu aplicativo Terminal (esses ambientes são semelhantes ao Unix).

- Windows: use PowerShell ou Prompt de Comando, com pequenas diferenças de sintaxe explicadas na próxima etapa.

- Um editor de texto ou IDE de sua escolha

Crie um novo diretório e cd nele

mkdir ibmtutorialmcpserver e cd ibmtutorialmcpserver

Certifique-se de que você esteja no diretórioibmtutorialmcpserver você pode executar o seguinte comando para criar um ambiente virtual

python3 -m venv venv

Observação: no Windows, você pode substituirpython3 withpython

Depois de criar o ambiente virtual, você precisa ativá-lo usando o seguinte comando

source venv/bin/activate

Depois de ativado, seu shell provavelmente mostrará(venv) no prompt

Agora, você precisa instalar o pacote Python parafastMCP Esse framework de código aberto fornece todas as funcionalidades necessárias para executar um servidor MCP e é mantida ativamente. Também instalaremos orequests package para fazer solicitações HTTP simples

Instale ofastMCP erequests pacote compip usando o seguinte comando

pip install fastmcp requests

Após a conclusão dessa etapa, você poderá verificar se o FastMCP está instalado corretamente executando o seguinte comando

fastmcp version

Se obter uma saída semelhante à abaixo, você tem o FastMCP instalado em seu ambiente virtual.

FastMCP version:                                       2.10.1
MCP version:                                           1.10.1
Python version:                                       3.11.13
Platform:                          macOS-15.5-arm64-arm-64bit
FastMCP root path: /opt/homebrew/lib/python3.11/site-packages

Agora você tem o FastMCP instalado; vamos criar nosso servidor MCP.

Etapa 2. Crie um servidor MCP

Crie um novo arquivo no diretório e vamos dar a ele o nomeserver.py .

Quando você tiver esse arquivo, abra-o, copie e cole o seguinte trecho de código nele

# Simple MCP server that exposes a single tool to search IBM tutorials.
# How to run:
# 1) Install dependencies: pip install fastmcp requests
# 2) Start the server using an MCP client with the command: fastmcp run <YOUR PATH>/server.py

from fastmcp import FastMCPimport requests

# Source of the tutorials index
DOCS_INDEX_URL = "https://raw.githubusercontent.com/IBM/ibmdotcom-tutorials/refs/heads/main/docs_index.json"

mcp = FastMCP("IBM Tutorials")

@mcp.tool
def search_ibmtutorials(query: str) -> str:
    """
    Search for tutorials on GitHub by downloading a JSON file from a GitHub repo and searching the payload for any relevant results and the respective details

Args:
    query: The search term to look for in tutorial titles and URLs

Returns:
    A formatted list of relevant tutorial results
    """
    try:
        # Download the JSON file from the GitHub repo
        response = requests.get(DOCS_INDEX_URL, timeout=10)
        response.raise_for_status() # Raise an exception for bad status codes

        # Parse the JSON data
        tutorials = response.json()

        # Search for relevant tutorials (case-insensitive)
        query_lower = query.lower()
        relevant_tutorials = []

        for tutorial in tutorials:
            # Search in title and URL
            title = tutorial.get('title', '').lower()
            url_path = tutorial.get('url', '').lower()

            if query_lower in title or query_lower in url_path:
                relevant_tutorials.append(tutorial)

        # Format and return results
        if not relevant_tutorials:
            return f"No IBM tutorials found matching '{query}'"

        # Format the results
            result_lines = [f"Found {len(relevant_tutorials)} tutorial(s) matching '{query}':\n"]

        for i, tutorial in enumerate(relevant_tutorials, 1):
            title = tutorial.get('title', 'No title')
            tutorial_url = tutorial.get('url', 'No URL')
            date = tutorial.get('date', 'No date')
            author = tutorial.get('author', '')

            result_lines.append(f"{i}. **{title}**")
            result_lines.append(f" URL: {tutorial_url}")
            result_lines.append(f" Date: {date}")
            if author:
                result_lines.append(f" Author: {author}")
            result_lines.append("") # Empty line for spacing

        return "\n".join(result_lines)

    except requests.exceptions.RequestException as e:
    return f"Error fetching tutorials from GitHub: {str(e)}"
    except ValueError as e:
    return f"Error parsing JSON data: {str(e)}"
    except Exception as e:
    return f"Error searching IBM tutorials: {str(e)}"

if __name__ == "__main__":
    mcp.run()

Vamos executar o código anterior e explicar o que as partes principais estão fazendo.

Importações e configuração

O script começa importando o FastMCP, que fornece o framework para a criação de um servidor MCP, e as solicitações usadas para baixar dados por HTTP. Adicionamos uma constanteDOCS_INDEX_URL para manter a URL JSON remota para o índice de tutoriais. Essa abordagem facilita a alteração do local de origem se você tiver outra fonte de dados JSON para reutilizar este tutorial mais tarde.

Configuração do servidor MCP

Em seguida, criamos uma instância de servidor MCP comFastMCP(“IBM Tutorials”) . Essa etapa atua como o controlador central para todas as ferramentas que o servidor exporá aos clientes MCP, como osearch_ibmtutorials ferramenta que definimos.

Definição da ferramenta MCP

O@mcp.tool marcas de decoraçãosearch_ibmtutorials como uma ferramenta MCP. Essa função usa um termo de pesquisa, faz download do índice do tutorial naDOCS_INDEX_URL usandorequests.get() (com um tempo limite de 10 segundos para segurança da rede) e gera uma exceção se o status de resposta HTTP indicar um erro. Depois que os dados são recuperados, eles são analisados de JSON em objetos Python.

A pesquisa não diferencia maiúsculas de minúsculas: a consulta é convertida para letras minúsculas, e o título e a URL de cada tutorial também são reduzidos para correspondência. Se um tutorial contiver o termo de pesquisa no título ou na URL, ele será adicionado a uma lista de resultados relevantes.

Formatação e retorno de resultados

Se nenhum tutorial corresponder à pesquisa, a função retornará uma mensagem amigável indicando que nada foi encontrado. Se houver correspondências, a função criará uma lista numerada e formatada, mostrando o título, o URL, a data e, se disponível, o autor de cada tutorial. A formatação usa negrito no estilo Markdown nos títulos, para que se destaquem nos clientes que oferecem suporte a ela. O texto formatado final é retornado como uma única string.

Tratamento de erros

A função inclui tratamento de exceções direcionada:

requests.exceptions.RequestException detecta problemas de rede, como tempo limite ou conexões ruins.

ValueError (que pode ser gerado por .json()) captura casos em que a resposta não é um JSON válido.

Um manipuladorException geral captura qualquer coisa inesperada.

Cada erro retorna uma mensagem descritiva para o responsável pela chamada, em vez de interromper o programa.

Iniciando o servidor

Na parte inferior, o blocoif name == “main” : garante quemcp.run() seja executado apenas quando o script é executado diretamente. Esta etapa inicia o servidor MCP, tornando osearch_ibmtutorials disponível para qualquer cliente MCP, como o MCP Inspector. Essa ferramenta é útil para solucionar problemas e depurar o servidor MCP. A ferramenta oferece uma IU que pode ser usada para depurar o servidor MCP e a validação do comportamento esperado.

Etapa 3. Adicione o servidor MCP a seu IDE

Agora que você criou seu servidor, é necessário ativá-lo em seu IDE antes de usá-lo. Há muitos clientes que oferecem suporte ao MCP com vários níveis de integração com o protocolo. O site oficial do MCP oferece uma lista completa de exemplos de clientes.
Se você tiver o Cursor instalado, poderá adicionar o servidor MCP dentro do Cursor seguindo estas instruções.

Abra as configurações do Cursor e navegue até Ferramentas e integrações. Selecione Novo servidor MCP e cole no arquivo mcp.json que o Cursor abre em uma nova guia. Certifique-se de substituir <YOUR PATH> pelo diretório em que você está. Você pode executar pwd em seu terminal para obter o caminho completo. Para obter mais informações sobre o Cursor e o MCP, consulte os documentos do Cursor.

{
  &quot;mcpServers&quot;: {
    &quot;tutorials&quot;: {
      &quot;command&quot;: &quot;fastmcp&quot;,
      &quot;args&quot;: [&quot;run <YOUR PATH>/ibmtutorialmcpserver/server.py&quot;],
      &quot;env&quot;: {
      }
    }
  }
}

Se você for usuário do Microsoft VS Code, poderá adicionar o servidor MCP usando as instruções vinculadas aqui. Certifique-se de que o Copilot esteja configurado no VS Code antes de continuar.
Se você quiser habilitar o servidor MCP usando um arquivo, crie um arquivo .vscode/mcp.json no diretório desse projeto e copie e cole este código no arquivo. Certifique-se de substituir <YOUR PATH> pelo diretório em que você está. Você pode executar pwd em seu terminal para obter o caminho completo.

&quot;servers&quot;: {
		&quot;IBM Tutorials&quot;: {
			&quot;type&quot;: &quot;stdio&quot;,
			&quot;command&quot;: &quot;fastmcp&quot;,
			&quot;args&quot;: [
				&quot;run&quot;,
				&quot;<YOUR PATH>/ibmtutorialmcpserver/server.py&quot;
			]
		},
	},

Etapa 4. Use seu servidor MCP

Agora que você ativou seu servidor MCP, vamos colocar o servidor em execução para que você possa usar a ferramenta criada em server.py. Se você estiver usando o VS Code, consulte estes documentos.

No bate-papo do IDE, perguntarei "Quais são alguns tutoriais de séries temporais da IBM?" Veja a seguir a saída recebida, mas sua resposta pode variar dependendo do modelo usado e do seu IDE.

Saída:

Here are some IBM time series tutorials:

Time series forecasting with Lag-Llama (zero-shot learning)
Tutorial link
Predict overnight low temperatures using the Lag-Llama model in a zero-shot learning scenario.

Using the watsonx.ai Time Series Forecasting API to predict energy demand
Tutorial link
Predict energy demand with the watsonx.ai Time Series Forecasting API.
Authors: Aleksandra Kłeczek and Meredith Syed

Let me know if you want details or help with a specific tutorial.

Ótimo! O agente pôde usar a ferramenta search_ibmtutorials que criamos para pesquisar tutoriais relacionados a séries temporais.

Resumo

Neste tutorial, você aprendeu a construir um servidor MCP para pesquisar em todos os nossos tutoriais usando qualquer cliente MCP de sua preferência. Você criou um servidor MCP com uma única ferramenta de pesquisa que recupera um índice JSON remoto de tutoriais, filtra os resultados com base em um termo de pesquisa e os retorna em um formato legível. Ele usa Fastmcp para registrar e executar a ferramenta, solicitações para buscar os dados e inclui tratamento de erros para rede, análise e problemas inesperados. Quando executado, o servidor pode ser conectado pelos clientes MCP para consulta em tempo real de todos os nossos tutoriais.

Comece a gerar ROI: Guia prático da IA agêntica

Descubra maneiras de progredir, escalando com sucesso a IA em toda a sua empresa com resultados reais.

Recursos

Aumente a produtividade com agentes de IA criados para sua empresa

Explore o potencial revolucionário dos agentes de IA capazes de se integrar facilmente às suas operações comerciais.

Guia de compra de agentes de IA 2025

Aprofunde-se neste guia abrangente que divide os principais casos de uso, os principais recursos e as recomendações passo a passo para ajudar na escolha das soluções certas para sua empresa.

Reinvente a produtividade de negócios com agentes e assistentes de IA

Saiba como agentes de IA e assistentes de IA podem trabalhar juntos para atingir novos níveis de produtividade.

Relatório da Omdia sobre inteligência capacitada: o impacto dos agentes de IA

Descubra como você pode liberar todo o potencial da IA generativa com agentes de IA.

A vanguarda das empresas agênticas: colocando a IA para trabalhar em todo o seu portfólio de tecnologias

Mantenha-se a par dos novos agentes de IA, um divisor de águas fundamental na revolução de IA.

Experimente o watsonx Orchestrate

Entenda como a IA generativa é capaz de aliviar sua carga de trabalho e aumentar a produtividade

Como os agentes de IA reinventarão a produtividade

Aprenda maneiras de usar a IA para ser mais criativo e eficiente e começar a se adaptar a um futuro que envolve trabalhar em estreita colaboração com agentes de IA.

O futuro dos agentes, o consumo de energia da IA, o uso de computadores da Anthropic e a marca d'água da IA do Google em textos gerados

Fique à frente da curva com nossos especialistas em IA neste episódio de Mixture of Experts enquanto eles se aprofundam no futuro dos agentes de IA e muito mais.

Como a Comparus está usando um "assistente bancário"

A Comparus usou as soluções do IBM® watsonx.ai e demonstrou de forma impressionante o potencial dos serviços bancários conversacionais como um novo modelo de interação.

Soluções relacionadas

Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

Explore o watsonx Orchestrate

Soluções de agentes de IA da IBM

Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

Explore soluções de agentes de IA

Serviços de IA do IBM® Consulting

Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

Explore os serviços de inteligência artificial

Dê o próximo passo

Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

Explore o watsonx Orchestrate

Explore o watsonx.ai