
MCP (Multi-Modal Communication Protocol) è un protocollo open source progettato per facilitare l'interazione tra modelli di linguaggio e strumenti esterni. In parole semplici, MCP permette di 'estendere' le capacità di un modello AI consentendogli di eseguire azioni reali, come chiamare API o script su server locali.
Introduzione a MCP: cos'è e quali vantaggi offre
MCP (Model Context Protocol) è un protocollo open source progettato per facilitare l'interazione tra modelli di linguaggio e strumenti esterni. In parole semplici, MCP permette di "estendere" le capacità di un modello AI consentendogli di eseguire azioni reali, come chiamare API o script su server locali.
In questo articolo esamineremo un esempio pratico che permetterà a Gemini di accedere in tempo reale ad un server MCP per conoscere le previsioni del tempo di una data località.
Vantaggi principali di MCP:
- Integrazione diretta con strumenti in locale o remoti.
- Flessibilità nei flussi di lavoro AI-driven.
- Facilità d’uso grazie al supporto Python e Node.js.
- Compatibilità con i modelli Gemini tramite Google AI Studio.
Configurazione dell’ambiente
1. Installazione di Python 3.10 su Ubuntu 20.04
sudo apt update
sudo apt install software-properties-common
sudo add-apt-repository ppa:deadsnakes/ppa
sudo apt update
sudo apt install python3.10 python3.10-venv python3.10-pip python3.10-dev
2. Creazione dell’ambiente virtuale
python3.10 -m venv mcp_env
source mcp_env/bin/activate
python --version # Deve mostrare Python 3.10.x
3. Installazione delle dipendenze
python -m pip install --upgrade pip
pip install mcp google-generativeai
4. Installazione di Node.js
curl -fsSL https://deb.nodesource.com/setup_lts.x | sudo -E bash -
sudo apt-get install -y nodejs
5. Configurazione chiave API Gemini
export GEMINI_API_KEY="la_tua_chiave_api_qui"
Oppure, aggiungi al tuo ~/.bashrc
:
echo 'export GEMINI_API_KEY="la_tua_chiave_api_qui"' >> ~/.bashrc
source ~/.bashrc
Script MCP: spiegato passo passo
Salva questo codice in un file chiamato weather_mcp.py
:
import os
import asyncio
from datetime import datetime
from mcp import ClientSession, StdioServerParameters
from mcp.client.stdio import stdio_client
from google import genai
client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))
server_params = StdioServerParameters(
command="npx",
args=["-y", "@philschmid/weather-mcp"]
)
async def run():
async with stdio_client(server_params) as (read, write):
async with ClientSession(read, write) as session:
prompt = f"What is the weather in Rome in {datetime.now().strftime('%A')}?"
await session.initialize()
response = await client.aio.models.generate_content(
model="gemini-2.0-flash",
contents=prompt,
config=genai.types.GenerateContentConfig(
temperature=0,
tools=[session]
),
)
print(response.text)
asyncio.run(run())
Come funziona
- Usa
ClientSession
per gestire il dialogo tra il modello e lo script. - Avvia il server MCP tramite
npx
e@philschmid/weather-mcp
. - Inoltra il prompt al modello Gemini, che usa MCP come tool per ottenere la risposta meteo.
Conclusione: il futuro di MCP
Il Model Context Protocol (MCP) segna un punto di svolta cruciale nell'evoluzione dell'intelligenza artificiale generativa, proiettandola da un ambito di mera creazione di contenuti a un'interazione dinamica e funzionale con il mondo del software. Superando la frammentazione degli approcci "ad hoc", l'MCP si impone come uno standard universale, una sorta di "USB-C per l'AI", che standardizza il dialogo tra i modelli linguistici e gli strumenti digitali esterni. Questa architettura, basata su un modello client-server, non rappresenta solo un'innovazione tecnica, ma il fondamento per un futuro in cui l'AI agisce come un vero e proprio partner operativo.
L'impatto di questo protocollo si manifesta con particolare forza in tre ambiti applicativi principali, destinati a ridefinire le nostre interazioni con la tecnologia:
Automazione Intelligente: L'MCP permette agli agenti AI di orchestrare flussi di lavoro complessi, interagendo con database, API e servizi software in modo fluido e standardizzato. Immaginiamo un sistema in grado di analizzare autonomamente la documentazione legale, interrogare database specifici per trovare precedenti, confrontare i testi e, infine, generare un report completo. Questo livello di automazione, prima relegato a complesse e costose integrazioni personalizzate, diventa ora accessibile e scalabile, aprendo le porte a un'efficienza senza precedenti nei processi aziendali.
Assistenti Virtuali di Nuova Generazione: Gli assistenti virtuali, grazie all'MCP, possono finalmente uscire dai loro confini pre-programmati. Un assistente personale potrà non solo rispondere a domande, ma anche consultare in tempo reale la nostra agenda, prenotare un ristorante tramite il sistema di booking online, e contemporaneamente aggiungere un evento al nostro calendario, il tutto attraverso un'unica interazione conversazionale. La capacità di attingere a un contesto ricco e variegato di dati e strumenti trasforma questi assistenti in veri e propri "agenti" proattivi e personalizzati.
Interazioni Vocali Avanzate e Contestuali: Nel campo delle interazioni vocali, l'MCP abilita un salto di qualità fondamentale. I comandi vocali non saranno più semplici istruzioni isolate, ma l'innesco di azioni complesse e consapevoli del contesto. Sarà possibile, ad esempio, chiedere alla propria auto di "trovare il percorso meno trafficato per l'ufficio, tenendo conto dei miei appuntamenti di oggi e della necessità di fare una ricarica lungo la strada". L'AI, tramite MCP, potrà interrogare il navigatore, il calendario e le app di localizzazione delle colonnine di ricarica per fornire una soluzione integrata.
In conclusione, il Model Context Protocol non è semplicemente un nuovo acronimo nel panorama tecnologico, ma il catalizzatore di un cambiamento paradigmatico. Abbattendo le barriere tra l'intelligenza artificiale generativa e l'ecosistema software esistente, l'MCP spiana la strada a un futuro di "AI agentiva", in cui i modelli linguistici non si limiteranno a comprendere e generare linguaggio, ma agiranno nel nostro mondo digitale in modo utile, pertinente e, soprattutto, integrato. L'adozione di questo standard da parte di colossi del settore come Anthropic, IBM e Microsoft ne conferma la portata rivoluzionaria, preannunciando un'era di simbiosi uomo-macchina sempre più profonda e funzionale.