Serveur de Protocole de Contexte de Modèle (mcp) pour l'Acteur du Navigateur Web Rag 🌐
Un serveur MCP pour l'acteur du navigateur Web RAG
Aperçu
Qu'est-ce que le serveur MCP pour le navigateur web RAG ?
Le serveur MCP pour le navigateur web RAG est un outil puissant conçu pour améliorer la fonctionnalité des tâches de scraping web et d'automatisation. Il sert de serveur backend qui facilite le fonctionnement de l'acteur du navigateur web RAG (Retrieval-Augmented Generation), permettant aux utilisateurs de rassembler et de traiter efficacement les données web. Ce serveur est particulièrement utile pour les développeurs et les scientifiques des données qui nécessitent une solution robuste pour l'extraction et la manipulation des données web.
Caractéristiques du serveur MCP pour le navigateur web RAG
- Intégration transparente : Le serveur MCP s'intègre sans effort avec le navigateur web RAG, permettant un fonctionnement fluide et une récupération des données.
- Scalabilité : Conçu pour gérer plusieurs requêtes simultanément, le serveur peut évoluer en fonction des besoins des utilisateurs, le rendant adapté aux petits comme aux grands projets.
- Interface conviviale : Le serveur fournit une interface intuitive qui simplifie la configuration et la gestion des tâches de scraping web.
- Performance robuste : Avec des algorithmes optimisés, le serveur MCP garantit un traitement des données rapide et fiable, minimisant les temps d'arrêt et maximisant l'efficacité.
- Support pour divers formats de données : Le serveur peut gérer différents formats de données, le rendant polyvalent pour diverses applications en analyse de données et en reporting.
Comment utiliser le serveur MCP pour le navigateur web RAG
- Installation : Commencez par installer le serveur MCP sur votre machine locale ou votre serveur. Suivez les instructions d'installation fournies dans la documentation.
- Configuration : Configurez les paramètres du serveur pour correspondre aux exigences de votre projet. Cela inclut la configuration des clés API, des formats de données et d'autres préférences.
- Intégration : Connectez le serveur MCP avec l'acteur du navigateur web RAG. Cette étape est cruciale pour activer les capacités de récupération et de traitement des données.
- Exécution : Démarrez le serveur et exécutez vos tâches de scraping web. Surveillez la performance et ajustez les paramètres si nécessaire pour optimiser les résultats.
- Gestion des données : Une fois les données collectées, utilisez les outils du serveur pour gérer, analyser et exporter les données dans le format souhaité.
Questions Fréquemment Posées
Q : Quelle est l'utilisation principale du serveur MCP pour le navigateur web RAG ?
R : Le serveur MCP est principalement utilisé pour le scraping web et les tâches d'automatisation, permettant aux utilisateurs de rassembler et de traiter efficacement des données provenant de divers sites web.
Q : Le serveur MCP est-il adapté aux projets à grande échelle ?
R : Oui, le serveur MCP est conçu pour être évolutif, ce qui le rend adapté aux projets de petite et grande envergure.
Q : Puis-je personnaliser les paramètres du serveur ?
R : Absolument ! Le serveur MCP permet une personnalisation extensive des paramètres pour répondre aux besoins spécifiques du projet.
Q : Quels types de formats de données le serveur prend-il en charge ?
R : Le serveur MCP prend en charge divers formats de données, y compris JSON, CSV et XML, le rendant polyvalent pour différentes applications.
Q : Où puis-je trouver plus d'informations sur le serveur MCP ?
R : Pour des informations plus détaillées, vous pouvez visiter la documentation officielle d'Apify ou le dépôt GitHub pour le serveur MCP.
Détail
Model Context Protocol (MCP) Server for the RAG Web Browser Actor 🌐
Implementation of an MCP server for the RAG Web Browser Actor. This Actor serves as a web browser for large language models (LLMs) and RAG pipelines, similar to a web search in ChatGPT.
<a href="https://glama.ai/mcp/servers/sr8xzdi3yv"><img width="380" height="200" src="https://glama.ai/mcp/servers/sr8xzdi3yv/badge" alt="mcp-server-rag-web-browser MCP server" /></a>
🎯 What does this MCP server do?
This server is specifically designed to provide fast responses to AI agents and LLMs, allowing them to interact with the web and extract information from web pages. It runs locally and communicates with the RAG Web Browser Actor in Standby mode, sending search queries and receiving extracted web content in response.
The RAG Web Browser Actor allows an AI assistant to:
- Perform web search, scrape the top N URLs from the results, and return their cleaned content as Markdown
- Fetch a single URL and return its content as Markdown
🧱 Components
Tools
- search: Query Google Search, scrape the top N URLs from the results, and returns their cleaned content as Markdown. Arguments:
query
(string, required): Search term or URLmaxResults
(number, optional): Maximum number of search results to scrape (default: 1)scrapingTool
(string, optional): Select a scraping tool for extracting web pages. Options: 'browser-playwright' or 'raw-http' (default: 'raw-http')outputFormats
(array, optional): Select one or more formats for the output. Options: 'text', 'markdown', 'html' (default: ['markdown'])requestTimeoutSecs
(number, optional): Maximum time in seconds for the request (default: 40)
🔄 What is the Model Context Protocol?
The Model Context Protocol (MCP) is a framework that enables AI applications, such as Claude Desktop, to connect seamlessly with external tools and data sources. For more details, visit the Model Context Protocol website or read the blog post What is MCP and why does it matter?.
🤖 How does the MCP Server integrate with AI Agents?
The MCP Server empowers AI Agents to perform web searches and browsing using the RAG Web Browser Actor. For a comprehensive understanding of AI Agents, check out our blog post: What are AI Agents? and explore Apify's Agents.
Interested in building and monetizing your own AI agent on Apify? Check out our step-by-step guide for creating, publishing, and monetizing AI agents on the Apify platform.
🔌 Related MCP servers and clients by Apify
This server operates over standard input/output (stdio), providing a straightforward connection to AI Agents. Apify offers several other MCP-related tools:
Server Options
- 🖥️ This MCP Server – A local stdio-based server for direct integration with Claude Desktop
- 🌐 RAG Web Browser Actor via SSE – Access the RAG Web Browser directly via Server-Sent Events without running a local server
- 🇦 MCP Server Actor – MCP Server that provides AI agents with access to over 4,000 specialized Apify Actors
Client Options
- 💬 Tester MCP Client – A user-friendly UI for interacting with any SSE-based MCP server
🛠️ Configuration
Prerequisites
- MacOS or Windows
- The latest version of Claude Desktop must be installed (or another MCP client)
- Node.js (v18 or higher)
- Apify API Token (
APIFY_TOKEN
)
Install
Follow the steps below to set up and run the server on your local machine: First, clone the repository using the following command:
git clone git@github.com:apify/mcp-server-rag-web-browser.git
Navigate to the project directory and install the required dependencies:
cd mcp-server-rag-web-browser
npm install
Before running the server, you need to build the project:
npm run build
Claude Desktop
Configure Claude Desktop to recognize the MCP server.
-
Open your Claude Desktop configuration and edit the following file:
- On macOS:
~/Library/Application\ Support/Claude/claude_desktop_config.json
- On Windows:
%APPDATA%/Claude/claude_desktop_config.json
"mcpServers": { "rag-web-browser": { "command": "npx", "args": [ "@apify/mcp-server-rag-web-browser" ], "env": { "APIFY_TOKEN": "your-apify-api-token" } } }
- On macOS:
-
Restart Claude Desktop
- Fully quit Claude Desktop (ensure it's not just minimized or closed).
- Restart Claude Desktop.
- Look for the 🔌 icon to confirm that the server is connected.
-
Examples
You can ask Claude to perform web searches, such as:
What is an MCP server and how can it be used? What is an LLM, and what are the recent news updates? Find and analyze recent research papers about LLMs.
Debug the server using the MCP Inspector
export APIFY_TOKEN=your-apify-api-token
npx @modelcontextprotocol/inspector npx -y @apify/mcp-server-rag-web-browser
👷🏼 Development
Local client (stdio)
To test the server locally, you can use example_client_stdio.ts
:
export APIFY_TOKEN=your-apify-api-token
node dist/example_client_stdio.js
The script will start the MCP server, fetch available tools, and then call the search
tool with a query.
Direct API Call
To test calling the RAG Web Browser Actor directly:
export APIFY_TOKEN=your-apify-api-token
node dist/example_call_web_browser.js
Debugging
Since MCP servers operate over standard input/output (stdio), debugging can be challenging. For the best debugging experience, use the MCP Inspector.
Build the mcp-server-rag-web-browser package:
npm run build
You can launch the MCP Inspector via npm
with this command:
export APIFY_TOKEN=your-apify-api-token
npx @modelcontextprotocol/inspector node dist/index.js
Upon launching, the Inspector will display a URL that you can access in your browser to begin debugging.
Configuration du serveur
{
"mcpServers": {
"mcp-server-rag-web-browser": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--apify--mcp-server-rag-web-browser--mcp-server-rag-web-browser",
"npm run start"
],
"env": {
"APIFY_TOKEN": "apify-token"
}
}
}
}