Automatisation du navigateur Mcp
Serveur d'automatisation de navigateur MCP. Expose des outils de contrôle de navigateur aux systèmes d'IA externes via le Protocole de Contexte de Modèle. Open-source et sécurisé.
Aperçu
Qu'est-ce que le navigateur Algonius ?
Le ### navigateur Algonius est un serveur d'automatisation de navigateur open-source conçu pour exposer des outils de contrôle de navigateur à des systèmes d'IA externes via le Protocole de Contexte de Modèle (MCP). Cet outil innovant permet aux développeurs d'intégrer des fonctionnalités de navigateur dans leurs applications, permettant une automatisation et un contrôle sans faille des interactions web.
Caractéristiques du navigateur Algonius
- Open Source : Le navigateur Algonius est entièrement open-source, permettant aux développeurs d'accéder, de modifier et de contribuer à son code source.
- Intégration MCP : Il utilise le Protocole de Contexte de Modèle pour faciliter la communication entre les systèmes d'IA et les outils de contrôle de navigateur.
- Sécurisé : Le navigateur est conçu avec la sécurité à l'esprit, garantissant que les tâches d'automatisation sont effectuées de manière sûre et efficace.
- Interface conviviale : Le navigateur fournit une interface simple pour que les développeurs puissent mettre en œuvre des tâches d'automatisation sans configuration extensive.
- Support communautaire : Étant un projet open-source, il dispose d'une communauté croissante de contributeurs et d'utilisateurs qui fournissent soutien et améliorations.
Comment utiliser le navigateur Algonius
- Installation : Commencez par cloner le dépôt depuis GitHub et suivez les instructions d'installation fournies dans la documentation.
- Configuration : Configurez les paramètres du navigateur selon vos besoins. Cela peut inclure la configuration du Protocole de Contexte de Modèle pour la communication avec les systèmes d'IA.
- Tâches d'automatisation : Utilisez les API fournies pour créer des scripts d'automatisation qui peuvent contrôler des actions de navigateur telles que la navigation, la soumission de formulaires et l'extraction de données.
- Test : Exécutez vos scripts d'automatisation dans un environnement contrôlé pour vous assurer qu'ils fonctionnent comme prévu avant de les déployer en production.
- Contribuer : Si vous avez des améliorations ou des fonctionnalités à ajouter, envisagez de contribuer au projet en soumettant des demandes de tirage sur GitHub.
Questions Fréquemment Posées
Q1 : Le navigateur Algonius est-il gratuit à utiliser ?
A1 : Oui, le navigateur Algonius est open-source et gratuit à utiliser sous la licence Apache-2.0.
Q2 : Puis-je intégrer le navigateur Algonius avec des systèmes d'IA existants ?
A2 : Absolument ! Le navigateur est conçu pour fonctionner avec des systèmes d'IA externes via le Protocole de Contexte de Modèle, rendant l'intégration simple.
Q3 : Où puis-je trouver la documentation pour le navigateur Algonius ?
A3 : La documentation est disponible dans le dépôt sur GitHub, qui comprend des instructions d'installation, des références API et des exemples d'utilisation.
Q4 : Comment puis-je signaler des problèmes ou demander des fonctionnalités ?
A4 : Vous pouvez signaler des problèmes ou demander des fonctionnalités en ouvrant un problème dans le dépôt GitHub. La communauté surveille activement et répond aux retours.
Q5 : Existe-t-il une communauté pour les utilisateurs du navigateur Algonius ?
A5 : Oui, il existe une communauté active d'utilisateurs et de contributeurs sur GitHub, où vous pouvez poser des questions, partager des expériences et collaborer sur des projets.
Détail
🌐 Overview
Algonius Browser is an open-source MCP (Model Context Protocol) server that provides browser automation capabilities to external AI systems. It exposes a comprehensive set of browser control tools through the MCP protocol, enabling AI assistants and other tools to navigate websites, interact with DOM elements, and extract web content programmatically.
🎯 Key Features
- MCP Protocol Integration: Standard interface for AI systems to control browser automation
- Chrome Extension: Background service worker that handles browser interactions
- Native Messaging: Go-based MCP host that bridges Chrome extension with external tools
- Comprehensive Tool Set: 5 browser automation tools + 2 MCP resources
- Type Safety: Full TypeScript implementation with structured error handling
- Testing Suite: Comprehensive integration tests for all functionality
🛠️ Available MCP Tools
Navigation & Tabs
navigate_to
: Navigate to URLs with configurable timeout handlingmanage_tabs
: Create, close, and switch between browser tabs
DOM Interaction
get_dom_extra_elements
: Advanced DOM element extraction with pagination and filteringclick_element
: Click DOM elements using CSS selectors or text matchingset_value
: Set values in input fields, textareas, and form elementsscroll_page
: Scroll pages up or down with customizable distances
📋 Available MCP Resources
Browser State Resources
-
browser://current/state
: Complete current browser state in AI-friendly Markdown format- Active tab information
- All browser tabs with URLs, titles, and status
- Real-time state updates via resource notifications
-
browser://dom/state
: Current DOM state overview in Markdown format- Page metadata (URL, title, scroll position)
- First 20 interactive elements
- Total element count with "more available" indicators
- Simplified DOM structure
- Auto-updates when page changes
🚀 Quick Start
1. Install Chrome Extension
From Chrome Web Store (Recommended):
<a href="https://chromewebstore.google.com/detail/algonius-browser-mcp/fmcmnpejjhphnfdaegmdmahkgaccghem" target="_blank"> <img src="https://github.com/user-attachments/assets/4c2c0b5e-8f63-4a8b-9a5e-2d7e8f3c9b1a" alt="Available in the Chrome Web Store" width="248" height="75"> </a>- Click the "Add to Chrome" button on the Chrome Web Store page
- Confirm the installation when prompted
- The extension will be automatically installed and ready to use
From Source (Development):
### Clone and build
git clone https://github.com/algonius/algonius-browser.git
cd algonius-browser
pnpm install
pnpm build
### Load in Chrome
### 1. Open chrome://extensions/
### 2. Enable "Developer mode"
### 3. Click "Load unpacked"
### 4. Select the 'dist' folder
⚠️ Important: The Chrome extension requires the MCP Host backend service to function properly. Please continue with step 2 to complete the installation.
2. Install MCP Host
One-Click Installation (Recommended):
Linux/macOS:
curl -fsSL https://raw.githubusercontent.com/algonius/algonius-browser/master/install-mcp-host.sh | bash
Windows (PowerShell):
iwr -useb https://raw.githubusercontent.com/algonius/algonius-browser/master/install-mcp-host.ps1 | iex
Manual Installation:
### Download latest release
wget https://github.com/algonius/algonius-browser/releases/latest/download/mcp-host-linux-x86_64.tar.gz
### Extract and install
tar -xzf mcp-host-linux-x86_64.tar.gz
cd mcp-host-linux-x86_64
./install.sh
3. Verify Installation
### Test the MCP host installation
mcp-host-go --version
### The MCP host will be automatically started when needed by the Chrome extension
### You should see the extension icon in your Chrome toolbar
✅ Success: Both components are now installed! The Chrome extension will automatically communicate with the MCP Host when browser automation is requested.
🔧 Integration Examples
Using with AI Assistants
Once installed, AI systems can use the browser automation tools and resources through the MCP protocol:
Tool Usage:
{
"method": "tools/call",
"params": {
"name": "navigate_to",
"arguments": {
"url": "https://example.com",
"timeout": 30000
}
}
}
Resource Access:
{
"method": "resources/read",
"params": {
"uri": "browser://current/state"
}
}
Common Workflows
Web Scraping:
navigate_to
→ Navigate to target site- Read
browser://dom/state
→ Get page overview get_dom_extra_elements
→ Get specific elements with paginationclick_element
→ Interact with elements- Read
browser://dom/state
→ Extract updated content
Form Automation:
navigate_to
→ Go to form page- Read
browser://dom/state
→ Identify form elements set_value
→ Fill form fieldsclick_element
→ Submit form- Read
browser://current/state
→ Verify completion
Multi-Tab Management:
- Read
browser://current/state
→ Check current tabs manage_tabs
→ Create/switch tabsnavigate_to
→ Load content in each tab- Read
browser://current/state
→ Monitor all tab states
Page Navigation with Scrolling:
navigate_to
→ Go to target page- Read
browser://dom/state
→ Get initial page state scroll_page
→ Scroll to load more contentget_dom_extra_elements
→ Extract newly loaded elements
🏗️ Architecture
External AI System
↓ (MCP Protocol)
MCP Host (Go)
↓ (Native Messaging)
Chrome Extension
↓ (Chrome APIs)
Browser Tabs
Components
- MCP Host: Go-based native messaging host that implements MCP protocol
- Chrome Extension: Background service worker with tool handlers
- Content Scripts: DOM interaction and data extraction utilities
- Integration Tests: Comprehensive test suite for all tools
🧪 Development
Build from Source
Prerequisites:
- Node.js 22.12.0+
- pnpm 9.15.1+
- Go 1.21+ (for MCP host)
Build Extension:
pnpm install
pnpm build
Build MCP Host:
cd mcp-host-go
make build
Run Tests:
### Extension tests
pnpm test
### MCP host tests
cd mcp-host-go
make test
Development Mode
### Extension development
pnpm dev
### MCP host development
cd mcp-host-go
make dev
📊 Supported Platforms
MCP Host:
- Linux x86_64
- macOS Intel (x86_64) and Apple Silicon (arm64)
- Windows x86_64
Chrome Extension:
- Chrome/Chromium 88+
- Microsoft Edge 88+
📚 Documentation
Detailed documentation available in the docs/
directory:
🤝 Contributing
We welcome contributions! Check out our CONTRIBUTING.md for guidelines.
Ways to contribute:
- Report bugs and feature requests
- Submit pull requests for improvements
- Add integration tests
- Improve documentation
- Share usage examples
🔒 Security
For security vulnerabilities, please create a GitHub Security Advisory rather than opening a public issue.
💬 Community
- Discord - Chat with developers and users
- GitHub Discussions - Share ideas and ask questions
📄 License
This project is licensed under the Apache License 2.0 - see the LICENSE file for details.
👏 Acknowledgments
Built with these excellent open-source projects:
Made with ❤️ by the Algonius Browser Team
Give us a star 🌟 if this project helps you build better browser automation!
Configuration du serveur
{
"mcpServers": {
"algonius-browser": {
"command": "start",
"autoApprove": [
"click_element",
"get_dom_extra_elements",
"manage_tabs",
"scroll_page",
"type_value",
"navigate_to"
],
"disabled": false,
"timeout": 3600,
"url": "http://127.0.0.1:9333/sse",
"type": "sse"
}
}
}