Mcpブラウザ自動化

作成者:algoniusalgonius

MCPブラウザ自動化サーバー。モデルコンテキストプロトコルを介して外部AIシステムにブラウザ制御ツールを提供します。オープンソースで安全です。

概要

Algonius Browserとは?

Algonius Browserは、ブラウザ制御ツールを外部のAIシステムに提供するために設計されたオープンソースのブラウザ自動化サーバーです。この革新的なツールにより、開発者はアプリケーションにブラウザ機能を統合し、ウェブインタラクションの自動化と制御をシームレスに行うことができます。

Algonius Browserの特徴

  • オープンソース:Algonius Browserは完全にオープンソースであり、開発者はそのコードベースにアクセスし、変更し、貢献することができます。
  • MCP統合:モデルコンテキストプロトコルを利用して、AIシステムとブラウザ制御ツール間の通信を促進します。
  • セキュア:ブラウザはセキュリティを考慮して設計されており、自動化タスクが安全かつ効率的に実行されることを保証します。
  • ユーザーフレンドリーなインターフェース:ブラウザは、開発者が広範な設定なしに自動化タスクを実装できる簡単なインターフェースを提供します。
  • コミュニティサポート:オープンソースプロジェクトであるため、貢献者やユーザーの成長するコミュニティがサポートや改善を提供しています。

Algonius Browserの使い方

  1. インストール:まず、GitHubからリポジトリをクローンし、ドキュメントに記載されたインストール手順に従います。
  2. セットアップ:ブラウザの設定を要件に応じて構成します。これには、AIシステムとの通信のためにモデルコンテキストプロトコルを設定することが含まれる場合があります。
  3. 自動化タスク:提供されたAPIを利用して、ナビゲーション、フォーム送信、データ抽出などのブラウザアクションを制御する自動化スクリプトを作成します。
  4. テスト:自動化スクリプトを制御された環境で実行し、プロダクション環境に展開する前に期待通りに機能することを確認します。
  5. 貢献:改善や追加機能がある場合は、GitHubでプルリクエストを提出してプロジェクトに貢献することを検討してください。

よくある質問

Q1: Algonius Browserは無料で使用できますか?

A1: はい、Algonius Browserはオープンソースであり、Apache-2.0ライセンスの下で無料で使用できます。

Q2: Algonius Browserを既存のAIシステムと統合できますか?

A2: もちろんです!ブラウザはモデルコンテキストプロトコルを介して外部のAIシステムと連携するように設計されており、統合は簡単です。

Q3: Algonius Browserのドキュメントはどこにありますか?

A3: ドキュメントはGitHubのリポジトリにあり、インストール手順、APIリファレンス、使用例が含まれています。

Q4: 問題を報告したり機能をリクエストするにはどうすればよいですか?

A4: GitHubリポジトリで問題を開くことで、問題を報告したり機能をリクエストできます。コミュニティはフィードバックを積極的に監視し、応答します。

Q5: Algonius Browserユーザーのためのコミュニティはありますか?

A5: はい、GitHubにはユーザーと貢献者の活発なコミュニティがあり、質問をしたり、経験を共有したり、プロジェクトで協力したりできます。

詳細

<div align="center"> <img src="https://github.com/user-attachments/assets/1b2b1bc0-c7b4-4a45-83f5-4a6161831535" width="600" alt="Algonius Browser Banner" /> </div> <h1 align="center">MCP Browser Automation</h1>

🌐 Overview

Algonius Browser is an open-source MCP (Model Context Protocol) server that provides browser automation capabilities to external AI systems. It exposes a comprehensive set of browser control tools through the MCP protocol, enabling AI assistants and other tools to navigate websites, interact with DOM elements, and extract web content programmatically.

🎯 Key Features

  • MCP Protocol Integration: Standard interface for AI systems to control browser automation
  • Chrome Extension: Background service worker that handles browser interactions
  • Native Messaging: Go-based MCP host that bridges Chrome extension with external tools
  • Comprehensive Tool Set: 5 browser automation tools + 2 MCP resources
  • Type Safety: Full TypeScript implementation with structured error handling
  • Testing Suite: Comprehensive integration tests for all functionality

🛠️ Available MCP Tools

Navigation & Tabs

  • navigate_to: Navigate to URLs with configurable timeout handling
  • manage_tabs: Create, close, and switch between browser tabs

DOM Interaction

  • get_dom_extra_elements: Advanced DOM element extraction with pagination and filtering
  • click_element: Click DOM elements using CSS selectors or text matching
  • set_value: Set values in input fields, textareas, and form elements
  • scroll_page: Scroll pages up or down with customizable distances

📋 Available MCP Resources

Browser State Resources

  • browser://current/state: Complete current browser state in AI-friendly Markdown format

    • Active tab information
    • All browser tabs with URLs, titles, and status
    • Real-time state updates via resource notifications
  • browser://dom/state: Current DOM state overview in Markdown format

    • Page metadata (URL, title, scroll position)
    • First 20 interactive elements
    • Total element count with "more available" indicators
    • Simplified DOM structure
    • Auto-updates when page changes

🚀 Quick Start

1. Install Chrome Extension

From Chrome Web Store (Recommended):

<a href="https://chromewebstore.google.com/detail/algonius-browser-mcp/fmcmnpejjhphnfdaegmdmahkgaccghem" target="_blank"> <img src="https://github.com/user-attachments/assets/4c2c0b5e-8f63-4a8b-9a5e-2d7e8f3c9b1a" alt="Available in the Chrome Web Store" width="248" height="75"> </a>
  1. Click the "Add to Chrome" button on the Chrome Web Store page
  2. Confirm the installation when prompted
  3. The extension will be automatically installed and ready to use

From Source (Development):

### Clone and build
git clone https://github.com/algonius/algonius-browser.git
cd algonius-browser
pnpm install
pnpm build

### Load in Chrome
### 1. Open chrome://extensions/
### 2. Enable "Developer mode"
### 3. Click "Load unpacked"
### 4. Select the 'dist' folder

⚠️ Important: The Chrome extension requires the MCP Host backend service to function properly. Please continue with step 2 to complete the installation.

2. Install MCP Host

One-Click Installation (Recommended):

Linux/macOS:

curl -fsSL https://raw.githubusercontent.com/algonius/algonius-browser/master/install-mcp-host.sh | bash

Windows (PowerShell):

iwr -useb https://raw.githubusercontent.com/algonius/algonius-browser/master/install-mcp-host.ps1 | iex

Manual Installation:

### Download latest release
wget https://github.com/algonius/algonius-browser/releases/latest/download/mcp-host-linux-x86_64.tar.gz

### Extract and install
tar -xzf mcp-host-linux-x86_64.tar.gz
cd mcp-host-linux-x86_64
./install.sh

3. Verify Installation

### Test the MCP host installation
mcp-host-go --version

### The MCP host will be automatically started when needed by the Chrome extension
### You should see the extension icon in your Chrome toolbar

Success: Both components are now installed! The Chrome extension will automatically communicate with the MCP Host when browser automation is requested.

🔧 Integration Examples

Using with AI Assistants

Once installed, AI systems can use the browser automation tools and resources through the MCP protocol:

Tool Usage:

{
  "method": "tools/call",
  "params": {
    "name": "navigate_to",
    "arguments": {
      "url": "https://example.com",
      "timeout": 30000
    }
  }
}

Resource Access:

{
  "method": "resources/read",
  "params": {
    "uri": "browser://current/state"
  }
}

Common Workflows

Web Scraping:

  1. navigate_to → Navigate to target site
  2. Read browser://dom/state → Get page overview
  3. get_dom_extra_elements → Get specific elements with pagination
  4. click_element → Interact with elements
  5. Read browser://dom/state → Extract updated content

Form Automation:

  1. navigate_to → Go to form page
  2. Read browser://dom/state → Identify form elements
  3. set_value → Fill form fields
  4. click_element → Submit form
  5. Read browser://current/state → Verify completion

Multi-Tab Management:

  1. Read browser://current/state → Check current tabs
  2. manage_tabs → Create/switch tabs
  3. navigate_to → Load content in each tab
  4. Read browser://current/state → Monitor all tab states

Page Navigation with Scrolling:

  1. navigate_to → Go to target page
  2. Read browser://dom/state → Get initial page state
  3. scroll_page → Scroll to load more content
  4. get_dom_extra_elements → Extract newly loaded elements

🏗️ Architecture

External AI System
       ↓ (MCP Protocol)
   MCP Host (Go)
       ↓ (Native Messaging)
Chrome Extension
       ↓ (Chrome APIs)
    Browser Tabs

Components

  • MCP Host: Go-based native messaging host that implements MCP protocol
  • Chrome Extension: Background service worker with tool handlers
  • Content Scripts: DOM interaction and data extraction utilities
  • Integration Tests: Comprehensive test suite for all tools

🧪 Development

Build from Source

Prerequisites:

  • Node.js 22.12.0+
  • pnpm 9.15.1+
  • Go 1.21+ (for MCP host)

Build Extension:

pnpm install
pnpm build

Build MCP Host:

cd mcp-host-go
make build

Run Tests:

### Extension tests
pnpm test

### MCP host tests  
cd mcp-host-go
make test

Development Mode

### Extension development
pnpm dev

### MCP host development
cd mcp-host-go
make dev

📊 Supported Platforms

MCP Host:

  • Linux x86_64
  • macOS Intel (x86_64) and Apple Silicon (arm64)
  • Windows x86_64

Chrome Extension:

  • Chrome/Chromium 88+
  • Microsoft Edge 88+

📚 Documentation

Detailed documentation available in the docs/ directory:

🤝 Contributing

We welcome contributions! Check out our CONTRIBUTING.md for guidelines.

Ways to contribute:

  • Report bugs and feature requests
  • Submit pull requests for improvements
  • Add integration tests
  • Improve documentation
  • Share usage examples

🔒 Security

For security vulnerabilities, please create a GitHub Security Advisory rather than opening a public issue.

💬 Community

📄 License

This project is licensed under the Apache License 2.0 - see the LICENSE file for details.

👏 Acknowledgments

Built with these excellent open-source projects:

Made with ❤️ by the Algonius Browser Team

Give us a star 🌟 if this project helps you build better browser automation!

サーバー設定

{
  "mcpServers": {
    "algonius-browser": {
      "command": "start",
      "autoApprove": [
        "click_element",
        "get_dom_extra_elements",
        "manage_tabs",
        "scroll_page",
        "type_value",
        "navigate_to"
      ],
      "disabled": false,
      "timeout": 3600,
      "url": "http://127.0.0.1:9333/sse",
      "type": "sse"
    }
  }
}

プロジェクト情報

著者
algonius
作成日
Jun 25, 2025
評価
4
言語
TypeScript
タグ
-