Browserbase Mcp 伺服器
允許大型語言模型(LLMs)使用Browserbase和Stagehand控制瀏覽器
概覽
MCP Server Browserbase 是什麼?
MCP Server Browserbase 是一個創新的工具,旨在讓大型語言模型(LLMs)無縫控制網頁瀏覽器。這個項目的目標是增強 AI 與網頁應用程序之間的互動,使開發人員更容易將先進功能整合到他們的應用程序中。通過利用 Browserbase 和 Stagehand 的能力,用戶可以創建更具動態和響應性的網頁體驗。
MCP Server Browserbase 的特點
- LLM 整合:MCP Server Browserbase 的主要特點是能夠與大型語言模型整合,使其能在網頁瀏覽器中執行任務。
- 用戶友好的界面:該工具提供直觀的界面,簡化了通過 AI 控制網頁瀏覽器的過程。
- 開源:作為一個公共庫,開發人員可以為該項目做出貢獻,確保持續改進和創新。
- 跨平台兼容性:MCP Server Browserbase 設計為可在各種平台上運行,使其能夠接觸到更廣泛的受眾。
- 實時互動:該工具支持實時互動,允許 AI 立即提供反饋和回應。
如何使用 MCP Server Browserbase
- 安裝:首先從 GitHub 克隆該庫。您可以使用以下命令:
git clone https://github.com/browserbase/mcp-server-browserbase.git
- 設置:按照庫的 README 文件中提供的設置說明配置環境和依賴項。
- 整合:將 MCP Server Browserbase 與您現有的應用程序整合,或使用它來構建需要通過 AI 控制瀏覽器的新應用程序。
- 測試:運行測試以確保整合順利,並且 LLM 能夠有效控制瀏覽器。
- 貢獻:如果您有改進或新功能的想法,考慮通過在 GitHub 上提交拉取請求來為該項目做出貢獻。
常見問題解答
MCP Server Browserbase 支持哪些編程語言?
MCP Server Browserbase 主要支持 JavaScript 和 Python,使其對熟悉這些語言的開發人員來說非常靈活。
MCP Server Browserbase 是免費使用的嗎?
是的,MCP Server Browserbase 是一個開源項目,根據 Apache-2.0 許可證進行授權,允許免費使用和修改。
我可以為該項目做出貢獻嗎?
當然可以!歡迎貢獻。您可以報告問題、建議功能或通過在 GitHub 上提交拉取請求來提交代碼改進。
MCP Server Browserbase 如何增強網頁應用程序?
通過使 LLM 能夠控制瀏覽器,MCP Server Browserbase 允許更具互動性和智能的網頁應用程序,能夠有效地響應用戶輸入並自動化任務。
我可以在哪裡找到有關 MCP Server Browserbase 的更多信息?
有關更多詳細信息,您可以訪問 官方 GitHub 倉庫,在那裡您可以找到文檔、安裝指南和社區討論。
詳細
Browserbase MCP Server
The Model Context Protocol (MCP) is an open protocol that enables seamless integration between LLM applications and external data sources and tools. Whether you’re building an AI-powered IDE, enhancing a chat interface, or creating custom AI workflows, MCP provides a standardized way to connect LLMs with the context they need.
This server provides cloud browser automation capabilities using Browserbase and Stagehand. This server enables LLMs to interact with web pages, take screenshots, and execute JavaScript in a cloud browser environment.
To learn to get started with Browserbase, check out Browserbase MCP or Stagehand MCP.
Getting Started with available MCPs
🌐 Browserbase MCP - Located in browserbase/
| Feature | Description | | | -- | | Browser Automation | Control and orchestrate cloud browsers | | Data Extraction | Extract structured data from any webpage | | Console Monitoring | Track and analyze browser console logs | | Screenshots | Capture full-page and element screenshots | | Web Interaction | Navigate, click, and fill forms with ease |
🤘 Stagehand MCP - Located in stagehand/
Feature | Description |
---|---|
Atomic Instructions | Execute precise actions like act("click the login button") or extract("find the red shoes") |
Model Flexibility | Supports multiple models, including OpenAI's GPT-4 and Anthropic's Claude-3.7 Sonnet |
Modular Design | Easily integrate new models with minimal changes |
Vision Support | Use annotated screenshots for complex DOMs |
Open Source | Contribute to the project and join the Slack community for support |
Alternative Installation Methods
Credits
Huge thanks and shoutout to the Playwright team for their contributions to the framework, and their work on the Playwright MCP Server
伺服器配置
{
"mcpServers": {
"browserbase": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--browserbase--mcp-server-browserbase--browserbase",
"node cli.js"
],
"env": {
"BROWSERBASE_API_KEY": "browserbase-api-key",
"BROWSERBASE_PROJECT_ID": "browserbase-project-id"
}
}
}
}