開始使用 Firecrawl MCP 伺服器
Firecrawl MCP 伺服器 是一個方便的工具,如果你想從網路上抓取和提取數據,尤其是在使用遵循模型上下文協議(MCP)的工具時,如 Cursor 或 Claude。這個教程將引導你完成設置,並提供你快速啟動所需的一切。
它的功能
簡而言之,Firecrawl MCP 伺服器 讓你可以:
- 抓取和爬取網站
- 提取內容(文本、元數據、鏈接)
- 批量處理多個 URL
- 實時流式傳輸結果,使用 SSE
- 所有這些都內建重試邏輯和速率限制
如果你有一個應用程序、代理或腳本需要從網頁中獲取結構化數據,這個工具可以節省你的時間。
先決條件
- 安裝 Node.js 和 npm
- 有效的 Firecrawl API 密鑰 (從你的 Firecrawl 帳戶 獲取)
- 一個兼容 MCP 的環境,如 Cursor、Windsurf 或你自己的項目
步驟設置
- 基本配置
這是一個使用 Firecrawl 的 MCP 伺服器配置示例:
{
"mcpServers": {
"firecrawl-mcp": {
"command": "npx",
"args": [
"-y",
"firecrawl-mcp"
],
"env": {
"FIRECRAWL_API_KEY": "fc-af1b3ac1a0c2402485402fd0e34da158"
}
}
}
}
確保你替換上面的 API 密鑰為你自己的,如果你不是在測試的話。
你可以將這個插入到你的 MCP 配置文件中,無論你是使用 Cursor、Claude 還是其他兼容工具。
運行伺服器
要直接從終端運行它:
FIRECRAWL_API_KEY=fc-yourkeyhere npx -y firecrawl-mcp
這將啟動伺服器並暴露端點,讓你的代理可以使用 MCP 協議進行通信。
或者,如果你更喜歡全局安裝:
npm install -g firecrawl-mcp
firecrawl-mcp
使用案例
以下是一些人們常用 Firecrawl MCP 伺服器的常見用途:
- 從電子商務頁面抓取產品信息
- 從新聞或博客 URL 批量提取文本內容
- 收集元數據,如標題、標頭和鏈接以進行研究
- 在非結構化網絡數據上構建搜索層
提高結果的技巧
- 盡可能使用批量模式:這樣更快且更高效。
- 注意速率限制:如果你正在訪問很多 URL,請注意 Firecrawl 的速率政策。
- 如果你預期有大量輸出或想要實時流式傳輸結果,請使用 SSE 模式。
- 處理重試:Firecrawl 內建重試邏輯,但你仍然應該在你的端記錄和處理錯誤。
常見問題
我可以在本地運行這個嗎? 可以 — 在你的機器或雲端設置中都可以正常運行。
這僅限於 JavaScript 嗎? 不 — 只要你的平台可以發送 MCP 請求(通常是基於 HTTP 的),它就可以運行。Python、Node.js 等都可以。
我如何獲取 API 密鑰? 在 Firecrawl.dev 註冊,進入你的儀表板,然後生成一個。
價格如何? 查看他們的官方網站 — 這是基於使用量的,並提供免費層。
最後的說明
Firecrawl MCP 伺服器相當輕量但功能強大。一旦設置完成,你的代理或應用程序可以像任何其他 MCP 伺服器一樣查詢它。無論你是在為研究、競爭分析構建工具,還是只是需要結構化的網絡數據 — 這個工具都能提供很大幫助。
如果你想要特定端點或示例腳本的詳細說明,隨時告訴我 — 很高興分享。