डेटासेट व्यूअर एमसीपी सर्वर
सारांश
Dataset Viewer क्या है?
Dataset Viewer एक शक्तिशाली उपकरण है जो डेटा सेटों के अन्वेषण और दृश्यता को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है। यह उपयोगकर्ताओं को बड़े डेटा सेटों के माध्यम से आसानी से नेविगेट करने की अनुमति देता है, एक उपयोगकर्ता-अनुकूल इंटरफ़ेस प्रदान करता है जो डेटा की पहुंच और समझ को बढ़ाता है। यह उपकरण विशेष रूप से शोधकर्ताओं, डेटा वैज्ञानिकों और किसी भी व्यक्ति के लिए उपयोगी है जो बिना व्यापक प्रोग्रामिंग ज्ञान के डेटा का विश्लेषण करना चाहता है।
Dataset Viewer की विशेषताएँ
- उपयोगकर्ता-अनुकूल इंटरफ़ेस: Dataset Viewer एक सहज डिज़ाइन प्रदान करता है जो डेटा अन्वेषण की प्रक्रिया को सरल बनाता है।
- डेटा दृश्यता: उपयोगकर्ता विभिन्न प्रारूपों में डेटा को दृश्यता में ला सकते हैं, जिससे प्रवृत्तियों और पैटर्नों की पहचान करना आसान हो जाता है।
- कई डेटा प्रारूपों का समर्थन: यह उपकरण विभिन्न डेटा प्रारूपों का समर्थन करता है, जिससे उपयोगकर्ता CSV, JSON और अधिक के साथ काम कर सकते हैं।
- इंटरैक्टिव डेटा अन्वेषण: उपयोगकर्ता सीधे डेटा के साथ इंटरैक्ट कर सकते हैं, विशेष जानकारी को जल्दी से खोजने के लिए फ़िल्टर और सॉर्ट कर सकते हैं।
- हगिंग फेस के साथ एकीकरण: Dataset Viewer हगिंग फेस के साथ एकीकृत है, जो मशीन लर्निंग और एआई परियोजनाओं के लिए विभिन्न डेटा सेटों तक पहुंच प्रदान करता है।
Dataset Viewer का उपयोग कैसे करें
- उपकरण तक पहुँचें: GitHub पर या हगिंग फेस प्लेटफ़ॉर्म के माध्यम से Dataset Viewer पर जाएँ।
- अपना डेटा सेट अपलोड करें: आप समर्थित प्रारूप में अपना डेटा सेट अपलोड कर सकते हैं या उपकरण में उपलब्ध मौजूदा डेटा सेटों में से चुन सकते हैं।
- डेटा का अन्वेषण करें: आवश्यकतानुसार डेटा को फ़िल्टर, सॉर्ट और दृश्यता में लाने के लिए इंटरैक्टिव सुविधाओं का उपयोग करें।
- परिणामों का विश्लेषण करें: अपने डेटा सेट से प्रवृत्तियों और अंतर्दृष्टियों का विश्लेषण करने के लिए दृश्यता उपकरणों का लाभ उठाएँ।
- अपने निष्कर्षों को निर्यात करें: एक बार जब आप अपने विश्लेषण को पूरा कर लें, तो आप आगे के उपयोग या रिपोर्टिंग के लिए परिणामों को निर्यात कर सकते हैं।
अक्सर पूछे जाने वाले प्रश्न
मैं Dataset Viewer के साथ किस प्रकार के डेटा सेट का उपयोग कर सकता हूँ?
आप विभिन्न प्रकार के डेटा सेट का उपयोग कर सकते हैं, जिसमें CSV, JSON और अन्य सामान्य प्रारूप शामिल हैं। यह उपकरण बड़े डेटा सेटों को कुशलता से संभालने के लिए डिज़ाइन किया गया है।
क्या Dataset Viewer का उपयोग करने के लिए कोई लागत है?
नहीं, Dataset Viewer एक सार्वजनिक उपकरण है जो मुफ्त में उपलब्ध है। आप इसे किसी भी सदस्यता या भुगतान के बिना एक्सेस कर सकते हैं।
क्या मैं Dataset Viewer का उपयोग करके दूसरों के साथ सहयोग कर सकता हूँ?
हाँ, Dataset Viewer सहयोगी सुविधाओं की अनुमति देता है, जिससे कई उपयोगकर्ता एक साथ डेटा सेटों का अन्वेषण और विश्लेषण कर सकते हैं।
मैं Dataset Viewer के लिए समस्याएँ कैसे रिपोर्ट करूँ या सुविधाएँ कैसे अनुरोध करूँ?
आप Dataset Viewer के GitHub रिपॉजिटरी पर जाकर समस्याएँ रिपोर्ट कर सकते हैं या नई सुविधाओं का अनुरोध कर सकते हैं और Issues अनुभाग में एक मुद्दा सबमिट कर सकते हैं।
क्या Dataset Viewer के लिए दस्तावेज़ उपलब्ध है?
हाँ, GitHub रिपॉजिटरी पर व्यापक दस्तावेज़ उपलब्ध है, जो उपकरण का प्रभावी ढंग से उपयोग करने के लिए मार्गदर्शन प्रदान करता है।
विवरण
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
सर्वर कॉन्फ़िगरेशन
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}