Aperçu du jeu de données Serveur Mcp
Serveur MCP pour le visualiseur de dataset Hugging Face
Aperçu
Qu'est-ce que le Dataset Viewer ?
Le ### Dataset Viewer est un outil puissant conçu pour faciliter l'exploration et la visualisation des ensembles de données. Il permet aux utilisateurs de naviguer facilement à travers de grands ensembles de données, offrant une interface conviviale qui améliore l'accessibilité et la compréhension des données. Cet outil est particulièrement utile pour les chercheurs, les scientifiques des données et toute personne intéressée par l'analyse des données sans avoir besoin de connaissances approfondies en programmation.
Fonctionnalités du Dataset Viewer
- Interface conviviale : Le Dataset Viewer propose un design intuitif qui simplifie le processus d'exploration des données.
- Visualisation des données : Les utilisateurs peuvent visualiser les données sous différents formats, facilitant ainsi l'identification des tendances et des motifs.
- Support pour plusieurs formats de données : L'outil prend en charge divers formats de données, permettant aux utilisateurs de travailler avec des fichiers CSV, JSON, et plus encore.
- Exploration interactive des données : Les utilisateurs peuvent interagir directement avec les données, filtrant et triant pour trouver rapidement des informations spécifiques.
- Intégration avec Hugging Face : Le Dataset Viewer est intégré à Hugging Face, offrant un accès à une large gamme d'ensembles de données pour des projets d'apprentissage automatique et d'IA.
Comment utiliser le Dataset Viewer
- Accédez à l'outil : Naviguez vers le Dataset Viewer sur GitHub ou via la plateforme Hugging Face.
- Téléchargez votre ensemble de données : Vous pouvez télécharger votre ensemble de données dans un format pris en charge ou sélectionner parmi les ensembles de données existants disponibles dans l'outil.
- Explorez les données : Utilisez les fonctionnalités interactives pour filtrer, trier et visualiser les données selon vos besoins.
- Analysez les résultats : Profitez des outils de visualisation pour analyser les tendances et les insights de votre ensemble de données.
- Exportez vos résultats : Une fois votre analyse terminée, vous pouvez exporter les résultats pour une utilisation ultérieure ou pour des rapports.
Questions Fréquemment Posées
Quels types d'ensembles de données puis-je utiliser avec le Dataset Viewer ?
Vous pouvez utiliser divers types d'ensembles de données, y compris CSV, JSON et d'autres formats courants. L'outil est conçu pour gérer efficacement de grands ensembles de données.
Y a-t-il un coût associé à l'utilisation du Dataset Viewer ?
Non, le Dataset Viewer est un outil public disponible gratuitement. Vous pouvez y accéder sans abonnement ni paiement.
Puis-je collaborer avec d'autres en utilisant le Dataset Viewer ?
Oui, le Dataset Viewer permet des fonctionnalités de collaboration, permettant à plusieurs utilisateurs d'explorer et d'analyser des ensembles de données ensemble.
Comment signaler des problèmes ou demander des fonctionnalités pour le Dataset Viewer ?
Vous pouvez signaler des problèmes ou demander de nouvelles fonctionnalités en visitant le dépôt GitHub du Dataset Viewer et en soumettant un problème dans la section Issues.
Existe-t-il une documentation disponible pour le Dataset Viewer ?
Oui, une documentation complète est disponible sur le dépôt GitHub, fournissant des conseils sur la manière d'utiliser l'outil efficacement.
Détail
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
Configuration du serveur
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}