Visor de Conjuntos de Datos Servidor Mcp
Servidor MCP para el visor de conjuntos de datos de Hugging Face
Resumen
¿Qué es el Visor de Conjuntos de Datos?
El ### Visor de Conjuntos de Datos es una herramienta poderosa diseñada para facilitar la exploración y visualización de conjuntos de datos. Permite a los usuarios navegar fácilmente a través de grandes conjuntos de datos, proporcionando una interfaz amigable que mejora la accesibilidad y comprensión de los datos. Esta herramienta es particularmente útil para investigadores, científicos de datos y cualquier persona interesada en analizar datos sin necesidad de un amplio conocimiento de programación.
Características del Visor de Conjuntos de Datos
- Interfaz Amigable: El Visor de Conjuntos de Datos ofrece un diseño intuitivo que simplifica el proceso de exploración de datos.
- Visualización de Datos: Los usuarios pueden visualizar datos en varios formatos, lo que facilita la identificación de tendencias y patrones.
- Soporte para Múltiples Formatos de Datos: La herramienta admite varios formatos de datos, permitiendo a los usuarios trabajar con CSV, JSON y más.
- Exploración de Datos Interactiva: Los usuarios pueden interactuar directamente con los datos, filtrando y ordenando para encontrar información específica rápidamente.
- Integración con Hugging Face: El Visor de Conjuntos de Datos está integrado con Hugging Face, proporcionando acceso a una amplia gama de conjuntos de datos para proyectos de aprendizaje automático e IA.
Cómo Usar el Visor de Conjuntos de Datos
- Accede a la Herramienta: Navega al Visor de Conjuntos de Datos en GitHub o a través de la plataforma Hugging Face.
- Sube Tu Conjunto de Datos: Puedes subir tu conjunto de datos en un formato compatible o seleccionar de los conjuntos de datos existentes disponibles en la herramienta.
- Explora los Datos: Utiliza las características interactivas para filtrar, ordenar y visualizar los datos según sea necesario.
- Analiza los Resultados: Aprovecha las herramientas de visualización para analizar tendencias e información de tu conjunto de datos.
- Exporta Tus Hallazgos: Una vez que hayas completado tu análisis, puedes exportar los resultados para su uso posterior o informes.
Preguntas Frecuentes
¿Qué tipos de conjuntos de datos puedo usar con el Visor de Conjuntos de Datos?
Puedes usar varios tipos de conjuntos de datos, incluyendo CSV, JSON y otros formatos comunes. La herramienta está diseñada para manejar grandes conjuntos de datos de manera eficiente.
¿Hay algún costo asociado con el uso del Visor de Conjuntos de Datos?
No, el Visor de Conjuntos de Datos es una herramienta pública disponible de forma gratuita. Puedes acceder a ella sin ninguna suscripción o pago.
¿Puedo colaborar con otros usando el Visor de Conjuntos de Datos?
Sí, el Visor de Conjuntos de Datos permite características de colaboración, lo que permite a múltiples usuarios explorar y analizar conjuntos de datos juntos.
¿Cómo informo problemas o solicito características para el Visor de Conjuntos de Datos?
Puedes informar problemas o solicitar nuevas características visitando el repositorio de GitHub para el Visor de Conjuntos de Datos y enviando un problema en la sección de Problemas.
¿Hay documentación disponible para el Visor de Conjuntos de Datos?
Sí, hay documentación completa disponible en el repositorio de GitHub, proporcionando orientación sobre cómo usar la herramienta de manera efectiva.
Detalle
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
Configuración del Servidor
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}