Visualizador de Conjunto de Dados Servidor Mcp
Servidor MCP para visualizador de conjuntos de dados Hugging Face
Visão geral
O que é o Visualizador de Conjuntos de Dados?
O ### Visualizador de Conjuntos de Dados é uma ferramenta poderosa projetada para facilitar a exploração e visualização de conjuntos de dados. Ele permite que os usuários naveguem facilmente por grandes conjuntos de dados, oferecendo uma interface amigável que melhora a acessibilidade e compreensão dos dados. Esta ferramenta é particularmente útil para pesquisadores, cientistas de dados e qualquer pessoa interessada em analisar dados sem a necessidade de amplo conhecimento em programação.
Recursos do Visualizador de Conjuntos de Dados
- Interface Amigável: O Visualizador de Conjuntos de Dados oferece um design intuitivo que simplifica o processo de exploração de dados.
- Visualização de Dados: Os usuários podem visualizar dados em vários formatos, facilitando a identificação de tendências e padrões.
- Suporte a Múltiplos Formatos de Dados: A ferramenta suporta vários formatos de dados, permitindo que os usuários trabalhem com CSV, JSON e mais.
- Exploração Interativa de Dados: Os usuários podem interagir diretamente com os dados, filtrando e classificando para encontrar informações específicas rapidamente.
- Integração com Hugging Face: O Visualizador de Conjuntos de Dados está integrado com o Hugging Face, proporcionando acesso a uma ampla gama de conjuntos de dados para projetos de aprendizado de máquina e IA.
Como Usar o Visualizador de Conjuntos de Dados
- Acesse a Ferramenta: Navegue até o Visualizador de Conjuntos de Dados no GitHub ou através da plataforma Hugging Face.
- Carregue Seu Conjunto de Dados: Você pode carregar seu conjunto de dados em um formato suportado ou selecionar entre os conjuntos de dados existentes disponíveis na ferramenta.
- Explore os Dados: Use os recursos interativos para filtrar, classificar e visualizar os dados conforme necessário.
- Analise os Resultados: Aproveite as ferramentas de visualização para analisar tendências e insights do seu conjunto de dados.
- Exporte Suas Descobertas: Depois de concluir sua análise, você pode exportar os resultados para uso posterior ou relatórios.
Perguntas Frequentes
Que tipos de conjuntos de dados posso usar com o Visualizador de Conjuntos de Dados?
Você pode usar vários tipos de conjuntos de dados, incluindo CSV, JSON e outros formatos comuns. A ferramenta é projetada para lidar com grandes conjuntos de dados de forma eficiente.
Há algum custo associado ao uso do Visualizador de Conjuntos de Dados?
Não, o Visualizador de Conjuntos de Dados é uma ferramenta pública disponível gratuitamente. Você pode acessá-la sem qualquer assinatura ou pagamento.
Posso colaborar com outras pessoas usando o Visualizador de Conjuntos de Dados?
Sim, o Visualizador de Conjuntos de Dados permite recursos de colaboração, possibilitando que vários usuários explorem e analisem conjuntos de dados juntos.
Como posso relatar problemas ou solicitar recursos para o Visualizador de Conjuntos de Dados?
Você pode relatar problemas ou solicitar novos recursos visitando o repositório do GitHub para o Visualizador de Conjuntos de Dados e enviando um problema na seção de Problemas.
Existe documentação disponível para o Visualizador de Conjuntos de Dados?
Sim, uma documentação abrangente está disponível no repositório do GitHub, fornecendo orientações sobre como usar a ferramenta de forma eficaz.
Detalhe
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
Configuração do Servidor
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}