数据集查看器 Mcp 服务器
概览
什么是数据集查看器?
数据集查看器是一个强大的工具,旨在促进数据集的探索和可视化。它允许用户轻松浏览大型数据集,提供一个用户友好的界面,增强数据的可访问性和理解。这款工具对于研究人员、数据科学家以及任何对分析数据感兴趣的人来说,尤其有用,无需广泛的编程知识。
数据集查看器的特点
- 用户友好的界面:数据集查看器提供直观的设计,简化了数据探索的过程。
- 数据可视化:用户可以以多种格式可视化数据,使识别趋势和模式变得更加容易。
- 支持多种数据格式:该工具支持多种数据格式,允许用户处理CSV、JSON等。
- 互动数据探索:用户可以直接与数据互动,快速过滤和排序以找到特定信息。
- 与Hugging Face的集成:数据集查看器与Hugging Face集成,提供访问广泛的数据集,用于机器学习和人工智能项目。
如何使用数据集查看器
- 访问工具:在GitHub或通过Hugging Face平台导航到数据集查看器。
- 上传您的数据集:您可以以支持的格式上传数据集,或从工具中选择现有的数据集。
- 探索数据:使用互动功能根据需要过滤、排序和可视化数据。
- 分析结果:利用可视化工具分析数据集中的趋势和见解。
- 导出您的发现:完成分析后,您可以导出结果以供进一步使用或报告。
常见问题解答
我可以使用哪些类型的数据集与数据集查看器?
您可以使用各种类型的数据集,包括CSV、JSON和其他常见格式。该工具设计用于高效处理大型数据集。
使用数据集查看器是否需要费用?
不,数据集查看器是一个公共工具,免费提供。您可以无需任何订阅或付款即可访问。
我可以与他人合作使用数据集查看器吗?
可以,数据集查看器允许协作功能,使多个用户能够共同探索和分析数据集。
我如何报告数据集查看器的问题或请求功能?
您可以通过访问数据集查看器的GitHub仓库,在问题部分提交问题来报告问题或请求新功能。
数据集查看器是否有可用的文档?
是的,GitHub仓库上提供了全面的文档,指导如何有效使用该工具。
详情
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
Server配置
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}