データセットビューア Mcp サーバー
概要
データセットビューワーとは?
データセットビューワーは、データセットの探索と視覚化を促進するために設計された強力なツールです。ユーザーは、大規模なデータセットを簡単にナビゲートできるようになっており、データのアクセス性と理解を向上させるユーザーフレンドリーなインターフェースを提供します。このツールは、研究者、データサイエンティスト、そして広範なプログラミング知識なしでデータを分析したい人々に特に役立ちます。
データセットビューワーの特徴
- ユーザーフレンドリーなインターフェース:データセットビューワーは、データ探索のプロセスを簡素化する直感的なデザインを提供します。
- データ視覚化:ユーザーはさまざまな形式でデータを視覚化でき、トレンドやパターンを特定しやすくなります。
- 複数のデータ形式のサポート:このツールはさまざまなデータ形式をサポートしており、ユーザーはCSV、JSONなどで作業できます。
- インタラクティブなデータ探索:ユーザーはデータと直接対話し、特定の情報を迅速に見つけるためにフィルタリングやソートができます。
- Hugging Faceとの統合:データセットビューワーはHugging Faceと統合されており、機械学習やAIプロジェクトのための幅広いデータセットにアクセスできます。
データセットビューワーの使い方
- ツールにアクセスする:GitHubまたはHugging Faceプラットフォームでデータセットビューワーに移動します。
- データセットをアップロードする:サポートされている形式でデータセットをアップロードするか、ツール内の既存のデータセットから選択できます。
- データを探索する:インタラクティブな機能を使用して、必要に応じてデータをフィルタリング、ソート、視覚化します。
- 結果を分析する:視覚化ツールを活用して、データセットからトレンドや洞察を分析します。
- 結果をエクスポートする:分析が完了したら、結果をエクスポートしてさらなる使用や報告に利用できます。
よくある質問
データセットビューワーで使用できるデータセットの種類は何ですか?
CSV、JSON、その他の一般的な形式を含むさまざまなタイプのデータセットを使用できます。このツールは、大規模なデータセットを効率的に処理するように設計されています。
データセットビューワーの使用に費用はかかりますか?
いいえ、データセットビューワーは無料で利用できる公共のツールです。サブスクリプションや支払いなしでアクセスできます。
データセットビューワーを使用して他の人と共同作業できますか?
はい、データセットビューワーは共同作業機能を提供しており、複数のユーザーが一緒にデータセットを探索し分析できます。
データセットビューワーに関する問題を報告したり、機能をリクエストするにはどうすればよいですか?
データセットビューワーのGitHubリポジトリを訪れ、Issuesセクションで問題を報告したり、新しい機能をリクエストできます。
データセットビューワーのドキュメントはありますか?
はい、データセットビューワーのGitHubリポジトリには、ツールを効果的に使用するためのガイダンスを提供する包括的なドキュメントがあります。
詳細
Dataset Viewer MCP Server
An MCP server for interacting with the Hugging Face Dataset Viewer API, providing capabilities to browse and analyze datasets hosted on the Hugging Face Hub.
Features
Resources
- Uses
dataset://
URI scheme for accessing Hugging Face datasets - Supports dataset configurations and splits
- Provides paginated access to dataset contents
- Handles authentication for private datasets
- Supports searching and filtering dataset contents
- Provides dataset statistics and analysis
Tools
The server provides the following tools:
-
validate
- Check if a dataset exists and is accessible
- Parameters:
dataset
: Dataset identifier (e.g. 'stanfordnlp/imdb')auth_token
(optional): For private datasets
-
get_info
- Get detailed information about a dataset
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
-
get_rows
- Get paginated contents of a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_first_rows
- Get first rows from a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
get_statistics
- Get statistics about a dataset split
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split nameauth_token
(optional): For private datasets
-
search_dataset
- Search for text within a dataset
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namequery
: Text to search forauth_token
(optional): For private datasets
-
filter
- Filter rows using SQL-like conditions
- Parameters:
dataset
: Dataset identifierconfig
: Configuration namesplit
: Split namewhere
: SQL WHERE clause (e.g. "score > 0.5")orderby
(optional): SQL ORDER BY clausepage
(optional): Page number (0-based)auth_token
(optional): For private datasets
-
get_parquet
- Download entire dataset in Parquet format
- Parameters:
dataset
: Dataset identifierauth_token
(optional): For private datasets
Installation
Prerequisites
- Python 3.12 or higher
- uv - Fast Python package installer and resolver
Setup
- Clone the repository:
git clone https://github.com/privetin/dataset-viewer.git
cd dataset-viewer
- Create a virtual environment and install:
### Create virtual environment
uv venv
### Activate virtual environment
### On Unix:
source .venv/bin/activate
### On Windows:
.venv\Scripts\activate
### Install in development mode
uv add -e .
Configuration
Environment Variables
HUGGINGFACE_TOKEN
: Your Hugging Face API token for accessing private datasets
Claude Desktop Integration
Add the following to your Claude Desktop config file:
On Windows: %APPDATA%\Claude\claude_desktop_config.json
On MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
{
"mcpServers": {
"dataset-viewer": {
"command": "uv",
"args": [
"--directory",
"parent_to_repo/dataset-viewer",
"run",
"dataset-viewer"
]
}
}
}
License
MIT License - see LICENSE for details
サーバー設定
{
"mcpServers": {
"dataset-viewer": {
"command": "docker",
"args": [
"run",
"-i",
"--rm",
"ghcr.io/metorial/mcp-container--privetin--dataset-viewer--dataset-viewer",
"dataset-viewer"
],
"env": {}
}
}
}