Text-to-SQL Spiderについて
概要
- Text-to-SQL Spiderは、自然言語の質問文からSQL文を生成するタスク
- コンペティション形式になっており、Spiderデータセットを用いてモデルの性能を定量化している
- ソリューションも公開されており、モデルの構築に役立つ
Spiderデータセット
- Spiderにて公開されている
- Google Driveにてダウンロード可能
データセットの構成
train.json
: 学習用データdev.json
: 検証用データtables.json
: テーブル情報
データセットのフォーマット
train.json
とdev.json
は以下のようなフォーマットになっているquestion
: 質問文sql
: SQL文db_id
: テーブル情報のID