Text-to-SQL Spiderについて
概要
- Text-to-SQL Spiderは、自然言語の質問文からSQL文を生成するタスク
- コンペティション形式になっており、Spiderデータセットを用いてモデルの性能を定量化している
- ソリューションも公開されており、モデルの構築に役立つ
Spiderデータセット
- Spiderにて公開されている
- Google Driveにてダウンロード可能
データセットの構成
train.json: 学習用データdev.json: 検証用データtables.json: テーブル情報
データセットのフォーマット
train.jsonとdev.jsonは以下のようなフォーマットになっているquestion: 質問文sql: SQL文db_id: テーブル情報のID