• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

Text-to-SQL Spider

date: 2023-10-21 excerpt: Text-to-SQL Spiderについて

tag: NLPKaggleText-to-SQL


Text-to-SQL Spiderについて

概要

  • Text-to-SQL Spiderは、自然言語の質問文からSQL文を生成するタスク
  • コンペティション形式になっており、Spiderデータセットを用いてモデルの性能を定量化している
    • ソリューションも公開されており、モデルの構築に役立つ

Spiderデータセット

  • Spiderにて公開されている
    • Google Driveにてダウンロード可能

データセットの構成

  • train.json : 学習用データ
  • dev.json : 検証用データ
  • tables.json : テーブル情報

データセットのフォーマット

  • train.jsonとdev.jsonは以下のようなフォーマットになっている
    • question : 質問文
    • sql : SQL文
    • db_id : テーブル情報のID


NLPKaggleText-to-SQL Share Tweet