duckdbの使い方
概要
- sqliteとよく比較される組み込み向けのデータベース
- sqliteが
OLTP
であるのに対してduckdbは分析指向であるOLAP
である - pandasのデータフレームを登録することができ、pandasのデータフレームをSQLで操作することができうr
インストール
$ python3 -m pip install duckdb
具体例
import pandas as pd
import duckdb
data = {'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}
df = pd.DataFrame(data)
con = duckdb.connect(database=':memory:', read_only=False)
con.register('my_df', df)
query = "SELECT * FROM my_df WHERE A > 1"
result = con.execute(query).fetchdf()
result
A | B | C | |
---|---|---|---|
0 | 2 | 5 | 8 |
1 | 3 | 6 | 9 |