• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

pandas sparse

date: 2025-02-08 excerpt: pandas sparse

tag: pandas


pandas sparse

概要

  • pandasのデータ形式であってもsparse matrixを扱うことができる
  • 疎行列に変換の際、pd.NA などは自動で値が埋まることはない

サンプルコード

import pandas as pd

# dense な DataFrame の作成
dense_df = pd.DataFrame({
    "A": [0, 0, 1, 0],
    "B": [0.0, 0.0, 2.5, 0.0]
})

# 各列を sparse なデータ型に変換
sparse_df = dense_df.astype({
    "A": pd.SparseDtype("int", fill_value=0),
    "B": pd.SparseDtype("float", fill_value=0.0)
})
sparse_df

COO(Coordinate)形式に変換

X = sparse_df.sparse.to_coo()
X


pandas Share Tweet