• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

pandas rank

date: 2021-01-03 excerpt: pandas rankのチートシート

tag: pythonpandasチートシート


pandas rankのチートシート

概要

  • ランク関数
    • method
      • average, min, max, first, denseなどランク方法を指定
    • na_option
      • NaNをどうするか
      • keep; そのまま無視する
    • pct
      • 0.0 ~ 1.0に圧縮する
    • ascending
      • Trueで昇順、Falseで降順

methodによる挙動の違い

dense

pd.Series([1,2,2,3]).rank(method="dense")
0    1.0
1    2.0
2    2.0
3    3.0

average

pd.Series([1,2,2,3]).rank(method="average")
0    1.0
1    2.5
2    2.5
3    4.0

first

  • 同じ値であれば最初に出現したレコードが高い順位になる
  • トータルで100%にしたいときなどがユースケースになる
pd.Series([1,2,2,3]).rank(method="first")
0    1.0
1    2.0
2    3.0
3    4.0

pct(percentile)オプション

  • 0.0 ~ 1.0に圧縮するオプション
  • method="first"と組み合わせると、0.0 ~ 1.0に埋め込める

参考

  • pandas.DataFrame.rank¶


pythonpandasチートシート Share Tweet