pandas rankのチートシート
概要
- ランク関数
methodaverage,min,max,first,denseなどランク方法を指定
na_option- NaNをどうするか
keep; そのまま無視する
pct0.0 ~ 1.0に圧縮する
ascendingTrueで昇順、Falseで降順
methodによる挙動の違い
dense
pd.Series([1,2,2,3]).rank(method="dense")
0 1.0
1 2.0
2 2.0
3 3.0
average
pd.Series([1,2,2,3]).rank(method="average")
0 1.0
1 2.5
2 2.5
3 4.0
first
- 同じ値であれば最初に出現したレコードが高い順位になる
- トータルで100%にしたいときなどがユースケースになる
pd.Series([1,2,2,3]).rank(method="first")
0 1.0
1 2.0
2 3.0
3 4.0
pct(percentile)オプション
0.0 ~ 1.0に圧縮するオプションmethod="first"と組み合わせると、0.0 ~ 1.0に埋め込める