>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
二、默认情况下,rank是通过“为各组分配一个平均排名”的方式破坏平级关系的
data_test['name_num_rank']=data_test.groupby('name')['number_1'].rank()
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则空值不进行排名,其他进行排名
- 当数据相等时,则以平均值排名;
三、method参数为average时,即默认值时。
data_test['rank_average']=data_test.groupby('name')['number_1'].rank(method='average')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则空值不进行排名,其他进行排名
- 当数据相等时,则以平均值排名;
四、method参数为min时。
data_test['rank_min']=data_test.groupby('name')['number_1'].rank(method='min')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则空值不进行排名,其他进行排名
- 当数据重复值时,则以最小值排名;
四、method参数为max时。
data_test['rank_max']=data_test.groupby('name')['number_1'].rank(method='max')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则空值不进行排序,其他进行排名
- 当数据重复值时,则以最大值排名;
五、method参数为first时。
data_test['rank_first']=data_test.groupby('name')['number_1'].rank(method='first')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则空值不进行排名,其他进行排名
- 当数据重复值时,则以大小排名;
五、method参数为first时,na_option:对na值的处理,默认采用keep策略,即保留为nan不参与排名;na_option=“top”时,则将最小等级分配给NaN值
data_test['rank_na']=data_test.groupby('name')['number_1'].rank(method='first',na_option='top')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则则将最小等级分配给NaN值
- 当数据重复值时,则以大小排名;
六、method参数为first时,na_option:对na值的处理,na_option=“bottom”时,则将最高等级分配给NaN值。
data_test['rank_na_bottom']=data_test.groupby('name')['number_1'].rank(method='first',na_option='bottom')
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则则将最高等级分配给NaN值
- 当数据重复值时,则以大小排名;
七、method参数为first时,na_option:对na值的处理,na_option=“bottom”时,则将最高等级分配给NaN值。 ascending:默认为True,排序规则为升序排列;当ascending=False时,排序规则为降序排列
data_test['rank_ascending']=data_test.groupby('name')['number_1'].rank(method='first',
na_option='bottom',
ascending=False)
data_test
>数据排名(rank()函数)" title="Pandas >>数据排名(rank()函数)" />
image.png
- 当数据正常时,则以大小排名
- 当数据中有空值时,则将最高等级分配给NaN值
- 当数据重复值时,则以大小排名;
好啦,就这些了~
文章均来自互联网如有不妥请联系作者删除QQ:314111741 地址:http://www.mqs.net/post/15466.html
添加新评论