Python笔记：数据排名_python

本文简要展示一下，怎么在pandas中用rank()函数进行数据排名。原理不作赘述，具体用法请看示例：

01. 构造数据集

import pandas as pd

df = pd.DataFrame({
    "序号":range(1,11),
    "商品":["苹果","雪梨","荔枝","龙眼","西瓜","菠萝","黄皮","草莓","橙子","山竹"],
    "销量":[10,20,20,30,30,30,40,50,60,100]
})

df

02. 算术均值排名

# 相同的值排名相同,但排名采用算术均值.占位
df["排名"] = df["销量"].rank(method = "average")
df

03. 先出现的值排名优先

# 先出现的值排名次序优先
df["排名"] = df["销量"].rank(method = "first")
df

04. 对同一个组使用最大的排名

# 对同一个组使用最大的排名
df["排名"] = df["销量"].rank(method = "max")
df

05. 对同一个组使用最小的排名

# 对同一个组使用最小的排名
df["排名"] = df["销量"].rank(method = "min")
df

06. 同组同排名，组间递增1

# 相同的组相同的排名，但是组间递增1
df["排名"] = df["销量"].rank(method = "dense")
df

07. 按降序排名

# 按降序排名
df["排名"] = df["销量"].rank(ascending = False)
df

08. 按升序排名

# 按升序排名
df["排名"] = df["销量"].rank(ascending = True)
df

创作不易，分享难得。如果觉得本文对您有帮助，请不吝动动宝贵的手指帮忙点个赞以示支持一下。后期，我会用心分享更多更精彩、实用的干货给大家，以期共同进步。感谢阅读！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/langs/715116.html

Python笔记：数据排名

发表评论

评论列表（0条）