python – 熊猫:按索引值分组,然后计算分位数?

python – 熊猫:按索引值分组,然后计算分位数?,第1张

概述我有一个在月份列上编入索引的DataFrame(使用df = df.set_index(‘month’)设置,如果相关的话): org_code ratio_cost month2010-08-01 1847 8.685939 2010-08-01 1848 7.883951 2010-08-01 1849 6.798465 我有一个在月份列上编入索引的DataFrame(使用df = df.set_index(‘month’)设置,如果相关的话):
org_code  ratio_cost   month2010-08-01   1847      8.685939     2010-08-01   1848      7.883951     2010-08-01   1849      6.798465     2010-08-01   1850      7.352603     2010-09-01   1847      8.778501

我想添加一个名为“分位数”的新列,它将根据该月份的ratio_cost值为每行分配一个分位数值.

所以上面的例子可能如下所示:

org_code  ratio_cost   quantilemonth2010-08-01   1847      8.685939     100 2010-08-01   1848      7.883951     66.6 2010-08-01   1849      6.798465     0  2010-08-01   1850      7.352603     33.32010-09-01   1847      8.778501     100

我怎样才能做到这一点?我试过这个:

df['quantile'] = df.groupby('month')['ratio_cost'].rank(pct=True)

但我得到KeyError:’月’.

更新:我可以重现这个BUG.

这是我的CSV文件:http://pastebin.com/raw/6xbjvEL0

这是重现错误的代码:

df = pd.read_csv('temp.csv')df.month = pd.to_datetime(df.month,unit='s')df = df.set_index('month')df['percentile'] = df.groupby(df.index)['ratio_cost'].rank(pct=True)print df['percentile']

我在OSX上使用Pandas 0.17.1.

解决方法 你必须在 rank之前 sort_index
import pandas as pddf = pd.read_csv('http://pastebin.com/raw/6xbjvEL0')df.month = pd.to_datetime(df.month,unit='s')df = df.set_index('month')df = df.sort_index()df['percentile'] = df.groupby(df.index)['ratio_cost'].rank(pct=True)print df['percentile'].head()month2010-08-01    0.25002010-08-01    0.68752010-08-01    0.62502010-08-01    0.93752010-08-01    0.7500name: percentile,dtype: float64
总结

以上是内存溢出为你收集整理的python – 熊猫:按索引值分组,然后计算分位数?全部内容,希望文章能够帮你解决python – 熊猫:按索引值分组,然后计算分位数?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1207486.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-04
下一篇 2022-06-04

发表评论

登录后才能评论

评论列表(0条)

保存