KEY PROD ParaMETER Y/N1 AAA ParaM1 Y1 AAA ParaM2 N1 AAA ParaM3 N2 AAA ParaM1 N2 AAA ParaM2 Y2 AAA ParaM3 Y3 CCC ParaM1 Y3 CCC ParaM2 Y3 CCC ParaM3 Y
我有兴趣通过PROD和ParaMETER列汇总Y / N列值并获得以下输出:
PROD ParaM Y N AAA ParaM1 1 1 AAA ParaM2 1 1 AAA ParaM3 1 1 CCC ParaM1 1 0 CCC ParaM2 1 0 CCC ParaM3 1 0
而Y和N值是来自原始数据帧的Y / N列值的计数.
解决方法 您可以通过创建值为1的附加列来使用pivot_table
,因为它们无关紧要(您只计算它们) df['Y/Ncount'] = 1df = df.pivot_table(index=['PROD','ParaMETER'],columns=['Y/N'],values=['Y/Ncount'],aggfunc=sum,fill_value=0)df.columns = [col for col in df.columns.get_level_values(1)]df.reset_index()
在这种情况下使用的最简单 *** 作是crosstab
,它将产生Y / N列中存在的值的频率计数:
pd.crosstab([df['PROD'],df['ParaMETER']],df['Y/N'])总结
以上是内存溢出为你收集整理的python pandas总结名义变量(计数)全部内容,希望文章能够帮你解决python pandas总结名义变量(计数)所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)