python – Groupby比Pandas更慢

python – Groupby比Pandas更慢,第1张

概述我将下表作为熊猫数据帧.我需要计算所有零件编号,其中净销售额大于给定零件的推荐价格. 输入:above_master Short Number Net Sales Part Number Recommended Price0 MU2146 413.25 MU2146 385.9491551 MU2146 433.12 我将下表作为熊猫数据帧.我需要计算所有零件编号,其中净销售额大于给定零件的推荐价格.

输入:above_master

Short Number  Net Sales    Part Number   Recommended Price0       MU2146     413.25      MU2146      385.9491551       MU2146     433.12      MU2146      385.9491552       MU2146     498.12      MU2146      385.9491553       MU1609     146.07      MU1609      149.1389784       MU1609     246.17      MU1609      149.138978

要求的输出

Part Number countMU2146       3 MU1609       1

使用的代码

for number in range(len(above_master.index)):    cal_s1 = above_master[above_master['Net Sales'] > above_master.iloc[number]['Recommended Price'] ].groupby('Part Number')['Recommended Price'].count()    cal_s2 = cal_s1.to_frame().reset_index()    cal_s3 = cal_s2.loc[cal_s2['Part Number'] == above_master.iloc[number]['Part Number']]    cal_s4 = cal_s4.append(cal_s3,ignore_index=True)

这很好,但需要很长时间.

解决方法 使用大小的loc:

df.loc[df['Recommended Price'].lt(df['Net Sales'])].groupby('Part Number').size()
Part NumberMU1609    1MU2146    3dtype: int64
总结

以上是内存溢出为你收集整理的python – Groupby比Pandas更慢全部内容,希望文章能够帮你解决python – Groupby比Pandas更慢所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/1192134.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-03
下一篇 2022-06-03

发表评论

登录后才能评论

评论列表(0条)

保存