我有一个汇总在两个日期之间的数据集,我想通过将总数与这些日期之间的天数相除来每日对其进行解聚.
作为样本
StoreID Date_Start Date_End Total_Number_of_sales78 12/04/2015 17/05/2015 7908980 12/04/2015 17/05/2015 79089
我想要的数据集是:
StoreID Date Number_Sales 78 12/04/2015 79089/38(as there are 38 days in between)78 13/04/2015 79089/38(as there are 38 days in between) 78 14/04/2015 79089/38(as there are 38 days in between)78 ...78 17/05/2015 79089/38(as there are 38 days in between)
任何帮助都会有用.
谢谢最佳答案我不确定这是否正是你想要的,但你可以试试这个(我添加了另一个想象的行):
import datetime as dtdf = pd.DataFrame({'date_start':['12/04/2015','17/05/2015'],'date_end':['18/05/2015','10/06/2015'],'sales':[79089,1000]})df['date_start'] = pd.to_datetime(df['date_start'],format='%d/%m/%Y')df['date_end'] = pd.to_datetime(df['date_end'],format='%d/%m/%Y')df['days_diff'] = (df['date_end'] - df['date_start']).dt.daysmaster_df = pd.DataFrame(None)for row in df.index: new_df = pd.DataFrame(index=pd.date_range(start=df['date_start'].iloc[row],end = df['date_end'].iloc[row],freq='d')) new_df['number_sales'] = df['sales'].iloc[row] / df['days_diff'].iloc[row] master_df = pd.concat([master_df,new_df],axis=0)
首先将字符串日期转换为datetime对象(以便您可以计算范围之间的天数),然后根据日期范围创建新索引,并划分销售额.循环将数据帧的每一行粘贴到“扩展”数据帧中,然后将它们连接成一个主数据帧. 总结
以上是内存溢出为你收集整理的Python解聚全部内容,希望文章能够帮你解决Python解聚所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)