我想向熊猫数据框添加新索引

疯狂中文网论坛 • 2022-12-16 • 随笔 • 阅读 31

我想向熊猫数据框添加新索引

ngroup

：

对于新列
```
index
```
df[‘index’] = df.groupby(‘date’, sort=False).ngroup() + 1
print (df)
date price neg_vol pos_vol index
0 2017-10-17 01:00:00 51.88 11 4 1
1 2017-10-17 01:00:00 51.89 10 2 1
2 2017-10-17 01:00:00 51.90 16 27 1
3 2017-10-17 01:00:00 51.91 1 10 1
4 2017-10-17 01:05:00 51.87 12 0 2
5 2017-10-17 01:05:00 51.88 0 12 2
6 2017-10-17 01:10:00 51.87 8 0 3
7 2017-10-17 01:10:00 51.88 0 5 3
8 2017-10-17 01:15:00 51.87 12 0 4
9 2017-10-17 01:15:00 51.88 0 8 4
10 2017-10-17 01:20:00 51.87 6 0 5
用于新索引
df.index = df.groupby(‘date’, sort=False).ngroup() + 1
print (df)
date price neg_vol pos_vol
1 2017-10-17 01:00:00 51.88 11 4
1 2017-10-17 01:00:00 51.89 10 2
1 2017-10-17 01:00:00 51.90 16 27
1 2017-10-17 01:00:00 51.91 1 10
2 2017-10-17 01:05:00 51.87 12 0
2 2017-10-17 01:05:00 51.88 0 12
3 2017-10-17 01:10:00 51.87 8 0
3 2017-10-17 01:10:00 51.88 0 5
4 2017-10-17 01:15:00 51.87 12 0
4 2017-10-17 01:15:00 51.88 0 8
5 2017-10-17 01:20:00 51.87 6 0

另一个解决方案是

factorize

：

df['index'] = pd.factorize(df['date'])[0] + 1

df.index = pd.factorize(df['date'])[0] + 1

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zaji/5668309.html

索引熊猫用途用于解决方案

打赏

微信扫一扫

支付宝扫一扫

疯狂中文网论坛一级用户组

将两个Spark mllib管道连接在一起

上一篇 2022-12-16

您可以根据其他词典条目设置词典值吗？

下一篇 2022-12-16

发表评论

登录后才能评论

评论列表（0条）