我认为
df['word'].value_counts()应该服务。通过跳过groupby机制,您可以节省一些时间。我不知道为什么
count要慢于
max。两者都需要一些时间来避免丢失值。(与进行比较
size。)
无论如何,对value_counts进行了专门优化以处理像您的单词这样的对象类型,因此我怀疑您会做得更好。
欢迎分享,转载请注明来源:内存溢出
我认为
df['word'].value_counts()应该服务。通过跳过groupby机制,您可以节省一些时间。我不知道为什么
count要慢于
max。两者都需要一些时间来避免丢失值。(与进行比较
size。)
无论如何,对value_counts进行了专门优化以处理像您的单词这样的对象类型,因此我怀疑您会做得更好。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)