您也可以将
str访问器用于某些列表 *** 作。在这个例子中
df['CreationDate'].str.len()
返回每个列表的长度。请参阅有关的文档
str.len。
df['Length'] = df['CreationDate'].str.len()dfOut: CreationDate Length2013-12-22 15:25:02 [ubuntu, mac-osx, syslinux] 32009-12-14 14:29:32 [ubuntu, mod-rewrite, laconica, apache-2.2] 42013-12-22 15:42:00 [ubuntu, nat, squid, mikrotik] 4
对于这些 *** 作,香草Python通常更快。熊猫可以处理NaN。时间安排如下:
ser = pd.Series([random.sample(string.ascii_letters, random.randint(1, 20)) for _ in range(10**6)])%timeit ser.apply(lambda x: len(x))1 loop, best of 3: 425 ms per loop%timeit ser.str.len()1 loop, best of 3: 248 ms per loop%timeit [len(x) for x in ser]10 loops, best of 3: 84 ms per loop%timeit pd.Series([len(x) for x in ser], index=ser.index)1 loop, best of 3: 236 ms per loop
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)