何时使用DataFrame.eval()与pandas.eval()或python eval()

何时使用DataFrame.eval()与pandas.eval()或python eval(),第1张

何时使用DataFrame.eval()与pandas.eval()或python eval()

那么Dataframe.eval()的好处仅仅是在简化输入方面,还是我们可以确定使用此方法实际上更快的情况?

Dataframe.eval()的源代码表明,它实际上只是创建要传递给pd.eval()的参数:

def eval(self, expr, inplace=None, **kwargs):    inplace = validate_bool_kwarg(inplace, 'inplace')    resolvers = kwargs.pop('resolvers', None)    kwargs['level'] = kwargs.pop('level', 0) + 1    if resolvers is None:        index_resolvers = self._get_index_resolvers()        resolvers = dict(self.iteritems()), index_resolvers    if 'target' not in kwargs:        kwargs['target'] = self    kwargs['resolvers'] = kwargs.get('resolvers', ()) + tuple(resolvers)    return _eval(expr, inplace=inplace, **kwargs)

其中_eval()只是pd.eval()的别名,该别名在模块的开头导入:

from pandas.core.computation.eval import eval as _eval

所以,什么可以做用

df.eval()
,你 可以
pd.eval()
+一些额外的线条处理事情。从目前的情况来看,
df.eval()
从没有严格比快
pd.eval()
。但这并不意味着在任何情况下都不会
df.eval()
像一样好
pd.eval()
,但是编写起来更方便。

但是,在玩弄

%prun
魔术之后,似乎通过by
df.eval()
进行的调用
df._get_index_resolvers()
给该
df.eval()
方法增加了相当多的时间。最终,
_get_index_resolvers()
最终调用的
.copy()
方法
numpy.ndarray
,这最终使事情变慢。同时,
pd.eval()
确实会
numpy.ndarray.copy()
在某个时候进行呼叫,但是所花费的时间可以忽略不计(至少在我的机器上)。

长话短说,似乎

df.eval()
pd.eval()
在引擎盖下要慢得多,因为它只是
pd.eval()
在幕后加了一些额外的步骤,而这些步骤是不平凡的。



欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5649098.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-16

发表评论

登录后才能评论

评论列表(0条)

保存