那么Dataframe.eval()的好处仅仅是在简化输入方面,还是我们可以确定使用此方法实际上更快的情况?
Dataframe.eval()的源代码表明,它实际上只是创建要传递给pd.eval()的参数:
def eval(self, expr, inplace=None, **kwargs): inplace = validate_bool_kwarg(inplace, 'inplace') resolvers = kwargs.pop('resolvers', None) kwargs['level'] = kwargs.pop('level', 0) + 1 if resolvers is None: index_resolvers = self._get_index_resolvers() resolvers = dict(self.iteritems()), index_resolvers if 'target' not in kwargs: kwargs['target'] = self kwargs['resolvers'] = kwargs.get('resolvers', ()) + tuple(resolvers) return _eval(expr, inplace=inplace, **kwargs)
其中_eval()只是pd.eval()的别名,该别名在模块的开头导入:
from pandas.core.computation.eval import eval as _eval
所以,什么可以做用
df.eval(),你 可以
做
pd.eval()+一些额外的线条处理事情。从目前的情况来看,
df.eval()从没有严格比快
pd.eval()。但这并不意味着在任何情况下都不会
df.eval()像一样好
pd.eval(),但是编写起来更方便。
但是,在玩弄
%prun魔术之后,似乎通过by
df.eval()进行的调用
df._get_index_resolvers()给该
df.eval()方法增加了相当多的时间。最终,
_get_index_resolvers()最终调用的
.copy()方法
numpy.ndarray,这最终使事情变慢。同时,
pd.eval()确实会
numpy.ndarray.copy()在某个时候进行呼叫,但是所花费的时间可以忽略不计(至少在我的机器上)。
长话短说,似乎
df.eval()比
pd.eval()在引擎盖下要慢得多,因为它只是
pd.eval()在幕后加了一些额外的步骤,而这些步骤是不平凡的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)