是否有适用于Python的示例数据集?

是否有适用于Python的示例数据集?,第1张

是否有适用于Python的示例数据集?

您可以使用

rpy2
package从Python访问所有R数据集。

设置界面:

>>> from rpy2.robjects import r, pandas2ri>>> def data(name): ...    return pandas2ri.ri2py(r[name])

然后

data()
使用可用数据集的任何数据集名称进行调用(就像中的一样
R

>>> df = data('iris')>>> df.describe()       Sepal.Length  Sepal.Width  Petal.Length  Petal.Widthcount    150.000000   150.000000    150.000000   150.000000mean       5.843333     3.057333      3.758000     1.199333std        0.828066     0.435866      1.765298     0.762238min        4.300000     2.000000      1.000000     0.10000025%        5.100000     2.800000      1.600000     0.30000050%        5.800000     3.000000      4.350000     1.30000075%        6.400000     3.300000      5.100000     1.800000max        7.900000     4.400000      6.900000     2.500000

要查看可用数据集的列表以及每个数据集的描述,请执行以下 *** 作:

>>> print(r.data())

注意:rpy2需要

R
使用设置
R_HOME
变量
pandas
进行安装,并且也必须安装。

更新:

我刚刚创建了PyDataset,这是一个简单的模块,可以使从Python加载数据集的 *** 作与一样简单

R
(并且不需要
R
安装,只需
pandas
)。

要开始使用它,请安装模块:

$ pip install pydataset

然后只需加载您想要的任何数据集(当前大约有757个数据集):

from pydataset import datatitanic = data('titanic')


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5629819.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-16
下一篇 2022-12-15

发表评论

登录后才能评论

评论列表(0条)

保存