sklearn库中的什么模块可以加载数据集?

sklearn库中的什么模块可以加载数据集?,第1张

datasets模块可以加载数据集。根据查询相关公开信息显示:sklearn库中集成了datasets模块,该模块包含了数据分析中常用经典数据集,sklearn同时支持加载实际的数据集和外部数据集,加载数据集主要:通过pandas.io加载CSV,EXCEL,JSON,SQL等类型数据,故datasets模块可以加载数据集。

python的机器学习模块sklearn(Google公司开始投资,是大数据战略的一个步骤)可以用于模式识别,用在一般知识发现,例如户外参与人口的类型,sklearn包自己带了两个数据集,其中一个是鸢尾花数据库(iris,鸢尾花)

from sklearn import datasets

iris = datasets.load_irises()

#把鸢尾花数据集加载

data = iris.data

#可以用dir(data)查看数据集的性质其中包括max最大,mean中值等等

data.shape

#返回值:(150,4)表示150个观察值,4个特征设定萼片和花瓣的长宽;

pylab.imshow(digits.images[-1], cmap = pylab.cm_gray_r)


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9933166.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-03
下一篇 2023-05-03

发表评论

登录后才能评论

评论列表(0条)

保存