基础-R内置数据集

基础-R内置数据集,第1张

Preleminary tasks

List of pre-loaded data

Loading a built-in R data

Most used R built-in data sets

mtcars: Motor Trend Car Road Tests

iris

ToothGrowth

PlantGrowth

USArrests

Summary

R附带了几个内置数据集,这些数据集通常用作演示数据,用于演示R函数。

在本文中,我们将首先描述如何加载和使用R内置数据集。接下来,我们将描述一些最常用的R demo数据集:mtcars、iris、ToothGrowth、PlantGrowth和USArrests。

预备工作

运行RStudio并设置工作目录

预加载数据列表

要查看预加载数据的列表,请键入函数 data():

>data()

输出如下:
加载内置R数据

加载并输出mtcars数据,如下所示:

#加载

>data(mtcars)

#打印前6行

>head(mtcars,6)
如果要了解有关mtcars数据集的更多信息,请键入以下内容:

mtcars
mtcars:Motor Trend Car Road Tests

数据来自1974年美国汽车趋势杂志,包括32辆汽车(1973-74款)的油耗和10个方面的汽车设计和性能

查看mtcars数据集的内容:

#1加载

>data(“mtcars”)

#2输出

>head(mtcars)

它包含32个观察值和11个变量:

#行数(观察)

>nrow(mtcars)

[1] 32

#列数(变量)

>ncol(mtcars)

[1] 11
iris 数据集以厘米为单位分别测量了3种iris中各50朵花的萼片长度、萼片宽度、花瓣长度和花瓣宽度。该物种是刚毛鸢尾,花斑鸢尾,和弗吉尼亚。

data(“iris”)

head("iris")
牙齿生长数据集包含了研究维生素C对60只豚鼠牙齿生长影响的实验结果。每只动物通过两种给药方法(橙汁或抗坏血酸(一种维生素C,编码为VC)中的一种,接受三种剂量水平的维生素C(05、1和2 mg/天)。

>data(“ToothGrowth”)

>head("ToothGrowth")
PlantGrowth

比较在对照和两种不同处理条件下获得的产量(以植物干重测量)的实验结果。

>data("PlantGrowth")

>head(PlantGrowth)
USArrests

这个数据集包含了美国各州暴力犯罪率的统计数据。

> data("USArrests") 

> head(USArrests)
加载内置R数据集:data(“data set_name”)

查看数据集:head(数据集名称)

首先标注一下报错内容:

报错key words: b'Iris-setosa'

通过搜索原因,发现有可能是在对文件读取是编译出现了问题,并且Keyword中提示b'Iris-setosa',而我们的string转float函数中没有字母b,很奇怪。所以尝试将转换函数所有的string前加b。结果发现数据读取正常。
下边附上转换函数:

->markdown用的还不熟,怎么转换字体颜色啊,强迫症要犯了<Face with Tears of Joy>。

我在网上找的是这样的。
iris$x=relevel(iris$Species,ref="setosa")
irislm=lm(SepalLength~SepalWidth+x,data=iris)
summary(irislm)
这里x是哑变量。

大家好,我是Peter~

之前写过很多关于Pandas的文章都是介绍如何使用Pandas来处理数据,这的确是它的强项。

其实,Pandas还有一个内置的功能:绘图。你没有看错: Pandas自身就是可以绘图的 。本文详细介绍基于Pandas的快速绘图方法。

下面是常见的参数及解释,详细的请参考官网: >

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13406153.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-30
下一篇 2023-07-30

发表评论

登录后才能评论

评论列表(0条)

保存