R语言数据结构-向量_软件运维

R语言数据结构主要有以下四种：

向量：一侍散纳串相同类型的数据，不限于数字，字符，逻辑都可以，单独拿出来的一列。什么是看做一个整体，一个向量里有若干个数据，它们组成一个整体之后，可以拥有一个共同的名字。

以下主要讲向量：

向量就是一串数据，串联在一起，组成一个整体，向量由元素组成。

很长的向量要么从数据框提取一列，或是有规律地生成，如连续的数据：

paste0函数连接两个向量，逗号 , 前后各有一个向量，如字符型和数值型向量。

paste0和paste的区别是：

paste0函数 把两个向量的元素一一对应进行无缝连接，而 paste函数 把两个向量的元素一一对应进行空格连接。paste函数有默认值为空格，在空格处把空格去掉sep=""引号里把默认的空格去掉，即什么没有，就变成无缝连接，也可以用其它的符号连接sep="/"，sep="_"等。

数值型、字符型、逻辑型：只要有字符型在，用c()生成向量为字符型。只有逻辑型和数值型，用c()生成向量为数值型。

c()函数生成向量时，要求为生成同一种数据类型

注意的地方：

变量名 ：c()为生成向量函数，一般除字母c外，取单个字母或是单词及缩写，组成变量名的字母之间不要有空格，不能以数字为变量名或是以数字开头，变量名不能是中文名，特殊符号等。

<- 与c()函数之间没有空格。

<- 的快捷键输入：

mac电脑： option 和 - ；

windows电脑： Alt 和 -

= 在任何情况下可替代 <- ，但是 = 除了赋值，还有其它用法，比如函数里参数用法。 <- 不能在任意情况下代替 = 。

强大的计算是体现在批量计算上，先把一些数据组成一个整体，

还是以向量x为单位进行

其中五个重要函数，一定要掌握。

能用函数代替的东西，坚决不用手和眼睛去数，比如length()统计向量元素个数。

结论：unique(x)与x[!duplicated(x)]函数相同

用identical()可以判断两个函数是否相同（数据结构与数据类型是否完全相同）

重点和难点：

x==y ：x和对应位置的y相等吗？（x和y里的元素，按顺序一一对应比较，讲究位置对应，两者里第一个元素相同就返TRUE，比较完两个向量的第一位置上的元素，接着比较两个向量第二个位置元素...到两个向量最后）。

x和y不一样长：理解“循环补齐”

结论： 如果x与y的向量元素长度不相等，以长度向量说了算，不是由在==前的向量决定。

x%in%y ：x的每个元素在y中存在吗？（x的元素挨个到y里和所有元素比较，在y里有的相同的返回TRUE，不讲究位置，有就是TRUE，没有为FALSE）。比如y向量加了一个元素2，返回还是9个逻辑值，返回的逻辑值是与x一一对应，和y没有关系掘铅。

加减乘除，两个向量直接可以进行，等位运算。前提是两个向量必须等长，即元素个数一样。

用paste0或是paste连接两个向量，两个向量的长度（元素个数）不一致，循环补齐。

intersect(x,y)，union(x,y)，setdiff(x,y)，setdiff(y,x)，x与y顺序颠倒（setdiff()与%in%有点儿相似）。

[] ：取子集老没符号，将TRUE对应的值挑选出来，FALSE丢弃.

例：在13个数中，取出大于7的数，首先把13个数值组成一个向量x，x>7返回是逻辑值。

取值子集的对象放在中括号的外面，取子集的逻辑值向量放在中括号里面。

单独运行中括号里的向量，中括号里各种条件的返回结果有共同的规律，是一个与x等长的逻辑值向量。

下标：代表在哪个位置上。

符号： []

按照逻辑值： 中括号里是与x等长的逻辑值向量

按照位置： 中括号里是由x的下标组成的向量（支持反选）

思考：从13个彩色（绿，蓝，黄）球中，选出属于蓝色和绿色的：

使用x %in% y还是x ==y，用x %in% y，不是等位循环补齐运算，%in%比较灵活，可以在很多场景中使用，如3选2，50选2，50选20等。

13个球的颜色赋值给向量x，蓝色和绿色赋值给y。

x %in% y

x[x %in% y]

修改向量的元素，修改x里的第四个元素

注意：R于语言里所有的修改，都要赋值，没有赋值就是没有发生过

把随机函数生成的数永远为一组数据：用随机函数生成向量，后运行set.seed(10086)

x[match(y,x)] 和 x[order(x)]

排序，如何调整元素顺序

结论：sort(x)等于x[order(x)]，背诵下来

两个向量没有做关联的 *** 作，可以用order函数排序对应信息

向量匹配排序-match，match函数是连线用的

x[match(y,x)] 的以后用法：以y作为模版，给x调顺序。

match：谁在中括号外面，谁就在后面， x[match(y,x)] ，以y作为模板，用x作为原料去取子集，按照一个顺序取子集，取出来的子集和y一样。

需要背诵的两个用法： x[match(y,x)] 和 x[order(x)]

练习题：在以下x和y表格里如何将y的列名一对一替换为ID

切换Rproj的时候出现d窗：是否将工作空间保存到 .Rdata ？

答案是：不保存，之前单独保存好脚本和图片，这里出现的提示是否临时保存，不需要保存。

.Rdata ？是什么：

以 . 开头的文件，通常用作配置，系统默认隐藏这类文件

.Rdata 是保存工作空间的默认文件

.History 是保存历史命令的默认文件

如果打开Rstudio特别慢，可能是因为 .Rdata 保存了很大的变量，可以找到 .Rdata 文件将其删除。

在Rproj右下角打开脚本时，编辑器脚本的中文注释出现乱码，解决如下：

以上内容是听生信技能树小洁老师的 R语言线上课，根据自己的理解记录下来，小洁老师授课非常细心，对不同水平的同学都照顾到，并且补充很多技巧以及注意事项。

之前学习过R语言，那时对向量认识不够深，也没有重视，数据框的列单独拿出来就是一个向量。认真听小洁老师的讲解以及最近跑几个GEO数据集发现学会对向量的熟练 *** 作以及熟练一些重要的函数，在实战过程中会顺利些。

大纲

转换

线性代数的大门“向量空间”

置换矩阵： 记作P，用来完成行列互换的矩阵。作用，置换行得到主元（检查主元位置是否为零）

(包含行互换的消元)对于任意可逆矩阵都有这种形式；大多数可逆都不需要，但也有很多矩阵需要行互换

置换矩阵 是行重新排列了的单位矩阵，总的个数为 (即，各行重新排列后所有可能的数目，所有 转换矩阵 都是可逆的，而且 逆矩阵 与其转置相等

转置：记作，

对称矩阵

所有都是宏者对称的

验证对称性：

向量空间：

中的子向量空间：

子空间 是如何得到的？矩阵是如何 构造子谈笑空间 的？

方法一：通过列向量构造，各列在中，所有的线性组合构成一个子空间。（用这些列来构造的 子空间 ，各列的和在空间中，各列乘以含绝含任何数也在子空间内）

何为线性组合? 指列一乘以某数，列二乘以某数，然后相加。它包括 两种运算 ，数乘和加法，只要包含了所有的 线性组合 ，就必然得到 向量子空间 。叫做 列空间 记作 , 代表 列空间 。

本节核心思想 ：通过某些向量，构成一个向量组成的空间，如果这些向量属于 ,它们构成的空间也在内，关键是，对其进行线性组合后仍然在子空间内

可以。

建立空间误差模型和空间滞后模型最好是用R语言做，当然用 Geoda 或 Eviews 等软件做也可以，首先看清题目要求：矩阵C是由矩阵A的前3行和前3列构成的矩阵。分析目的，矩阵A的前3行和前3列到底是多少。第一步：我们先看矩阵A的数据，箭头所指的就是前3行和前3列的数据。现在我们已经知道我们所需要的数据是什么。看题目我们可以把第4行陪纯和第4、5列去掉，剩下的数据就是我们需要的了。第二步：就要用卜蔽到矩阵的其他的函数---矩芦弊咐阵下标。要去掉矩阵中相应的行和(或)列,用负整数我们先把第4行和第5列去掉。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12512483.html

R语言数据结构-向量

发表评论

评论列表（0条）