r语言 length和ncol的区别_软件运维

a本身是一个矩阵，而定义dimnames=list()则表示其每一个元素都被命名且命名方式是列表（list），因此在调用a中的元素的时候可以调用a[]或者a[[]]都可以。a[]是调用a本身的第几个元素，a[[]]是命名中的第几个名字下的元素。

R语言之—字符串处理函数

nchar

取字符数量的函数

length与nchar不同，length是取向量的长度

# nchar表示字符串中的字符的个数

nchar("abcd")

[1] 4

# length表示向量中元素的个数

length("abcd")

[1] 1

length(c("hello", "world"))

[1] 2

chartr

字符替换

chartr(old="a", new="c", x="a123")

[1] "c123"

chartr(old="a", new="A", x="data")

[1] "dAtA"

paste和paste0

字符串粘合函数

paste在不指定分割符的情况下，默认分割符是空格

paste0在不指定分割符的情况下，默认分割符是空

# 默认以空格隔开

paste("Hello","world")

[1] "Hello world"

# 没有空格

paste0("Hello","world")

[1] "Helloworld"

# 指定分割符

paste("abc", "efg", "hijk", sep = "-")

[1] "abc-efg-hijk"

# 分别对向量的每一个元素进行连接

paste0("A", 1:6, sep = "")

[1] "A1" "A2" "A3" "A4" "A5" "A6"

# collapse参数：每一个元素 *** 作之后，再把向量的每一个元素进行连接

paste0("A", 1:6, sep = "",collapse = "-")

[1] "A1-A2-A3-A4-A5-A6"

substr

字符串截取函数

substr(x = "hello", start = 1, stop = 2)

[1] "he"

strsplit

字符串的分割函数，可以指定分割符，生成一个list

strsplit("abc", split = "")

[[1]]

[1] "a" "b" "c"

如果要对一个向量使用该函数，需要注意。

# 分割向量的每一个元素，并取分割后的第一个元素

unlist(lapply(X = c("abc", "bcd", "dfafadf"), FUN = function(x) {return(strsplit(x, split = "")[[1]][1])}))

[1] "a" "b" "d"

gsub和sub

字符串替换

gsub替换匹配到的全部

sub 替换匹配到的第一个

# 将b替换为B

gsub(pattern = "b", replacement = "B", x = "baby")

[1] "BaBy"

gsub(pattern = "b", replacement = "B", x = c("abcb", "boy", "baby"))

[1] "aBcB" "Boy" "BaBy"

# 只替换第一个b

sub(pattern = "b", replacement = "B", x = "baby")

[1] "Baby"

sub(pattern = "b", replacement = "B", x = c("abcb", "baby"))

[1] "aBcb" "Baby"

grep和grepl

字符串匹配

grep函数返回的是索引值

grepl函数返回的是逻辑值

# 返回匹配到的元素的索引

grep(pattern = "boy", x = c("abcb", "boy", "baby"))

[1] 2

# 返回逻辑值

grepl(pattern = "boy", x = c("abcb", "boy", "baby"))

[1] FALSE TRUE FALSE

match &&pmatch &&charmatch

1、match

Usage

match(x, table, nomatch = NA_integer_, incomparables = NULL)

x %in% table

参数：

x: vector or NULL: the values to be matched. Long vectors are supported.

table : vector or NULL: the values to be matched against. Long vectors are not supported. (被匹配的值)

nomatch: the value to be returned in the case when no match is found. Note that it is coerced to integer. (没有match上的返回的值)

incomparables : a vector of values that cannot be matched. Any value in x matching a value in this vector is assigned the nomatch value. For historical reasons, FALSE is equivalent to NULL. (不同来匹配的值)

match函数类似与 %in%，不同的是match返回的是索引，而%in%返回的是逻辑值。

在R中尽量使用 <- 进行赋值， <- 更标准。在R中使用 = 进行赋值可能会出现错误（有些函数会将其解释为判断）——因为R起源于S语言，S语言的定义如此。

模式-使用mode()可以查看对象的数据类型

长度-使用length()可以查看对象的长度

标量可以是数字、字符、逻辑值等。

结果

向量可以由单个或多个值组成，多值的向量只能由相同类型的值组成，有一维和多维向量。

向量用于存储数值型、字符型、逻辑型数据

is.na()判断是否为缺失值，返回一个逻辑性向量

将自变量连接成一个字符串。

一般的使用形式是paste (..., sep = " ", collapse = NULL)， ... 表示想要连接的不同自变量，sep表示不同自变量之间添加的符号，collapse打开之后表示将整个自变量变成一个单一的变量

对对象进行重复

在统计学中，按照变量值是否连续把变量分为连续变量与离散变量两种。分类变量是说明事物类别的一个名称，其取值是分类数据。变量值是定性的，表现为互不相容的类别或属性。因子就是一类分类离散变量。

因子是带有水平（level）的向量。

factor()函数一般形式为：

可以用来筛选因子的level

Table()函数对应的就是统计学中的列联表，是一种记录频数的方法。对于因子向量，可用函数table()来统计各类数据的频率。Table()的结果是一个带元素名的向量，元素名为因子水平，元素值为该水平的出现频率。

tapply()是对向量中的数据进行分组处理，而非对整体数据进行处理。函数一般形式为：

gl()函数可以方便地产生因子，函数一般形式为：

矩阵是一个二维数组，只是每个元素都拥有相同的数据类型（数值型、字符型或逻辑型）。注意与数据框的差别，数据框不同列的数据类型可以不同。

函数matrix ()是构造矩阵（二维数组）的函数，其构造形式为：

数组与矩阵类似，但是维度可以大于2。数组有一个特征属性叫做维数向量(dim属性)，维数向量是一个元素取正整数值的向量，其长度是数组的维数，比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量的每一个元素指定了该下标的上界，下标的下界总为1。

R软件可以用array()函数直接构造数组，其构造形式为:

数据框与矩阵类似，为二维，其数据框中各列的数据类型可以不同，但是长度必须一样。数据框在生物数据中用得比较多，是非常重要的一类数据类型。

数据框与矩阵不同的是数据框不同的列可以是不同的数据类型，并且数据框假定每列是一个变量，每行是一个观测值。

作为数据框变量的向量、因子或矩阵必须具有相同的长度（行数）。数据框可以用data.frame()函数生成，其用法与list()函数相同。

data.frame(col1,col2,col3.....)其中列向量col1,col2等可以是任何类型的向量

列表可以储存不同类型的数据，是一些对象的有序集合。它的元素也由序号(下标)区分，但是各元素的类型可以是任意对象，不同元素不必是同一类型。元素本身允许是其他复杂数据类型。比如一个列表的元素也允许是一个列表。

R软件中利用函数list()构造列表，一般语法为：

Lst<-list(name_1=object_1,…, name_1=object_m)

其中name是列表元素的名称；object_i(i=1,…,m)是列表元素的对象。

unlist()函数：将list函数拉直成一个向量

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8084103.html

r语言 length和ncol的区别

发表评论

评论列表（0条）