使用方法:
num = xlsread(filename),从指定文件夹读取,比如说num=xlsread('data.xls'),即从当前程序所在文件夹里,从A1单元格开始读取,读取data.xls文件,把数据返回给num。
num = xlsread(filename, -1),用户可以使用鼠标选择单元格范围。
num = xlsread(filename, sheet),选择所在的sheet,比如说'sheet1'。
num = xlsread(filename, range),所在的单元格范围,比如说range='A1:A8'。
相关信息镇败
xlsread 是数衡旅激学软件 MATLAB 中读取 Excel 文件中数据的一个函数。即从当前程序所在文件夹里,按照函数中的参数指定的范围,从单元格开始读取文件,返回数据。Matlab6.5(含)以后开始支持。
在 Excel中,函数实际上是一个预先定义的特定计算公式。按照这个特定的计算公式对一个或多个参数进行计算,并得咐袜出一个或多个计算结果,叫作函数值。使用这些函数不仅可以完成许多复杂的计算,而且还可以简化公式的繁杂程度。
R语言Excel文件Microsoft Excel是使用最广泛的电子表格程序,它是以.xls或.xlsx格式存储数据。 R可以使用某些excel特定雀搭的包直接读取这些文件的内容。一些常用的软件包有 - XLConnect,xlsx,gdata等。在这顷此拿个篇文章中,我们将使用xlsx软件包。 R也可以使用这个包写入excel文件。
安装xlsx软件包
可以在R控制台中使用以下命令来安装xlsx软件包。它可能会要求安装一些这个包所依赖的附加包。按照相同的命令与所需的包名来安装附加的包。
install.packages("xlsx")
R
验证并加载“xlsx”软件包
使用以下命令来验证和加载xlsx包。参考以下代码 -
# Verify the package is installed.
any(grepl("xlsx",installed.packages()))
# Load the library into R workspace.
library("xlsx")
R
当脚本运行时,得到以下输出 -
[1] TRUE
Loading required package: rJava
Loading required package: methods
Loading required package: xlsxjars
Shell
注: 如果第一个输出结扒扮果为:FALSE,请 install.packages("xlsx") 语句重新加载安装。
准备xlsx文件用作为输入
打开Microsoft excel。将以下数据复制并粘贴到名为sheet1的工作表中。
idname salarystart_datedept
1Rick 623.31/1/2012IT
2Dan 515.2 9/23/2013 Operations
3Michelle 61111/15/2014IT
4Ryan 7295/11/2014HR
5Gary 843.253/27/2015Finance
6Nina 578 5/21/2013IT
7Simon 632.87/30/2013Operations
8Guru 722.56/17/2014Finance
Txt
如下所示 -
如下所示 -
还将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为city。
name city
Rick Seattle
Dan Tampa
Michelle Chicago
Ryan Seattle
Gary Houston
Nina Boston
Simon Mumbai
Guru Dallas
如下所示 -
将Excel文件另存为“input.xlsx”,应该将此文件保存在R工作区的当前工作目录中。
读取Excel文件
使用read.xlsx()函数读取input.xlsx,如下所示,结果作为数据帧存储在R环境中。
# Read the first worksheet in the file input.xlsx.
data <- read.xlsx("input.xlsx", sheetIndex = 1)
print(data)
R
当我们执行上述代码时,会产生以下结果 -
id name salary start_date dept
1 1 Rick 623.30 2012-01-01 IT
2 2 Dan 515.20 2013-09-23 Operations
3 3 Michelle 611.00 2014-11-15 IT
4 4 Ryan 729.00 2014-05-11 HR
5 NA Gary 843.25 2015-03-27Finance
6 6 Nina 578.00 2013-05-21 IT
7 7Simon 632.80 2013-07-30 Operations
8 8 Guru 722.50 2014-06-17Finance
read.table()函数是R最基本函数之一,主要用来读取矩袭棚形表格数据。
我之前处理出来的数据直接就是用的save函数来保存的,结果都是一些乱码,经过高人指点以后,发现直接用read.table函数就可以了。感觉明明就是很基础的东西,但是就是卡了很久,唉,自学r语言的无奈啊。
read.table()函数是R最基本函数之一,主要用来读取矩形表格数据。
各参数的说明如下:
(1)file
file是一个带分隔符的ASCII文本文件。
(2)header
一个表示文件是否在第一行包含了变量的逻辑型变量。
如果header设置为TRUE,则要求第一行要比数据列的数量少一列。
(3)sep
分开数据的分隔符。默认sep=""。
read.table()函数可以将1个或多个空格、tab制表符、换行符或回车符作为分隔符。
>mouse<-read.table(file="mouse_all_count.txt",sep="\t",header=T)>head(mouse) X control_1 control_2 Akap95_1 Akap95_21 ENSMUSG00000060002.14 431 341 669 3842 ENSMUSG00000072576.5 3 2 2 53 ENSMUSG00000030546.14 5 5 1 34 ENSMUSG00000073116.4 0 0 0 25 ENSMUSG00000026228.6 2 0 2 36 ENSMUSG00000095102.1 0 0 0 0
(4)quote
用于对有特拍虚则殊字符的字符串划定接线的字符串,默认值是TRUE(")或单引号。(`)
(5)dec
decimal用于指明数据文件中小数的小数点。
(6)numerals
字符串类型。用于指定文件中的数字转换为双精度数据时丢失精度的情况下如何进行转换。
(7) row.names
保存行名的向量。可以使用此参数以 向量的形式 给出每行的实际行名。或者要读取的表中 包含行名称的列序号 或 列名字符串 。
在数据文件中有行头且首行的字段名比数据列少一个的情况下,数据文件中第1列将誉燃被视为行名称。除此情况外,在没有给定row.names参数时,读取的行名将会自动编号。
可以使用row.names = NULL强制行进行编号。
(8) col.names
指定列名的向量。缺省情况下是又"V"加上列序构成,即V1,V2,V3......
>mouse<-read.table(file="mouse_all_count.txt",sep="\t",header=T,row.names=1)>head(mouse) control_1 control_2 Akap95_1 Akap95_2ENSMUSG00000060002.14 431 341 669 384ENSMUSG00000072576.5 3 2 2 5ENSMUSG00000030546.14 5 5 1 3ENSMUSG00000073116.4 0 0 0 2ENSMUSG00000026228.6 2 0 2 3ENSMUSG00000095102.1 0 0 0 0
Tip:
rownames、colnames是base包中的行名、列名函数;
而row.names、col.names是read.table函数中的行名、参数
(9)as.is
该参数用于确定read.table()函数读取字符型数据时是否转换为因子型变量。当其取值为FALSE时,该函数将把字符型数据转换为因子型数据,取值为TRUE时,仍将其保留为字符型数据。其取值可以是逻辑值向量(必要时可以循环赋值),数值型向量或字符型向量,以控制哪些列不被转换为因子。
注意:可以通过设置参数 colClasses = "character"来阻止所有列转换为因子,包括数值型的列。
(10)na.strings
可选的用于表示缺失值的字符向量。
na.strings=c("-9","?")把-9和?值在读取数据时候转换成NA
(11)colClasses
用于指定列所属类的字符串向量。
(12)nrows
整型数。用于指定从文件中读取的最大行数。负数或其它无效值将会被忽略。
(13)skip
整型数。读取数据时忽略的行数。
(14)check.names
逻辑值。该参数值设置为TRUE时,数据框中的变量名将会被检查,以确保符在语法上是有效的变量名称。
(15)fill
逻辑值。在没有忽略空白行的情况下(即blank.lines.skip=FLASE),且fill设置为TRUE时,如果数据文件中某行的数据少于其他行,则自动添加空白域。
(16)strip.white
逻辑值,默认为FALSE。此参数只在指定了sep参数时有效。当此参数设置为TRUE时,数据文件中没有包围的字符串域的前边和后边的空格将会被去掉。
(17)blank.lines.skip
逻辑值,此参数值设置为TRUE时,数据文件中的空白行将被忽略。默认值为TRUE。
(18)comment.char
字符型。包含单个字符或空字符的向量。代表注释字符的开始字符。可以使用""关闭注释。
(19)allowEscapes
逻辑值。类似“\n”这种C风格的转义符。如果这种转义符并不是包含在字符串中,该函数可能解释为字段分隔符。
(20)flush
逻辑值。默认值为FALSE。当该参数值设置为TRUE时,则该函数读取完指定列数后将转到下一行。这允许用户在最后一个字段后面添加注释。
(21) stringsAsFactors
逻辑值,标记处字符向量是否需要转化为因子,默认是TRUE。
首先,明确String与Factor的区别。String是字符串,可用于记录琐细信息(比如发现UFO者的口头描述内容)。Factor是因此,用于给一行记录做“分类标记”,比如人的性别factors可以设置为“男”、“女”,工作效率最高日期的factors可以是“Mon”、"Tue",对于工作效率也可以有“high”、“low”等。对于Factor类型属性,R语言可以自动统计数据的factor水平(level),比如,男,有多少,Mon有多少等。
stringsAsFactors = F意味着,“在读入数据时,遇到字符串之后,不将其转换为factors,仍然保留为字符串格式”。
(22)fileEncoding
字符串类型,指定文件的编码方式。如果指定了该参数,则文本数据按照指定的格式重新编码。
(23)encoding
假定输入字符串的编码方式。
(24)text
字符串类型。当未提供file参数时,则函数可以通过一个文本链接从text中读取数据。
(25)skipNul
逻辑值。是否忽略空值。默认为FALSE。
参考资料 https://www.jianshu.com/p/90e1d430c9ef
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)