R语言读写最灵活的文件——txt文件

R语言读写最灵活的文件——txt文件,第1张

原文链接

R语言可以读取很多文件,其中以txt文本文件最为灵活,为什么呢,txt文件可以以任意符号作为分隔符,比如“,”,“\t”,空格,甚至`“……&¥¥%¥”`等任意自定义的分隔符号。

这里先把工作空间切换到D盘下面,默认的一般是C盘的文档,我们要有分层管理文件的概念,否则我们还是一个合格的程序员吗?

>setwd('D:\\')

读取文本文件主要用read.table(filePath,header = ,sep=)

filePath就是文件路径,header表示文件是否有头部,我这个文件没有头部,值就为false,旁核瞎sep表示文件是以什么符号作为分隔符号。

头部是什么意思呢?

现在这里有4个文件,分别以空格,逗号,制表符,“/”作为分隔符,下面分别将其读取:

>dat <- read.table('1.txt',header = FALSE,sep = ' ')

>dat2 <- read.table('2.txt',header = FALSE,sep = ',')

>dat3 <- read.table('3.txt',header = FALSE,sep = '\t')

>dat4 <- read.table('4.txt',header = FALSE,sep = '/')

读取出来的数据都是一样的:

因为第二个文件是以逗号作为分隔符,所以也是可以用read.csv()读取的,read.csv()也是一个读取文件函数,后面会讲氏衡到。

把刚才读取的数据写入到一个新的文本文件里面,可以用write.table(),形式为:

write.table(dat,file = ,sep = ,row.names,col.names)

分别表示,

dat:被写的数据,

file:文件名(包含路径),

sep:分隔符,

row.names:是否有行名(比如第一行,第二行。。)就是行名,

col.names:是否有列名,同上,

当然了,一般行名与列名需要取有实际意义的名字,比如列名可以取(年龄、性别、成绩,这种表格相信大家应该都见过吧!)。

这里分别用" ","aaa","\t"作为分隔符,生成了3个文件。

>write.table(dat,file = '5.txt'运空,sep = ' ')

>write.table(dat,file = '6.txt',sep = 'aaa')

>write.table(dat,file = '7.txt',sep = '\t')

这样就保存了三个文件。当然了,你可以保存成任意你喜欢、需要的分隔符号。

原文链接: 原文链接

1打开R语言开发环境,点击文件后新建程序历绝文件,2在d出R编辑器中输入代码R,3点击R语言开核烂掘发环境的保存按钮,在d出另存为对话框选择目标文件夹和文件名为,4关改核闭R语言编辑器,点去文件运行R语言脚本

R语言Excel文件

Microsoft Excel是使用最广泛的电子表格程序,它是以.xls或.xlsx格式存储数据。 R可以使用某些excel特定雀搭的包直接读取这些文件的内容。一些常用的软件包有 - XLConnect,xlsx,gdata等。在这顷此拿个篇文章中,我们将使用xlsx软件包。 R也可以使用这个包写入excel文件。

安装xlsx软件包

可以在R控制台中使用以下命令来安装xlsx软件包。它可能会要求安装一些这个包所依赖的附加包。按照相同的命令与所需的包名来安装附加的包。

install.packages("xlsx")

R

验证并加载“xlsx”软件包

使用以下命令来验证和加载xlsx包。参考以下代码 -

# Verify the package is installed.

any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.

library("xlsx")

R

当脚本运行时,得到以下输出 -

[1] TRUE

Loading required package: rJava

Loading required package: methods

Loading required package: xlsxjars

Shell

注: 如果第一个输出结扒扮果为:FALSE,请 install.packages("xlsx") 语句重新加载安装。

准备xlsx文件用作为输入

打开Microsoft excel。将以下数据复制并粘贴到名为sheet1的工作表中。

idname salarystart_datedept

1Rick 623.31/1/2012IT

2Dan 515.2 9/23/2013 Operations

3Michelle 61111/15/2014IT

4Ryan 7295/11/2014HR

5Gary 843.253/27/2015Finance

6Nina 578 5/21/2013IT

7Simon 632.87/30/2013Operations

8Guru 722.56/17/2014Finance

Txt

如下所示 -

如下所示 -

还将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为city。

name city

Rick Seattle

Dan Tampa

Michelle Chicago

Ryan Seattle

Gary Houston

Nina Boston

Simon Mumbai

Guru Dallas

如下所示 -

将Excel文件另存为“input.xlsx”,应该将此文件保存在R工作区的当前工作目录中。

读取Excel文件

使用read.xlsx()函数读取input.xlsx,如下所示,结果作为数据帧存储在R环境中。

# Read the first worksheet in the file input.xlsx.

data <- read.xlsx("input.xlsx", sheetIndex = 1)

print(data)

R

当我们执行上述代码时,会产生以下结果 -

id name salary start_date dept

1 1 Rick 623.30 2012-01-01 IT

2 2 Dan 515.20 2013-09-23 Operations

3 3 Michelle 611.00 2014-11-15 IT

4 4 Ryan 729.00 2014-05-11 HR

5 NA Gary 843.25 2015-03-27Finance

6 6 Nina 578.00 2013-05-21 IT

7 7Simon 632.80 2013-07-30 Operations

8 8 Guru 722.50 2014-06-17Finance


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12414408.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存