R读取excel文件的最佳方式

R读取excel文件的最佳方式,第1张

众所周知,excel生成的文件后缀改雀是xls或或轮者xlsx,早期读取这样的文件,要么就另存为csv格式核团早,要么就用readxls或者xlsx这样的R包,可能会遇到Rjava报错的问题。现在有了一个优秀的解决办法,就是rio包。

它能够兼容含有多个工作簿的xlsx文件,非常巴适。

用R语言的内置数据组个列表。

它就变成了含有多个工作簿的电子表格哦。

有import函数可以读取各种类型的文件,但对于xlsx它只识别第一个工作簿。用import_list读取即可

R语言读取excel文件文件其实有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安装并载入读取excel文件所用的包:

install.packages("xlsx") library(xlsx)

或者,

install.packages("readxl") library(readxl)

两个包的基本介绍

xlsx是用R把excel文件中的工作表以data.frame的格式读入R语言,他有两个常用函数,其中read.xlsx2通常会比read.xlsx读取的速度更快一些,因为它的好多工作是利用Java完成的,所以速度有所提升,但是在读取子数据集的时候没有read.xlsx稳定孙尘禅性好则尘。

read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)

read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)

注:

sheetIndex:工作表单号

rowIndex:行号,就是你想读取那些行

header:表头,就是有没有列名。比如姓名,年龄,学号等

startRow:比如你想从第五行开始读取,就设置startRow = 5

readxl包可以用来读取xls和xlsx格式的文件

read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)

注:

sheet:读取的工作表

col_names: 如果是FALSE的话,就表示第一行不是列名,R会自动给你取成x1,x2...

colt_types: blank,numeric,date,text

na: 缺失值,默认空着的单元是缺失值,你也兄返可以自己指定,比如认为999是缺失值


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12129195.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存