它能够兼容含有多个工作簿的xlsx文件,非常巴适。
用R语言的内置数据组个列表。
它就变成了含有多个工作簿的电子表格哦。
有import函数可以读取各种类型的文件,但对于xlsx它只识别第一个工作簿。用import_list读取即可
R语言读取excel文件文件其实有很多的包可以做到,最常用的就是xlsx和readxl, 首先,安装并载入读取excel文件所用的包:install.packages("xlsx") library(xlsx)
或者,
install.packages("readxl") library(readxl)
两个包的基本介绍
xlsx是用R把excel文件中的工作表以data.frame的格式读入R语言,他有两个常用函数,其中read.xlsx2通常会比read.xlsx读取的速度更快一些,因为它的好多工作是利用Java完成的,所以速度有所提升,但是在读取子数据集的时候没有read.xlsx稳定孙尘禅性好则尘。
read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL, startRow=NULL, endRow=NULL, colIndex=NULL, as.data.frame=TRUE, header=TRUE, colClasses=NA, keepFormulas=FALSE, encoding="unknown", ...)
read.xlsx2(file, sheetIndex, sheetName=NULL, startRow=1, colIndex=NULL, endRow=NULL, as.data.frame=TRUE, header=TRUE, colClasses="character", ...)
注:
sheetIndex:工作表单号
rowIndex:行号,就是你想读取那些行
header:表头,就是有没有列名。比如姓名,年龄,学号等
startRow:比如你想从第五行开始读取,就设置startRow = 5
readxl包可以用来读取xls和xlsx格式的文件
read_excel(path, sheet = 1, col_names = TRUE, col_types = NULL, na = "", skip = 0)
注:
sheet:读取的工作表
col_names: 如果是FALSE的话,就表示第一行不是列名,R会自动给你取成x1,x2...
colt_types: blank,numeric,date,text
na: 缺失值,默认空着的单元是缺失值,你也兄返可以自己指定,比如认为999是缺失值
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)