r语言读取csv文件多了数据_教程

本次编程尝试使用R语言读取csv文件“filesize.csv”，并根据内容绘制统计图和得出平均数，中位数和方差等简单数据。

csv文件内容1001个数值至少大于1000的小数组成，每行一个，共计1001行

在打开文件之前，我们可能会遇到路径不正确的问题：

此时有两个选择：一是查询R语言的工作路径，并将文件转移至对应位置：

二是秀给工作路径至文件对应位置，即setwd(“"C:/Users/@@@/Desktop"”)//此代码将工作路径转移至桌面。此时如开头图片所示，显示的数据共有V0，V1共两列，其中V1是我们此次所需要的数据。

在绘制文件对应的统计图之前，我们先获取基础数据以大概确定统计图的范围：

第一步，将对应的V1转换为数字类型

第二步，使用summary得到基础数据：

写出如下内容，获取V1对应的统计图：

hist(num)

这里可以看到，因为大部分数据都集中在1000到2000之间，而最大数又高达70k+，于是得到这样一个特别的统计图

参考文章地址（https://zhuanlan.zhihu.com/p/120422644）

逗号分隔文件（.csv文件）、制表符分隔文件（.tsv文件）和空格分隔文件（.txt文件）

（一）.csv文件的读取

mydata <- read.csv(file=" ", header=T, sep=",", quote="\", dec=".", fill=T, comment.char=" ")

comment.char用于设置需要跳过的内容，比如需要跳过的行前面有“#”，那么设置comment.char=“#”,当然你也可以设置从中间开始读，注意，这个函数是read.csv里面的哦！

file: 以csv结尾的文件名,由文件所在路径及其文件名构成

header：是否把第一行作为表头

sep：分隔方式，csv文件分隔读入参数设置为"."

tsv文件分隔读入参数设置为"\t"

txt文件分隔为空格，不需要设置sep参数

也可以通过mydata <- read.table("D:/mydata.csv", header=T, sep=",", row.names="id")读取

（二）.tsv文件的读取

mydata <- read.table("D:/mydata.tsv", header=T, sep="\t", row.names="id")

除了分隔方式跟上面一样

（三）.txt文件的读取

mydata <- read.table("c:/mydata.txt", header=TRUE, row.names="id")

除了分隔方式跟上面一样

（四）以.gz结尾的压缩文件的读取

1.在R中可以使用gzfile()的方式读取压缩文件

2.使用data.table包里的fread()函数

安装并加载data.table包

install.packages("data.table")

library(data.table)

使用fread()函数读取文件，这里参数和之前的一致，唯一的不同就是fread()可以直接读取压缩文件

mydata <- fread(‘c:/mydata.txt.gz’, header=T, row.names=’id’)

（五）读取.xlsx后缀文件，也就是excel文件

1. 安装并加载openxlsx包

install.packages("openxlsx")

library(openxlsx)

2.进行数据的导入

mydata <- read.xlsx( "mydata.xlsx"，rowNames=T)

其他参数可以通过? read.xlsx在R中根据需要进行添加的。

欢迎分享，转载请注明来源：内存溢出

r语言读取csv文件多了数据