求助各位大神,用R语言怎么做有缺失值的统计分析

求助各位大神,用R语言怎么做有缺失值的统计分析,第1张

问题关键在于数据全为0,这样在算t检验统计里时,其分母为0,故得到NaN。
因此在ttest设置任何参数都是没有用的,你应该在ttest之有加条件判断出现这种情况 应该 先令
p>005才行

你可以用EXCEL中的“自动筛选”功能。选中数据第一行,按工具栏中的“数据-筛选-自动筛选”,就会在数据第一行出现下拉框,点中它,从下拉框中选“自定义”,会出现一个对话框,在这个对话框的左边框中选“包含”,右边框中填上“公园”(不要引号),确定后就把所有含有“公园”的数据筛选出来了,其他的会自动隐藏。同理,在“包含”的右边框中填上“门店”,就会把所有含有“门店”的数据筛选出来。

采编自 DataMiningWithR

21 观察各个变量数据的规范性
几乎每个变量都有异常值存在,多是异常大值

22 观察变量间的相关性

23 双变量间的相关性
由上可知,"oPO4"和"PO4"高度相关,达到091

24 观察单个变量的数据分布情况

左图可明显判断异常值的存在,右图可展现数据在不同范围内的分布集中度

31 了解缺失值的基本分布情况

32 直接删除缺失值,在缺失值占比很少的情况采用

33 基于一定的规则填充缺失值

41 数据准备和聚类预览

初步判断,可分为4组

42 层次聚类

43 kmeans均值聚类 (1)

43 kmeans均值聚类 (2)

41 盖帽法处理异常值
即分别设定数据的上下限,高于上限的用上限替换,低于下限的用下限替换

42 盖帽法处理异常值后重现考察数据的分布情况


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13360158.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-21
下一篇 2023-07-21

发表评论

登录后才能评论

评论列表(0条)

保存