r语言如何将概率密度转换为正态分布曲线

r语言如何将概率密度转换为正态分布曲线,第1张

x = rnorm(1000) . # 生成1000个随机正态分布数据

hist(x,prob=TRUE,30) # histgram 这几个数的密度分布

curve(dnorm,add=TRUE) # 添加一条精准的密度曲线

或者生成一个序列

s = seq(-10,10,by=0.01) #范围从-10到10

plot(dnorm(s),type="l") # 画出 density function

因为没有看到你的数据,随意给你找了一组数据;你可以试着 *** 作一下:

w=c(100,99,34,29,95,85,86,95,84,87,58,89,93,90,92,84,75,76,65,76,87,89,83,82,81,94,

95,96,87,89,75,71,71,72,73,75,89,86,89,92,90,99,98,96,95,90,83,84,78,79)

hist(w,freq=FALSE)#做概率密度直方图

x=seq(min(w),max(w),by=0.001)#做一组序列,用于绘制normal curve的x坐标

y=dnorm(x,mean(w),sd(w))#求x的正态分布函数值

lines(x,y,col="blue",lwd=2)#添加一条正态曲线

绘制好的图片如下:

你可以在修改一下柱子的颜色,坐标标签等;在这里推荐你去学习一下ggplot2这个包;感觉比R绘图的基础包要强大一些;下面使用ggplot2画的,相同的数据,颜色没有调整,可能不太好看:

输入为一个vector,我们以a <- seq(1, 250, 1)做为示例数据

利用qqnorm函数直接绘制出了如下正态检验qq图

还可以进一步使用qqline命令在qq图上加上标准直线

注:qqline的默认算法为向量a上四分位数和下四分位数对应两个点的连线

Step 1: 首先我们算出vector中每一个数对应的百分位数

  在向量a中,数字1对应的累积比例(即小于等于数字1的频率)为1/length(a) = 0.04,数字250对应的累积比例为250/length(a) = 100%

  

Step 2: 根据累积比例数计算出正态分布对应的百分位数值

  直接绘制点图即为qqplot图

  

Step 3: 可以查看一下q值发现,最后的q值为Inf

  这是因为百分位100%对应的正态分布数值为无穷大,所以最后得出的图与R自带的qqnorm的稍微有一点点区别,这是因为在内置的qqnorm函数中对累积百分数进行了调整,为了避免inf的出现,使用 t <- (rank(a) -0.5)/length(a) 调整后得出的结果与qqnorm的结果图就完全一致了。

Step 4: 绘制标准直线

  如果是依据标准正态分布做的qq图,则标准直线截距为mean(a),斜率为sd(a)

[图片上传失败...(image-50be7a-1512789490785)]

  如果是依据(mean(a), var(a))正态分布做的qq图,则标准直线为y=x

[图片上传失败...(image-4e2370-1512789490785)]

pp plot横轴为实际累积概率,即上文qq plot中的变量t

纵轴为期望累积的概率,标准直线为 y=x

[图片上传失败...(image-682bd0-1512789490785)]

结果大致呈一条直线则说明大致服从正态分布

快速计算累积百分数的方法:

[图片上传失败...(image-de8e63-1512789490785)]

参考:

https://wenku.baidu.com/view/c661ebb365ce050876321319.html

http://data.library.virginia.edu/understanding-q-q-plots/

http://www.cnblogs.com/xianghang123/archive/2012/08/08/2628623.html

https://d.cosx.org/d/18521-18521


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/bake/11934783.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-19
下一篇 2023-05-19

发表评论

登录后才能评论

评论列表(0条)

保存