F分布的介绍

F分布的介绍,第1张

F分布是1924年英国统计学家RAFisher提出,并以其姓氏的第一个字母命名的。F分布定义为:设X、Y为两个独立的随机变量,X服从自由度为k1的卡方分布,Y服从自由度为k2的卡方分布,这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布。即: 上式F服从第一自由度为k1,第二自由度为k2的F分布

方差分析(ANOVA)可以确定三个或更多组的均值是否不同。 ANOVA使用F-test来检验均值是否相等。在本文中,我将使用 One-Way ANOVA示例向展示ANOVA和F检验的工作原理。

F统计量是两个方差的比率,它以Ronald Fisher爵士的名字命名。方差测量均值周围数据点的离散度。当各个数据点趋向于从均值进一步下降时,会出现更高的方差。 F-test 用来检测几组数据的均值是否相同。 而常用的T-test 用来检测2住数据的均值是否相同。


或者

其中 已解释差异 (explained variance) 或者 组间差异(between-group variability) 为:

其中 未解释差异 (unexplained variance) 或者 组内差异(within-group variability) 为:

两个自由度

下图中, 左图中三个分布比较接近,组间差异小, 分子小, F值小。 右图三个分布均值差距大,分子大, F值大。

每做一次计算都会的得到一个 F-score, 假设,我们不停的取样, 不停的做实验, 由于每次取样的值都不同, 就会的到不同的 F值, 利用这些不同 F 值, 我们就可以获得 F 分布。

F 分布 (F-distribution) 是由其2个自由度决定的

好消息是,统计学家已经帮我们把常用的分布都已经算好了。

有了 F-Score 和 F分布以后, 我们就以判断出计算出的 FScore 处于分布的哪个位置, 是否比较极端。 比如, 我们的到的 F-Score 是 33, df1=3, df2=36 (4个group,总共40个样本), 结合 F 分布就是

解读为: 在当前自由度确定的分布下, F-scroe 大于等于33 的概率。 计算出来是003116, 小于 005。 也就意味着, 这些group 的均值并不相等。

方差分析使用F检验来确定组均值之间的变异性是否大于组内观测值的变异性。如果该比例足够大,则可以得出结论,并非所有均值均相等。

这使我们回到了为什么我们分析变异来对均值做出判断的原因。想一想这个问题:“这个群体的均值不同吗?” 其实这个问题的潜台词是, 每个组的均值差异如何。毕竟,如果组的均值没有变化,或者变化幅度不超过随机变化允许的范围,那么就不能说均值是不同的。这就是为什么要使用方差分析来检验均值的原因。

F检验 只能告诉我们, 几个group 的均值是否相同。但是不能告诉我们,到底哪个group 和其他group 均值不同!!! 如果想知道到底组均值不同, 得用 Post Hoc Tests

参考资料

1、首先我要拿出F检验表了解自由度是多少,例如当a=001时,找到a=001的表;

2、下图红线所圈出的是以分位数为090,自由度为(6,8)的F分布为例。首先选择分位数为090的分位数表,然后找到上方一行的6,对应6下方的一列。

3、然后我们还要找到左侧一列中的8,对应8的那一行。

4、最后两者相交的那个数字就是需要查找的分位数为090,自由度为(6,8)的F分布的值。

需要注意的是:F是一种非对称分布,有两个自由度,且位置不可互换。F分布表横坐标是x,纵坐标是y,一个分位点一张表,F005(7,9)就查分位点是005的那张表横坐标为7,纵坐标为9处的值。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12726942.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存