F分布的介绍_安全

F分布是1924年英国统计学家RAFisher提出，并以其姓氏的第一个字母命名的。F分布定义为：设X、Y为两个独立的随机变量，X服从自由度为k1的卡方分布，Y服从自由度为k2的卡方分布，这2 个独立的卡方分布被各自的自由度除以后的比率这一统计量的分布。即：上式F服从第一自由度为k1，第二自由度为k2的F分布

方差分析（ANOVA）可以确定三个或更多组的均值是否不同。 ANOVA使用F-test来检验均值是否相等。在本文中，我将使用 One-Way ANOVA示例向展示ANOVA和F检验的工作原理。

F统计量是两个方差的比率，它以Ronald Fisher爵士的名字命名。方差测量均值周围数据点的离散度。当各个数据点趋向于从均值进一步下降时，会出现更高的方差。 F-test 用来检测几组数据的均值是否相同。而常用的T-test 用来检测2住数据的均值是否相同。

或者

其中已解释差异 (explained variance) 或者组间差异(between-group variability) 为:

其中未解释差异 (unexplained variance) 或者组内差异(within-group variability) 为:

两个自由度

下图中，左图中三个分布比较接近，组间差异小，分子小， F值小。右图三个分布均值差距大，分子大， F值大。

每做一次计算都会的得到一个 F-score，假设，我们不停的取样，不停的做实验，由于每次取样的值都不同，就会的到不同的 F值，利用这些不同 F 值，我们就可以获得 F 分布。

F 分布 (F-distribution) 是由其2个自由度决定的

好消息是，统计学家已经帮我们把常用的分布都已经算好了。

有了 F-Score 和 F分布以后，我们就以判断出计算出的 FScore 处于分布的哪个位置，是否比较极端。比如，我们的到的 F-Score 是 33, df1=3, df2=36 (4个group，总共40个样本)，结合 F 分布就是

解读为：在当前自由度确定的分布下， F-scroe 大于等于33 的概率。计算出来是003116，小于 005。也就意味着，这些group 的均值并不相等。

方差分析使用F检验来确定组均值之间的变异性是否大于组内观测值的变异性。如果该比例足够大，则可以得出结论，并非所有均值均相等。

这使我们回到了为什么我们分析变异来对均值做出判断的原因。想一想这个问题：“这个群体的均值不同吗？” 其实这个问题的潜台词是，每个组的均值差异如何。毕竟，如果组的均值没有变化，或者变化幅度不超过随机变化允许的范围，那么就不能说均值是不同的。这就是为什么要使用方差分析来检验均值的原因。

F检验只能告诉我们，几个group 的均值是否相同。但是不能告诉我们，到底哪个group 和其他group 均值不同！！！如果想知道到底组均值不同，得用 Post Hoc Tests

参考资料

1、首先我要拿出F检验表了解自由度是多少，例如当a=001时,找到a=001的表；

2、下图红线所圈出的是以分位数为090，自由度为（6,8）的F分布为例。首先选择分位数为090的分位数表，然后找到上方一行的6，对应6下方的一列。

3、然后我们还要找到左侧一列中的8，对应8的那一行。

4、最后两者相交的那个数字就是需要查找的分位数为090，自由度为（6,8）的F分布的值。

需要注意的是：F是一种非对称分布，有两个自由度，且位置不可互换。F分布表横坐标是x，纵坐标是y，一个分位点一张表，F005（7,9）就查分位点是005的那张表横坐标为7，纵坐标为9处的值。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12726942.html

F分布的介绍

发表评论

评论列表（0条）