四分位距(InterQuartile Range, IQR)的算法:
现有一组数据,可以四分位的百分比值(p),及样本总量(n)有以下数学公式可以表示:
情况1: 如果L是一个整数,则取 第L和 第L+1的平均值。
情况2: 如果L不是一个整数,则取下一个最近的整数。(比如L=12, 则取 2 )。
将数据从小到大排序,计为数组a(1 to n),n代表数据的长度
确定四分位数的位置:b= 1+(n-1) × 025= 225,b的整数部分计为c b的小数部分计为d
计算Q1:Q1=a(c)+[a(c+1)-a(c)]d=a(2)+[a(3)-a(2)] 025 =15+(36-15)×(225-2)=2025
计算如上 Q2与Q3的求法类似,则四分位差=Q3-Q1。
即IQR=Q3-Q1
扩展资料:
四分位数:
四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。
1、第一四分位数(Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。
2、第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。
3、第三四分位数(Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
4、第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。
iqr值就是四分位间距吧?IQR=Q3-Q1。
SPSS里,四分位间距计算在:分析-描述统计-探索-统计量--描述性,不过要去“统计”标签里把“离群值”勾上。
而Q1与Q3则是在:分析-描述统计-频率-四分位数里,但是出来的只有Q1,Q2,Q3。
我做过,IQR=Q3-Q1没错。这是最基础的题啊。
你这么问,我可以理解为你对四分位距的概念不了解么
先弄懂题目啥意思。再写吧
四分位距(interquartile range, IQR),又称四分差。是描述统计学中的一种方法,以确定第三四分位数和第一四分位数的区别(即Q1~Q3 的差距)。与方差、标准差一样,表示统计资料中各变量分散情形。公式:IQR = Q3 − Q1
下四分位 Q1=X{[A]+1}+(A-[A])(X{[A]+2}-X{[A]+1})
上四分位 Q3=X{[B]+1}+(B-[B])(X{[B]+2}-X{[B]+1})
所以你这个题的Q1=6,Q2=15,Q3=26
所以可以算出四分差的距离为=26-6=20
将n个数从小到大排列:
Q2为n个数组成的数列的中数(Median);
当n为奇数时,中数Q2将该数列分为数量相等的两组数,每组有 (n-1)/2 个数,Q1为第一组 (n-1)/2 个数的中数,Q3为为第二组(n-1)/2个数的中数;
当n为偶数时,中数Q2将该数列分为数量相等的两组数,每组有n/2数,Q1为第一组 n/2个数的中数,Q3为为第二组 n/2 个数的中数。
扩展资料:
四分位数的应用:
1、与总范围不同,四分位数范围的分解点为25%,因此通常优选总范围。
2、IQR用于构建箱形图,概率分布的简单图形表示。
3、对于对称分布,IQR的一半等于中值绝对偏差(MAD)。
4、中位数是集中趋势的相应度量。
5、IQR可以用来识别异常值。
6、四分位数偏差或半四分位数范围被定义为IQR的一半。
参考资料来源:百度百科-四分位数
使用SPSS的频率(Frequencies)程序就可以了。_街枋_nalyze,Descriptive Statistics ,Frequencies,Statistics,在这个对话框中勾选quartils就可以了,以下就是我做的一个结果。
_tatistics
__谥
_ Valid 335
Missing 7
_ercentiles 25 855000
50 920000
75 960000
_虼耍_3等于96,Q1等于855,表明学生25%--75%的分数范围位于855--960之间。
自己之前有做过这样的工作,也不知道到底做得准不准确,还望专家们指正。
下表是不同试验室,对钢筋进行的拉伸试验得出的结果,并根据结果以中位值和标准化四分位距法统计:
对一组由小到大排列的数据(X1,X2,X3……Xi),居于中间位置的数据为中位值,有一半的数据高于它,一半的数据低于它;居于下四分之一位置的数据为下四分位数或低四分位数(Q1),该组数据的四分之一低于 Q1,四分之三高于 Q1;居于上四分之一位置的
数据为上四分位数或高四分位数(Q3),该组数据的四分之一高于 Q3,四分之三低于 Q3。
中位值:将若干个测试结果按顺序递增或递减排列,如结果数量为奇数,则取排列在中间的结果;如结果数量为偶数,则取中间两个结果的和再平均(如上表)。用EXCEL来做统计时,点击函数MEDIAN,选择全部结果,即可得出中位值。
Q3:用EXCEL统计时,点击函数QUARTILE,进入参数后点击ARRAY选择全部数据,在QUART填入四分位点第3点(即输入3),即可得Q3。
Q1: *** 作和Q3相同,在QUART填入“1”。
IQR:等于Q3减去Q1。
NIQR:等于IQR乘以因子07413
Z:计算公式Z=(数据Xi-中位值)/NIQR
通过计算Z比分来进行评价:
| z |≤2表明“满意”,无需采取进一步措施;
2<| z |<3表明“有问题”,产生警戒信号;
| z |≥3表明“不满意”,产生措施信号。
计算过程是按照上述所写。
那么上面的表呢?按下面去做:
标准化和(用S表示)和标准化差(用D表示),即:
S=(A+B)/√2 D=(A-B)/√2(保留D的+或-号)
根据所有参加者的S和D的中位值和 NIQR,可以计算两个z比分数,即实验室间z比分数(ZB)和实验室内z比分数(ZW),即:
ZB=(S-med(S))/NIQR(S) 和 ZW=(D-med(D))/NIQR(D)
ZB和ZW的判定准则同z比分数。ZB主要反映结果的系统误差,ZW主要反映结果的随机误差。对于样品对,ZB≥3 表明该样品对的二个结果太高,ZB≤-3 表明其结果太低,ZW≥3表明其二个结果间的差值太大。
使用SPSS的频率(Frequencies)程序就可以了,步骤是Analyze,Descriptive Statistics ,Frequencies,Statistics,在这个对话框中勾选quartils就可以了,以下就是我做的一个结果。
Statistics
数学期中
N Valid 335
Missing 7
Percentiles 25 855000
50 920000
75 960000
因此,(上箱体位置)Q3等于96,(下箱体位置)Q1等于855,表明学生25%--75%的分数范围位于855--960之间。此时IQR=Q3-Q1=96-855=105
离群值:
当你的数据低于855-15X105=6975
或者
当你的数据高于96+15X105=11175
极端值:
当你的数据低于855-3X105=540
或者
当你的数据高于96+3X105=1275
以上方法是一个国际通用的方法,不管你的数据是否符合正态分布都可以使用。你的生化数据使用这个方法应该是没有问题的,顺便说一下,我也在生化实验室工作过。
此外,使用SPSS的Explore可以生成箱形图(Boxplot),并直接在图中显示出离群值和极端值。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)