怎样求一组数字的interquartile range?

怎样求一组数字的interquartile range?,第1张

四分位距(InterQuartile Range, IQR)的算法:

现有一组数据,可以四分位的百分比值(p),及样本总量(n)有以下数学公式可以表示:

情况1: 如果L是一个整数,则取 第L和 第L+1的平均值。

情况2: 如果L不是一个整数,则取下一个最近的整数。(比如L=12, 则取 2 )。

将数据从小到大排序,计为数组a(1 to n),n代表数据的长度

确定四分位数的位置:b= 1+(n-1) × 025= 225,b的整数部分计为c b的小数部分计为d

计算Q1:Q1=a(c)+[a(c+1)-a(c)]d=a(2)+[a(3)-a(2)] 025 =15+(36-15)×(225-2)=2025

计算如上 Q2与Q3的求法类似,则四分位差=Q3-Q1。

即IQR=Q3-Q1

扩展资料:

四分位数:

四分位数(Quartile)是统计学中分位数的一种,即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数。

1、第一四分位数(Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。

2、第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。

3、第三四分位数(Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。

4、第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range, IQR)。

iqr值就是四分位间距吧?
IQR=Q3-Q1。
SPSS里,四分位间距计算在:分析-描述统计-探索-统计量--描述性,不过要去“统计”标签里把“离群值”勾上。
而Q1与Q3则是在:分析-描述统计-频率-四分位数里,但是出来的只有Q1,Q2,Q3。
我做过,IQR=Q3-Q1没错。

这是最基础的题啊。
你这么问,我可以理解为你对四分位距的概念不了解么
先弄懂题目啥意思。再写吧
四分位距(interquartile range, IQR),又称四分差。是描述统计学中的一种方法,以确定第三四分位数和第一四分位数的区别(即Q1~Q3 的差距)。与方差、标准差一样,表示统计资料中各变量分散情形。公式:IQR = Q3 − Q1
下四分位 Q1=X{[A]+1}+(A-[A])(X{[A]+2}-X{[A]+1})
上四分位 Q3=X{[B]+1}+(B-[B])(X{[B]+2}-X{[B]+1})
所以你这个题的Q1=6,Q2=15,Q3=26
所以可以算出四分差的距离为=26-6=20

将n个数从小到大排列:

Q2为n个数组成的数列的中数(Median);

当n为奇数时,中数Q2将该数列分为数量相等的两组数,每组有 (n-1)/2 个数,Q1为第一组 (n-1)/2 个数的中数,Q3为为第二组(n-1)/2个数的中数;

当n为偶数时,中数Q2将该数列分为数量相等的两组数,每组有n/2数,Q1为第一组 n/2个数的中数,Q3为为第二组 n/2 个数的中数。

扩展资料:

四分位数的应用:

1、与总范围不同,四分位数范围的分解点为25%,因此通常优选总范围。

2、IQR用于构建箱形图,概率分布的简单图形表示。

3、对于对称分布,IQR的一半等于中值绝对偏差(MAD)。

4、中位数是集中趋势的相应度量。

5、IQR可以用来识别异常值。

6、四分位数偏差或半四分位数范围被定义为IQR的一半。

参考资料来源:百度百科-四分位数

使用SPSS的频率(Frequencies)程序就可以了。

_街枋_nalyze,Descriptive Statistics ,Frequencies,Statistics,在这个对话框中勾选quartils就可以了,以下就是我做的一个结果。

_tatistics

__谥

_ Valid 335

Missing 7

_ercentiles 25 855000

50 920000

75 960000

_虼耍_3等于96,Q1等于855,表明学生25%--75%的分数范围位于855--960之间。

  自己之前有做过这样的工作,也不知道到底做得准不准确,还望专家们指正。

 下表是不同试验室,对钢筋进行的拉伸试验得出的结果,并根据结果以中位值和标准化四分位距法统计:

  对一组由小到大排列的数据(X1,X2,X3……Xi),居于中间位置的数据为中位值,有一半的数据高于它,一半的数据低于它;居于下四分之一位置的数据为下四分位数或低四分位数(Q1),该组数据的四分之一低于 Q1,四分之三高于 Q1;居于上四分之一位置的

数据为上四分位数或高四分位数(Q3),该组数据的四分之一高于 Q3,四分之三低于 Q3。

中位值:将若干个测试结果按顺序递增或递减排列,如结果数量为奇数,则取排列在中间的结果;如结果数量为偶数,则取中间两个结果的和再平均(如上表)。用EXCEL来做统计时,点击函数MEDIAN,选择全部结果,即可得出中位值。

Q3:用EXCEL统计时,点击函数QUARTILE,进入参数后点击ARRAY选择全部数据,在QUART填入四分位点第3点(即输入3),即可得Q3。

Q1: *** 作和Q3相同,在QUART填入“1”。

IQR:等于Q3减去Q1。

NIQR:等于IQR乘以因子07413

Z:计算公式Z=(数据Xi-中位值)/NIQR

通过计算Z比分来进行评价:

| z |≤2表明“满意”,无需采取进一步措施;

2<| z |<3表明“有问题”,产生警戒信号;

| z |≥3表明“不满意”,产生措施信号。

计算过程是按照上述所写。

那么上面的表呢?按下面去做:

标准化和(用S表示)和标准化差(用D表示),即:

S=(A+B)/√2     D=(A-B)/√2(保留D的+或-号)

根据所有参加者的S和D的中位值和 NIQR,可以计算两个z比分数,即实验室间z比分数(ZB)和实验室内z比分数(ZW),即:

ZB=(S-med(S))/NIQR(S)    和    ZW=(D-med(D))/NIQR(D)

ZB和ZW的判定准则同z比分数。ZB主要反映结果的系统误差,ZW主要反映结果的随机误差。对于样品对,ZB≥3 表明该样品对的二个结果太高,ZB≤-3 表明其结果太低,ZW≥3表明其二个结果间的差值太大。

  

离群值的定义各个行业有可能有不同的标准。国际上比较通用的标准是以低于箱形图(Boxplot)下箱体的15倍个四分位间距(IQR),或是高于箱形图(Boxplot)上箱体的15倍个四分位间距作为离群值的定义,当这个标准提高至3倍个四分位间距时定义为极端值。不过这个算法使用手算很麻烦,我推荐你使用SPSS软件。
使用SPSS的频率(Frequencies)程序就可以了,步骤是Analyze,Descriptive Statistics ,Frequencies,Statistics,在这个对话框中勾选quartils就可以了,以下就是我做的一个结果。
Statistics
数学期中
N Valid 335
Missing 7
Percentiles 25 855000
50 920000
75 960000
因此,(上箱体位置)Q3等于96,(下箱体位置)Q1等于855,表明学生25%--75%的分数范围位于855--960之间。此时IQR=Q3-Q1=96-855=105
离群值:
当你的数据低于855-15X105=6975
或者
当你的数据高于96+15X105=11175
极端值:
当你的数据低于855-3X105=540
或者
当你的数据高于96+3X105=1275
以上方法是一个国际通用的方法,不管你的数据是否符合正态分布都可以使用。你的生化数据使用这个方法应该是没有问题的,顺便说一下,我也在生化实验室工作过。
此外,使用SPSS的Explore可以生成箱形图(Boxplot),并直接在图中显示出离群值和极端值。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12973274.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存