对置信区间的计算通常要求对估计过程的假设(因此属于参数统计),比如说假设估计的误差是成正态分布的。
置信区间只在频率统计中使用。在贝叶斯统计中的对应概念是可信区间。但是可信区间和置信区间是建立在不同的概念基础上的,因此一般上说取值不会一样。
1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值范围(“一个区间”)。
2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。
3、该区间包含了参数θ真值的可信程度。
4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。
公式:
Pr(c1<=μ<=c2)=1-α
α是显著性水平(例:005或010)
100%(1-α)指置信水平(例:95%或90%)
表达方式:interval(c1,c2)——置信区间。
2计算步骤编辑第一步:求一个样本的均值
第二步:计算出抽样误差。
人们经过实践,通常认为调查:
100个样本的抽样误差为±10%;
500个样本的抽样误差为±5%;
1,200个样本时的抽样误差为±3%;
第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
3关于宽窄编辑窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。
假设全班考试的平均分数为65分,则
置信区间 间隔 宽窄度 表达的意思
0-100分 100 宽 等于什么也没告诉你
30-80分 50 较窄 你能估出大概的平均分了(55分)
60-70分 10 窄 你几乎能判定全班的平均分了(65分)
4其他信息编辑置信区间与置信水平、样本量的关系
1样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
实例分析:
经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):
样本量 置信区间 间隔 宽窄度
100 50%-70% 20 宽
800 562%-632% 7 较窄
1,600 575%-63% 55 较窄
3,200 585%-62% 35 更窄
由上表得出:
1、在置信水平相同的情况下,样本量越多,置信区间越窄。
2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一半(实践证明,样本量要增加4倍,置信区间才能变窄一半),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。
置信区间=点估计±(关键值× 点估计的标准差)
通过置信区间的计算公式来验证置信区间与样本量的关系。
例如:对于总体均值的置信区间估计:公式为:
样本均值关键值 × 样本均值的标准误差;即从上述公式中可以看出:
在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。
2置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。
实例分析:
美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±23%,置信水平降到为90%。则两组数字的情况比较如下:
抽样误差 置信水平 置信区间 间隔 宽窄度
±3% 95% 60%±3%=57%-63% 6 宽
±23% 90% 60%±23%=577%-623% 46 窄
由上表得出:
在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。可以使用t分布求出var的置信区间,具体步骤如下:
1 计算样本方差s2。
2 根据所选的置信水平获得对应的t值。
3 用公式 var= s2/n(1+t^2)来获得var值。
知道样本均值(M)和标准差(ST)时:
置信区间下限:a=M - nST;置信区间上限:a=M + nST。
当求取90%置信区间时n=1645。
当求取95%置信区间时n=196。
当求取99%置信区间时n=2576。
均匀分布
在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。均匀分布由两个参数a和b定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)。
置信度为95%,那么1-0,95=0,050,05/2=0,0251-0,025=0,975在表中查与0,975最相近的数值对应的就是你要的数值如该题就是1,96
所谓置信度,也叫可靠度,或置信水平,置信系数,它是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。
置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
说是要反着查值已知a=0,05,求解方法如下:
计算a/2=0,025
计算1-0,025=0,975
拿出标准正态分布表,查中间的概率值找到0,975,此时竖向与横向对应值分别是1,9和0,6,即:Z(1,96)=0,975
所以说u0,025=1,96
正态分布(Normaldistribution)又名高斯分布(Gaussiandistribution),是一个在数学,物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量服从一个位置参数,尺度参数为的概率分布,记为:则其概率密度函数为正态分布的数学期望值或期望值等于位置参数,决定了分布的位置;其方差的开平方或标准差等于尺度参数,决定了分布的幅度。正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是位置参数,尺度参数的正态分布(见右图中绿色曲线)。
正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低,图像是一条位于x轴上方的钟形曲线。当μ=0,σ^2=1时,称为标准正态分布,记为N(0,1)。
μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。
标准偏差用s表示的话。S2(平方)=2(n-1)其中M表示组值的平均值,sn表示各个值,n表示个数。如题,求标准偏差s先求平均值M,M=(780%+823%+782%)/3
s2=/(3-1)统计学问题:计算置信区间!!急急急!!!要具体步骤啊!!谢谢了啊!!!
该题目应该是总体成数的区间估计问题
解答: 已知n=200,p=140/200=07,又已知1-α=095,则根据t分布表,与置信水平95%相对应的
t=214
于是△p= t 根号下 p(1-p)/n=214 根号下0703/200=693%
所以,由于这种原因离开该企业的人员的真正比例构造95%的置信区间为:
p-△p<=p<=p+△p
即:70%-693%<=p<=70%+693%
也即:6307%<=p<=7693%
故由于这种原因离开该企业的人员的真正比例构造95%的置信区间为(6307%,7693%)
因为统计公式符号不方便打上,开根号的地方我用汉字代替了
希望对你有帮助!
置信区间怎么算
对于置信区间,均值、方差已知与否,求法各不相同。
wenkubaidu/2
这是一个链接,很详细了讲述了多种情况下,置信区间的求法。
怎么计算置信水平在知道置信区间的情况下
这个问题可以看成两点分布,作为两点分布的概率,一般服从正态分布,均值也是可以用置信区间逆推的,但是你不知道样本数啊,怎么能搞的出来置信水平呢?
恩,帮你算算,逆推样本均值为average(03033, 04967)=03985,标准差[03985(1-03985)]^(1/2)=04896,得Z/n^(1/2)=0194,猜测常用Z值无非196和165,那么如果样本在100人左右的话置信度就是95%,73人左右的话置信度就是90%,这两个最有可能。另外,177人的样本置信度在99%,45人的话置信度只有80%,样本要是上了250,置信度就到四个九了
置信区间的计算步骤
第一步:求一个样本的均值第二步:计算出抽样误差。人们经过实践,通常认为调查:100个样本的抽样误差为±10%;500个样本的抽样误差为±5%;1,200个样本时的抽样误差为±3%;第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
置信区间怎么计算
用excel算吧,方便一点。 数据平局值为A 数据的标准差为B 置信区间=A+-B196/数据数量的平方根 再细节的您看EXCEL的公式就好了
如何用SPSS求95%置信区间
置信区间的作用是, 你取了N个平行样, 你会算出平均值和方差等来表征这些样品, 置信区间也是其中一个表征的手段, 与平均值和方差都有关系 如置信区间的数量大小是由平均值决定的, 而这个区间的宽度是跟方差有关系的 但是置信区间和主成分分析等完全是两码事
以你的样品为例, 在SPSS中, 将这8个样品同一变量的数据输成一列, 菜单中选中 ysis->descriptive statistics-> explore 将你要计算置信区间的变量选到应dependent list里, 在下面的statistics里勾上descriptives, 设定为95% 然后OK就行了 出来的结果会显示均值为多少, 95%的区间上限和下限分别是多少
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)