matlab 基本数据分析函数

matlab 基本数据分析函数,第1张

Descriptive Statistics

bootstrp - Bootstrap statistics for any function

corrcoef - Correlation coefficient

cov - Covariance

crosstab - Cross tabulation

geomean - Geometric mean

grpstats - Summary statistics by group

harmmean - Harmonic mean

iqr - Interquartile range

kurtosis - Kurtosis

mad - Median Absolute Deviation

mean - Sample average (in matlab toolbox)

median - 50th percentile of a sample

moment - Moments of a sample

nanmax - Maximum ignoring NaNs

nanmean - Mean ignoring NaNs

nanmedian - Median ignoring NaNs

nanmin - Minimum ignoring NaNs

nanstd - Standard deviation ignoring NaNs

nansum - Sum ignoring NaNs

prctile - Percentiles

range - Range

skewness - Skewness

std - Standard deviation ((in matlab toolbox)

tabulate - Frequency table

trimmean - Trimmed mean

var - Variance (in matlab toolbox)

matlab里大部分函数只支持双精度

随机变量的累积概率值(分布函数值)

1 通用函数计算累积概率值

命令 通用函数cdf用来计算随机变量的概率之和(累积概率值)

函数 cdf

格式

说明 返回以name为分布,随机变量X≤K的概率之和的累积概率值,name的取值见表4-1 常见分布函数表

2 专用函数计算累积概率值(随机变量的概率之和)

命令 二项分布的累积概率值

函数 binocdf

格式 binocdf (k, n, p) %n为试验总次数,p为每次试验事件A发生的概率,k为n次试验中事件A发生的次数,该命令返回n次试验中事件A恰好发生k次的概率

命令 正态分布的累积概率值

函数 normcdf

格式 normcdf() %返回F(x)=的值,mu,sigma为正态分布的两个参数

专用函数的累积概率值函数表

函数名

调用形式

注 释

unifcdf

unifcdf (x, a, b)

[a,b]上均匀分布(连续)累积分布函数值 F(x)=P{X≤x}

unidcdf

unidcdf(x,n)

均匀分布(离散)累积分布函数值 F(x)=P{X≤x}

expcdf

expcdf(x, Lambda)

参数为Lambda的指数分布累积分布函数值 F(x)=P{X≤x}

normcdf

normcdf(x, mu, sigma)

参数为mu,sigma的正态分布累积分布函数值 F(x)=P{X≤x}

chi2cdf

chi2cdf(x, n)

自由度为n的卡方分布累积分布函数值 F(x)=P{X≤x}

tcdf

tcdf(x, n)

自由度为n的t分布累积分布函数值 F(x)=P{X≤x}

fcdf

fcdf(x, n1, n2)

第一自由度为n1,第二自由度为n2的F分布累积分布函数值

gamcdf

gamcdf(x, a, b)

参数为a, b的分布累积分布函数值 F(x)=P{X≤x}

betacdf

betacdf(x, a, b)

参数为a, b的分布累积分布函数值 F(x)=P{X≤x}

logncdf

logncdf(x, mu, sigma)

参数为mu, sigma的对数正态分布累积分布函数值

nbincdf

nbincdf(x, R, P)

参数为R,P的负二项式分布概累积分布函数值 F(x)=P{X≤x}

ncfcdf

ncfcdf(x, n1, n2, delta)

参数为n1,n2,delta的非中心F分布累积分布函数值

nctcdf

nctcdf(x, n, delta)

参数为n,delta的非中心t分布累积分布函数值 F(x)=P{X≤x}

ncx2cdf

ncx2cdf(x, n, delta)

参数为n,delta的非中心卡方分布累积分布函数值

raylcdf

raylcdf(x, b)

参数为b的瑞利分布累积分布函数值 F(x)=P{X≤x}

weibcdf

weibcdf(x, a, b)

参数为a, b的韦伯分布累积分布函数值 F(x)=P{X≤x}

binocdf

binocdf(x,n,p)

参数为n, p的二项分布的累积分布函数值 F(x)=P{X≤x}

geocdf

geocdf(x,p)

参数为 p的几何分布的累积分布函数值 F(x)=P{X≤x}

hygecdf

hygecdf(x,M,K,N)

参数为 M,K,N的超几何分布的累积分布函数值

poisscdf

poisscdf(x,Lambda)

参数为Lambda的泊松分布的累积分布函数值 F(x)=P{X≤x}

说明 累积概率函数就是分布函数F(x)=P{X≤x}在x处的值

具体 *** 作步骤如下:

1、首先,提出问题,然后使用MATLAB计算下图中的积分问题,如下图所示,然后进入下一步。

     

2、其次,完成上述步骤后,打开MATLAB软件,并按照以下代码清除工作区,如下图所示,然后进入下一步。

     

3、接着,完成上述步骤后,在MATLAB中定义符号变量并定义函数,代码如下图所示,然后进入下一步。

     

4、然后,完成上述步骤后,可以获得新定义的函数,代码如下图红框标注所示,然后进入下一步。

     

5、最后,完成上述步骤后,要计算积分的值,请使用以下代码:Fz=z;int1=int(FzC,fa,0,pi)int2=int(int1,theta,0,pi2),如下图所示。这样,问题就解决了。

     

matlab中qfunc与normcdf有什么不同?

y=qfunc(x)返回实值输入的每个元素的Q函数输出。Q函数是(1-f),其中f是标准正态随机变量的累积分布函数的结果。

使用例子:

x = -4:01:4;

y = qfunc(x);

plot(x,y)

grid

p = normcdf(x) 返回正态累积分布函数 (cdf),在 x 中的值处计算函数值

使用例子:

x = [-2,-1,0,1,2];

mu = 2;

sigma = 1;

p = normcdf(x,mu,sigma)

1.熟悉数学软件MatLab中Statistics工具箱里的各种密度函数和分布函数的作图命令并观看各种图形。

2.会用概率分布函数cdf求各种分布中的不同事件的概率,会用逆概率函数inv求各种分布的α分位点。

背景知识:统计工具箱简介

统计工具箱是一套建立于Matlab数值计算环境的统调分析工具.能够支持范围广泛的统计计算任务,提供工程和科学统计的基本能力。其中包括200各个M文件(函数),主要文持以下各方面的内容。

•概率分布——提供了20种概率分布类型,其中包括连续分布和离散分布,而且每种分布类型均给出5个有用的函数,即概率密度函数、累积分布因数、逆累积分布函数、随机数产生器和均值与方差计算函数。

•参数估计——依据特定分布的原始数据,可以计算分布参数的估计值及共置信区间。

•描述性统计——提供描述数据样本特征的函数,包括位置和散布的度量、分位数估计和处理数据缺夫情况的函数等。

•线性模型——针对线性模型,工具箱提供的函数涉及单因素方差分析、双因素方差分析、多重线性回归、逐步回归、响应曲面预测和岭回归等。

•非线性模型——为非线性模型提供的函数涉及参数估计、多维非线性拟合的交互预测和可视化以及参数和预计值的置信区间计算等。

假设检验——此间提供最通用的假设检验的函数:t检验和z检验。

多元统计——关于多元统计的函数有主成分分析和线性判别分析。

统计绘图——Matlab图形库中添加了box图、正东概率图、威布尔概率图分位数与分位数图等,另外还对多项式拟合和预测的支持进行扩展。

统计工序管理——可绘制通用的管理图和进行工序性能的研究。

试验设计——支持因子设计和D优化设计。

统计工具箱的函数主要分为两类

•数值计算函数

•交互式图形工具函数

前一类工具由—些函数组成,可以通过命令行或自己的应用程序来调用这些函数。其中很多函数为Matlab的M文件,这些文件由一系列实现特殊统计算注的语句构成。可使用下还语句查看这些函数的代码

type function_name

也可以将M文件拷贝下米,然后进行修改,形成按您所需要的算法进行计算的M文件,并将其添加到工具路中。

工具箱所提供的后一类工具是一些能够通过图形用户界面(Gui)来使用的交互式图形工具。这些基于Gui的工具间时也为多项式拟合和预测以及概率函数介发提供环境。

文中的函数参考或详解中包含各类函数使用的具体信息。对函数的描述包括函数调用格式、参数选项以及 *** 作符的完整说明。许多函数说明中包括示例、函数算法的说明以及附加阅读材料的参考等等。

另外,统计工具箱中的函数所采用的数学符号符合以下惯例

线性模型中的参数

E(x) x的期望值,

f(x|a,b) 概率密度函数(x为独立变量,a、b为固定参数)

F(x|a,b) 累积分布函数

I[(a,b)] 指示(indicator)函数

P和q P为事件发生的概率,

q为事件不发生的概率,故P=1—q

概率密度函数

对于离散分布和连续分布,其相应的概率密度函数pdf(probility Density Function)

有各自不同的含义。

•离散型随机变量:它是只有有穷个或可数个可能值的随机变量,其概率密度函数是

观察到某特定值的概率。

•连续型随机变量:如果存在一非负函数p(x)>=0,使对于任意实数a<=b,x在区 间(a,b)上的取值的概率为

则函数p(x)称作X的概率密度函数,它满足

=1

与离散分布的pdf不同,其观察到果一特定值的概率为零

pdf具有两种性质:

pdf具有两种性质:

•对于每个可能的结果pdf为零或一正数

pdf对整个区间的积分为1。

pdf并非单一函数,而是由一个或多个参数所表征的函数族。一旦选定(或估计)了参数值,此函数才唯一确定。

在统计工具箱中,对每种分布的吵函数进行调用的格式是统一的具体调用格式参见表

下面以正态分布为例,说明pdf函数调用方法。

举例

x=[—3:0.5:3];

f = normpdf(x,0,1)

f=

Columns l through 7

0.0044 0.0175 0.0540 0.1295 0.2420

03521 03989

Columns 8 through 13

0.352l 0.2420 0.1295 0.0540 0.0l 75 0.0044

pdf函数中的第一个参数提供所要计算其概率密度的点集(自变量x);其他参数提供能够唯一确定分布的参数值,正态分布需要两个参数:位置参数(均值u)和散度参数(标准差o )。上例中,计算结果变量f则包含了由参数0和1(u=0, =1)所确定的正态分布函数在x取值上的概率密度。

在函数调用时,其小的参数可能是标量(即数量)、矢量或矩阵,出此征给定参数时,需要注意这些参量的长度(或称尺寸、大小等)席该相匹配。例如, 分布的曲函数调用:P=

betacdf(X,A,B)。其市,x、A和B的长度要么相向(如,它们都是单个标量,或都为包含N个元素的矢量或NM个元素的距阵);要么,其中有的参数(假设为)是单个标量,而其他参量为矢量或矩阵,则MatId自动将X扩展为与其他参量相同长度的矢量或矩阵,此矢

量或矩阵的元素均为常量x的佰。我们称这种自动 *** 作方式为矢量扩展规则。

举例:

a=[05,05]

b=[05,1]

c=[05,1]

y=betapdf(a,b,c)

y=

06366 10000

a=[05 1; 2 4]

a=

05000 10000

20000 40000

y=betapdf(05 ,a,a)

y=

06366 10000

05000 21875

在其他类似函数中,也通常采用矢量扩展规则对各参量进行 *** 作。以后不再一—赘述。

除了表中列出的特定分布的pdf函数外,统计工具箱还给出了通用的pdf调用函

数,凶数名即为pdf。

pdf

功能:可选分布的通用概率密度函数。

格式:Y=pdf(‘name’,X,Al,A2,A3)

说明:Y=pdf(‘name’,X,Al,A2,A3)提供了求取统计工具路中任一分布的概率密度值功

能。其中,‘na毗’为特定计布的名称,如‘Normal’、’Gamma’等。X为分

布函数的自变量x的取值矩阵,而A1、A2、A3分别为相应的分布参数值。注

意:由于各种分布所含参数不同,A1、A2、A3的含义各不相同,也并不一定

都是必须的;对于任一分布,A1、A2、A3的值具体如何给出,可参见相应分

布的特定概率密度函数。Y存放结果,为概率密度值距阵。

举例:p = pdf( ‘Norma1 ‘,一2:2,0,1)

p=

0.0540 0.2420 0.3989 0.2420 0.0540

p = pdf(‘Poi s son’ , 0:4,1:5)

p=

0.3679 0.2707 0.2240 0.1954 0.1755

函数betapdf()

功能:计算 分布的概率密度函数

语法:Y=betapdf(X,A,B)

说明:

Y=betapdf(A,B) 根据相应的参数A,B计算X中每个值的 分布概率密度。输入的向量或矩阵X,A,B必须形式相同。标量输入将被扩展成和其它输入具有相同维数

的常数短阵或数组。参数A,B必须全部为正,X中的值必须介于0和1之间。

分布概率密度计算。

a=[05 1;2 4]

a=

05000 10000

20000 40000

y=betapdf(05,a,a)

y=

06366 10000

15000 21875

函数binopdf ()

功能:计算二项分布的概率密度

语法:Y=binopdf(X,N,P)

说明:

Y=binopdf(X,N,P) 根据相应的参数N,P计算X中每个值的二项分布概率

密度。输入的向量或矩阵X,N,P必须形式相同。标量输入将被扩展成和其它输入具有相

同维数的常数矩阵或数组。参数N必须为正整数,P中的值必须在区间[0,1]上。

一个质量检验员每天检验500个零件。如果1%的零件有缺陷,一天内检验

员没有发现有缺陷零件的概率是多少检验员发现有缺陷零件的数量最有可能是多少

计算一天内检验员没有发现有缺陷零件的概率p:

p=binopdf(0,500,001)

p=

0 0066

计算检验员发现有缺陷零件的数量:

y=binopdf([0:500],500,0.01);

[x,i]=max(y)

x=

0 1764

i=

6

因为数组下标i=1时代表发现0个缺陷零件的概率,所以检验员发现有缺陷零件的

数量最有可能是i—l=5。

函数exppdf ()

功能:计算指数分布的概率密度函数

语法:Y=exppdf(X,MU)

说明:

Y=exppdf(X,MU) 根据相应的参数MU计算X中每个值的指数分布概率密

度。输入的向量或短阵X,MU必须形式相同。标量输入将被扩展成和其它输入具有相同

维数的常数矩薛或数组。参数MU必须为正数。

指数分布概率密度计算。

y=exppdf(8,1:8)

y=

0.0003 0.0092 0.0232 0.0338 O.0404 0.0439 0.0456 0.0460

y=exppdf(1:8,1:8)

y=

0.3679 0.1839 0.1226 0.0920 0.0736 0.0613 0.0526 0.0460

作图

画对数正态分布的概率密度图

x=(0:001:10);

y=lognpdf(x,0,1);

plot(x,y);grid;

xlabel(‘\itx’);ylabel(‘概率密度\itp’)

画负二项分布的概率密度图

x=(0:10);

y=nbinpdf(x,3,05);

plot(x,y,’k+’);

xlabel(‘\itx’);ylabel(‘概率密度\ity’);

set(gca,’Xlim’,[-05,105])

比较具有相同自由度(V=10)的非中心t分布(非中心参数DELTA=1)和

分布,如图所示。

x=(-5:01:5);

p1=nctpdf(x,10,1);

p=tpdf(x,10);

plot(x,p,'k:',x,p1,'k-')

xlabel('\itx');ylabel('概率密度\itp');

legend('t分布','非中心t分布');

x=(001:01:1001);

p1=ncfpdf(x,5,20,10);

p=fpdf(x,5,20);

plot(x,p,'k--',x,p1,'k-');

xlabel('\itx');ylabel('概率密度\itp');

legend('F分布','非中心F分布');

例比较具有相同分子与分母自由度(分别为5和30)的非中心万分布(参数

=10)和F分布,如图1l 3所示。

累积分布因数与逆累积分布因数

连续型随机变量的累积分布函数cdf,亦称分布函数,完全取决于其概率密度P(x),数学表达式为

F(x)=

如果f是概率密度函数.则相应的累积分布函数(cdf)F为

F(x)=P(X<=x)=

累积分布函数F(x)表示所观察结果小于或等于x的概率。cdf具有两种性质:

•cdf值F(x)的范围为0一1;

.如果y >=x.则F(y)>=F(x)。

逆累积分布函数icdf返回给定显著概率条件下假设检验的临界位,实际上是cdf的逆函数。

公统计工具箱中,对每种分布的cdf和icdf函数(名称以inv结尾)进行调用的格式是统

一的 另外, 1:具稍提供了通用的累积分布函数cdf和逆累积分布面数icdf,说明如下。

cdf icdf

功能:计算可选分布的累积分布函数和逆累积分布函数。

格式:P=cdf(‘name’,X,A1,A2,A3)

X=icdf(‘name’,P,Al,A2A3)

说明:P=cdf(‘name’ X,A1,A2,A3)与pdf函数的区别仅在于它是计算某种分布的累积分

布函数值,而不是概率密度值,其他用法与pdf函数相同。

X=icdf(‘name’,P,Al,A2,A3)为P=cdf(’name’,X,A1,A2,A3)的逆函数。

举例:p=cdf(‘Normal’,-2:2,0,1)

p=

0.0228 0.1587 0.500 0 0.84l 3 0.9772

p=cdf(‘Poisson’,0:5,1:6)

p=

0.3679 0.40 60 0.4232 0.4335 0.440 5 0.4457

x = icdf( ‘Normal’,0.1:0.2:0.9,0,1)

x=

-1.28l 6 -0.5244 0 0.5244 1.28l 6

x=icdf(‘Poisson’,01:02:09,1:5)

x=

1 1 3 5 8

下面说明正态分布的cdf函数调用方法

x=[--3:01:3];

p=normcdf(x,0,1);

共中,变量P包含出参数0和l所确定的正态分布函数在x中所取值上的累积分布函

数值。所用参数含义与pdf函数类同。

下面说明连续的累积分布函数(cdf)与其逆函数(icdf)的关系。

X= [-3:0.1:3];

xnew = norminv(normcdf(x,0,1), 0,1);

相反地,进行下述计算:

p = [0.1:0.1:0.9];

pnew = normcdf(norminv(p, 0,1),0,1)

请对照一下x与xnew和p与pnew,可以发现其中的规律。

连续分布中取值点的cdf计算值为。0~1的概率值,这些概率值的逆cdf则给出其原来

的取值点。

对于离散分布,cdf与其icdf的关系更为复杂些。因为很可能不存在某个值(设为x)

使得x的cdf为p在这种情况下,其icdf返回使cdf(x)幸p的第一个值x’。如:

x = [0:10];

y = binoinv[binocdf(x,l 0,0.5), l 0, 0.5];

请对照—下x与y

以下的命令说明了进行相反 *** 作所同样存在的问题。

p = [0.1:0.2:0.9];

pnew = binocdf(binoinv(p,l 0, 0.5),l 0, 05)

Pnew =

0.1719 0.3770 0.6230 0.828l 0.9453

逆函数在假设检验和产生置信区间等工作中是很有用的。以下给出获得正态分布的99%置信区间的方法。

p= [0.00 5 0.9951

x = norminv(p, 0,l)

x=

-25758 25758

变量x中的值即为给定概率区间P的条件下,由参数0和1所确定的止态分布函数的逆函数的结果,p(2)-p(1)=099.因此,x给出了标准正态分布的99%置信区间。

逆累积分布函数

MATLAB的统计工具箱提供了21种逆累积分布函数,见下表

函数betainv()

功能:求 分布的逆累积分布函数

语法:X=betainv(P,A,B)

说明:

x=betainv(P,A,B) 计算P中概率值的 分布(参数为A和B)逆累积分布函数值。输入的向量或矩阵P,A,B必须形式相同。标量输入将被扩展成和其它输入具有相同维数的矩阵。参数A,B必须全部为正,P中的值必须位于区间[0,1]上。

给定概率P和参数a和b的户分布的逆累积分布值为

其中

B()为犀函数。输出结果x中每一个元素是这样一个值,它服从由参数为a和b定义的分布,且其累积分布值为P中相应的概率值。

计算P分布逆分布函数示例。

P=[0.01 0.5 0.991

x=betainv(p,10,5)

x=

03726 06742 08981

由上面的结果可以看出,对于参数a=10,b=5的雇分布,小于或等于0.3726的值出现的概率为00l。类似地,小于或等于06742和08981的值出现的概率为0.5和0.99。

函数binoitnv()

功能:求二项分布的逆累积分布函数

语法:x=binoinv(Y,N,P)

说明:

X=binoiv(Y,N,P) 退回二项累积分布值大于或等于Y的最小的整数值X。

可以认为Y是在N次重复独立试验中事件成功X次的概率,其中对于任意给定的一次试验成功的概率为P。X中的每个值都是小于或等于N的正整数。

输入的向量或短阵Y,N,P必须是形式相同。标量输入将被扩展成和其它输入具有相同维数的常数矩阵。参数N必须为正整数,P和Y中的值必须位于区间[0,1]上。

如果一个棒球队在一个赛季中有162场比赛,任意一场比赛获胜的机会都为50%.那么这支球队在一个赛季中获胜场次的合理范围为多少?假定不可思议的结果

10年才偶然出现一次。

binoinv([005 095],162,05)

ans=

71 91

结果表示这支球队在一个赛季中90%的范围内,获胜的场次在71和9l之间。

函数expinv()

功能:求指数分布的逆累积分布函数

语法;x=expinv(P,MU)

说明:

x=expinv(P,MU) 计算P中概率值的指数分布(参数为MU)逆累积分布值。

输入的向量或矩阵P,MU必须形式相同。标量输入将被扩展成和其它输入具有相同维数的常数矩阵。参数MU必须为正数,P中的值必须位于区间[0,1]上。

指数分布的逆累积分市函数定义为

结果x是表示这样一个值,它服从参数为 的指数分布且落在区间[0,x]上的概率为P。

假定灯泡的奉命服从参数 P=700明日数分布,那么灯泡寿命的中位数是多少

expinv(050,700)

ans=

4852030

因此,假定买了一箱灯泡,如果700小时是灯泡的平均寿命,那么一半灯泡将在不超过500小时时就会烧掉。

函数chi2inv()

功能;求 分布的逆累积分市函数

语法;X=chi2inv(P,V)

说明:

x=chi2inv(P,V) 计算P中概率值的 分布(参数为V)逆累积分布函数值。

输入的向量或矩阵P,V必须形式相同。标量输入将被扩展成和其它输入具有相同维数的常数矩阵。自由度参数V必须为正整数,P中的值必须位于区间[0,1]上。

给定概率P和自由度参数 的 分布的逆累积分布值为

其中

()为 函数。输出结果x中每一个元素是这样一个值,它服从由参数 定义的分布,且其累积分布值为P中相应的概率值。

例 找出一个超过95%样本值的数,其中样本服从自由度为10的 分布

x=chi2inv(0.95,10)

x=

183070

由上面的结果可以发现大于18.3的数只有5%的出现机会

函数morminv()

功能:计算正态分布的逆累积分布面数

语法:x=norminv(P,MU,SIGMA)

说明:

x=norminv(P,MU,SIGMA) 计算P中概率值的正态分布(参数为MU和SIGMA)逆累积分布函数值。输入的向量或矩阵P,MU和SIGMA必须形式相同。标量输入将被扩展成和其它输入具有相同维数的常数矩阵。SIGMA中的参数值必须为正数,

P中的值必须位于区间[0,1]上。

正态分布的逆累积分布函数定义为

其中

结果x为上面积分等式的解.其中P被赋予想得到的概率值。

例 找一个区间,使它包含95%的标准正态分布的值。

x=norminv([0.025 0.975],0,1)

x=

-19600 19600

注意区间x不是惟一符合条件的区间,但它是最小的。

x1=norminv([001 096],0,1)

x1=

-23263 17507

区间x1也包含了95%的概率值,但它要比x要大。

函数poissnv()

功能:计算泊松分布的逆累积分布函数

语法:x=poiesinv(P,LAMBDA)

说明:

X=poissinv(P,LAMBDA) 返回泊松累积分布值大于或等于P的最小的正整数X。输入的向量或矩阵P和LAMBDA必须形式相同,输出X也和它们形式相同。标量输入将被扩展成和其它输入具有相同继数的常数矩阵。参数LAMBDA必须为正数。

例 由某商店过去的销售记录知道,某种商品每月的销售数可以用岁数 =25的泊松分布来描述,为了有95%以上的把握不使商品脱销,问商店在每月月底应进该种商品多少件

Poissinv(095,25)

ans=

33

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/12177643.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存