证明自相关函数和自协方差的关系:概率分布p(x)下的某些函数f(x)的平均值称为f(x)的期望值,用E[f]表示。自协方差函数是统计平均交流功率,自相关函数是统计平均总功率。交流功率(自协方差函数)等于总功率(自相关函数)减去直流功率。自相关函数在不同的领域,定义不完全等效。在某些领域,自相关函数等同于自协方差。
在信息处理与传输中,经常遇到一类称为平稳随机序列的重要信号。所谓平稳随机序列,是指它的N维概率分布函数或N维概率密度函数与时间n的起始位置无关。换句话说,平稳随机序列的统计特性不随时间的平移而发生变化。如果将随机序列在时间上平移k,其统计特性满足等式:
地球物理信息处理基础
这类随机序列就称为平稳随机序列。然而,在实际情况中,这一平稳条件很难得到满足,因此常将这类随机序列称为狭义(严)平稳随机序列。大多数情况下,虽然随机序列并不是平稳随机序列,但是它们的均值和均方值却不随时间而改变,其相关函数仅是时间差的函数,一般将这一类随机序列称为广义(宽)平稳随机序列。下面我们重点分析研究这类平稳随机序列。为简单起见,将广义平稳随机序列简称为平稳随机序列。
平稳随机序列的一维概率密度函数与时间无关,因此均值、方差和均方值均与时间无关,它们可分别表示为
μx=E[X(n)]=E[X(n+m)] (1-17)
地球物理信息处理基础
二维概率密度函数仅仅取决于时间差,与起始时间无关;自相关函数与自协方差函数是时间差的函数。自相关函数rxx(m)与自协方差函数cxx(m)(用cxx(m)表示covxx(m))分别为
rxx(m)=E[X(n+m)X(n)] (1-20)
cxx(m)=E{[X(n+m)-μx][X(n)-μx]} (1-21)
对于两个各自平稳而且联合平稳的随机序列,其互相关函数为
rxy(m)=rxy(n+m,n)=E[X(n+m)Y(n)] (1-22)
显然,对于自相关函数和互相关函数,下面公式成立
地球物理信息处理基础
如果对于所有的m,满足rxy(m)=0,则称两个随机序列互为正交。如果对于所有的m,满足rxy(m)=μxμy,cxy(m)=0,则称两个随机序列互不相关。
实平稳随机序列的相关函数、协方差函数具有以下重要性质
(1)自相关函数和自协方差函数是m的偶函数,即
rxx(m)=rxx(-m),cxx(m)=cxx(-m) (1-25)
而互相关函数和互协方差函数有如下关系
rxy(m)=ryx(-m),cxy(m)=cyx(-m) (1-26)
(2)rxx(0)在数值上等于随机序列的平均功率,即
地球物理信息处理基础
(3)
rxx(0)≥|rxx(m)| (1-28)
(4)
地球物理信息处理基础
(5)
上两式说明大多数平稳随机序列内部的相关性随着时间差的变大,愈来愈弱。
(6)
地球物理信息处理基础
课程采用Ruey S Tsay的《金融数据分析导论:基于R语言》(Tsay 2013 ) (An Introduction to Analysis of Financial Data with R)作为主要教材之一。
时间序列的线性模型,包括:
股价序列呈现缓慢的、非单调的上升趋势, 局部又有短暂的波动。
可口可乐公司每季度发布的每股盈利数据。 读入:
时间序列图:
序列仍体现出缓慢的、非单调的上升趋势,又有明显的每年的周期变化(称为季节性), 还有短期的波动。
下面用基本R的 plot() 作图并用不同颜色标出不同季节。
现在可以看出,每年一般冬季和春季最低, 夏季最高,秋季介于夏季和冬季之间。
收益率在0上下波动,除了个别时候基本在某个波动范围之内。
用xts包的 plot() 函数作图:
聚焦到2004年的数据:
红色是6月期国债利率, 黑色是3月期国债。 一般6月期高, 但是有些时期3月期超过了6月期,如1980年:
如图标普500月收益率那样的收益率数据基本呈现出在一个水平线(一般是0)上下波动, 且波动范围基本不变。 这样的表现是时间序列“弱平稳序列”的表现。
弱平稳需要一阶矩和二阶矩有限。某些分布是没有有限的二阶矩的,比如柯西分布, 这样的分布就不适用传统的线性时间序列理论。
稍后给出弱平稳的理论定义。
如图2可口可乐季度盈利这样的价格序列则呈现出水平的上下起伏, 如果分成几段平均的话, 各段的平均值差距较大。 这体现出非平稳的特性。
以下为一堆公式推导,具体查看: http://wwwmathpkueducn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/fts-tslinhtml#fig:tslin-intro-sp02
时间序列
自协方差函数
弱平稳序列
图6 是IBM股票月度简单收益率对标普500收益率的散点图。 从图中看出, 两者有明显的正向相关关系。
对于不独立的样本, 比如时间序列样本, 也可以计算相关系数, 其估计合理性需要一些模型假设。
对于联合分布非正态的情况, 有时相关系数不能很好地反映X和Y的正向或者负向的相关。 斯皮尔曼(Spearman)相关系数是计算X的样本的秩(名次)与Y的样本的秩之间的相关系数, 也称为Spearman rank correlation。
另一种常用的非参数相关系数是肯德尔tau(Kendall’s )系数, 反映了一致数对和非一致数对之间的差别。
即两个观测的分量次序一致的概率减去分量次序相反的概率。 一致的概率越大,说明两个的正向相关性越强。
对IBM收益率与标普收益率数据计算这三种相关系数:
自相关函数 (Autocorrelation function, ACF)参见 (何书元 2003 ) P131 §42的例21。 原始文献: MAURICE STEVENSON BARTLETT, On the Theoretical Specification and Sampling Properties of Auto-Correlated Time Series, Journal of the Royal Statistical Society (Supplement) 8 (1946), pp 24-41
在基本R软件中, acf(x) 可以估计时间序列 x 的自相关函数并对其前面若干项画图。
例:CRSP的第10分位组合的月对数收益率, 1967-1到2009-12。 第10分位组合是NYSE、AMEX、NASDAQ市值最小的10%股票组成的投资组合, 每年都重新调整。
图6: CRSP第10分位组合月对数收益率
用 acf() 作时间序列的自相关函数图:
acf() 的返回值是一个列表,其中 lag 相当于, acf 相当于。 用 plot=FALSE 取消默认的图形输出。
有研究者认为小市值股票倾向于在每年的一月份有正的收益率。
为此,用对的检验来验证。 如果一月份有取正值的倾向, 则相隔12个月的值会有正相关。
计算统计量的值,检验p值:
值小于005, 这个检验的结果支持一月份效应的存在性。
Ljung和Box(Ljung and Box 1978 )对Box和Pierce(Box and Pierce 1970 )提出了混成统计量(Portmanteau statistic)
检验方法进行了改进
在R软件中, Boxtest(x, type="Ljung-Box") 执行Ljung-Box白噪声检验。 Boxtest(x, type="Box-Pierce") 执行Box-Pierce混成检验。 用 fitdf= 指定要减去的自由度个数。
检验IBM股票月收益率是否白噪声。
考虑IBM股票从1926-01到2011-09的月度收益率数据, 简单收益率和对数收益率分别考虑。
读入数据:
读入的是简单收益率的月度数据。 作ACF图:
从ACF来看月度简单收益率是白噪声。
作Ljung-Box白噪声检验, 分别取和:
在005水平下均不拒绝零假设, 支持IBM月度简单收益率是白噪声的零假设。
从简单收益率计算对数收益率, 并进行LB白噪声检验:
在005水平下不拒绝零假设。
Box-Pierce检验和Ljung-Box检验受到取值的影响, 建议采用, 且序列为季度、月度这样的周期序列时, 应取为周期的整数倍。
对CRSP最低10分位的资产组合的月简单收益率作白噪声检验。
此组合的收益率序列的ACF:
针对和作Ljung-Box白噪声检验:
在005水平下均拒绝零假设, 认为CRSP最低10分位的投资组合的月度简单收益率不是白噪声。
有效市场假设认为收益率是不可预测的, 也就不会有非零的自相关。 但是,股价的决定方式和指数收益率的计算方式等可能会导致在观测到的收益率序列中有自相关性。 高频金融数据中很常见自相关性。
常见的白噪声检验还有TREVOR S BREUSCH (1978) 和LESLIE G GODFREY (1978)提出的拉格朗日乘子法检验(LM检验)。 零假设为白噪声, 对立假设为AR、MA或者ARMA。 参见:
设是独立同分布的二阶矩有限的随机变量, 称为独立同分布白噪声(white noise)。 最常用的白噪声一般假设均值为零。 如果独立同分布, 称为高斯(Gaussian)白噪声或正态白噪声。
白噪声序列的自相关函数为零(除外)。
实际应用中如果样本自相关函数近似为零 (ACF图中都位于控制线之内或基本不超出控制线), 则可认为该序列是白噪声的样本。
如:IBM月度收益率可以认为是白噪声(见例 33 ); CRSP最低10分位投资组合月度收益率不是白噪声(见例 34 )。
不是所有的弱平稳时间序列都有这样的性质。 非平稳序列更是不需要满足这些性质。
公式就不赘述
如果从时间序列的一条轨道就可以推断出它的所有有限维分布, 就称其为严平稳遍历的。 这里不给出遍历性的严格定义, 仅给出一些严平稳遍历的充分条件。 可以证明, 宽平稳的正态时间序列是严平稳遍历的, 由零均值独立同分布白噪声产生的线性序列是严平稳遍历的。
Tsay, Ruey S 2013 金融数据分析导论:基于R语言 机械工业出版社
何书元 2003 应用时间序列分析 北京大学出版社
Box, GEP, and D Pierce 1970 “Distribution of Residual Autocorelations in Autoregressive-Integrated Moving Average Time Series Models” J of American Stat Assoc 65: 1509–26
Ljung, G, and GEP Box 1978 “On a Measure of Lack of Fit in Time Series Models” Biometrika 66: 67–72
参考学习资料: http://wwwmathpkueducn/teachers/lidf/course/fts/ftsnotes/html/_ftsnotes/fts-tslinhtml#fig:tslin-intro-sp02
X服从均匀bai分布, 即X~U(a,b),则E(X)=(a+b)/2, D(X)=(b-a)2/12
证明如下:设连du续型随机变量X~U(a,b)
那么其分布函数F(x)=(x-a)/(b-a),a≤x≤b E(x)=∫F(x)dx
=∫(a到b)(x-a)/(b-a)dx =(x2/2-a)/(b-a) |(a到b) =(b2/2-a)/(b-a)-(a2/2-a)/(b-a)=(a+b)/2 E(x2)
=∫F(x2)dx=∫(a到b)(x2-a)/(b-a)dx =(x3/3-a)/(b-a) |(a到b) =(b3/3-a)/(b-a)-(a3/3-a)/(b-a)=(a2+b2+ab)/3
所以daoD(x)=E(x2)-E(x)2 =(a2+b2+ab)/3-(a+b)2/4 =(a2+b2-2ab)/12=(b-a)2/12
扩展资料:
泊松过程用数学语言说,满足下列三条件的随机过程X={X(t),t≥0}叫初级书中,泊松过程是定义在时间上的过程
做泊松过程。
①P(X(0)=0)=1。
②不相交区间上增量相互独立,即对一切0≤t1<t2<…<tn,X(t1),X(t2)-X(t1),…,X(tn)-X(tn-1)相互独立。
③增量X(t)-X(s) (t>s)的概率分布为泊松分布,即,式中Λ(t)为非降非负函数。
④若X还满足X(t)-X(s)的分布仅依赖于t-s,则称X为齐次泊松过程;这时Λ(t)=λt,式中常数λ>0称为过程的强度,因为EX(t)=Λ(t)=λt,λ等于单位时间内事件的平均发生次数。非齐次泊松过程可通过时间尺度的变换变为齐次泊松过程。
-泊松过程
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)