计量经济与时间序列_关于自协方差函数与自相关函数的有偏估计和无偏估计的解释

1之前说过,运用统计分析常用的观测方式(观测尺度、观测量度)有均值、方差、协方差、自相关、偏相关。但是对于像时间序列这样一维的数据构成特点。有自有的自协方差、自相关和自偏相关,方式和方法也是引用统计分析的度量方式,根据均值为0,方差为常数等特点,略加改变,形成时间序列这种数据特有的一种“自”度量方式。

2关于自协方差这块,我们可以看一下这两个公式:

计量经济与时间序列_关于自协方差函数与自相关函数的有偏估计和无偏估计的解释

3关于自相关这块儿,我们也可以看到两个公式:

计量经济与时间序列_关于自协方差函数与自相关函数的有偏估计和无偏估计的解释

4有偏和无偏有这么一种关系:

计量经济与时间序列_关于自协方差函数与自相关函数的有偏估计和无偏估计的解释

5在k=0,起始值的时候,自相关和自协方差有如下性质:

计量经济与时间序列_关于自协方差函数与自相关函数的有偏估计和无偏估计的解释

62.3.4.5这里面的解释如下:

(1)有偏估计和无偏估计,我们发现在有偏估计和无偏估计的区别知识在求E,也就是求平均值的count个数的时候有区别,这个区别导致有偏和无偏的区别。把上面的公式用大白话来解释就是,有偏估计的长度n是总体抽样的长度,不随着每次计算而改变,统一是一个除数长度;无偏估计的长度是n-k,和Σ求和的右端n-k是一样的,也就是说,随着取的k长度不一样,每次除数是和取样k长度的个数一致的。一句话叫:统一除一个长度,就有偏了;随着取样变化,就无偏的。这就很好理解作为每次计算的自协方差为一个独立观察,就观察这次的自协方差,肯定是无偏,因为长度跟我的一致(n-k)。如果作为一个总体序列来观察每次自协方差情况,不光观察这一次的自协方差情况,相对于总体的这个自协方差是什么关系,这样长度必须要保持不变为n。

(2)关于这个问题,为了只管理解,举一个例子:

比如我要对某一个学校一个年级的上千个学生估计他们的平均水平(真实值,上帝才知道的数字),那么我决定抽样来计算。

我抽出10个人的一个样本,可以计算出均值。那么如果我下次重新抽样,抽到10个人可能不一样了,那么从这个样本里面计算出来的均值可能就变化了。

因为这个均值是随着我抽样变化的,每次这10个人的均值也是随机变化的,但是随着我每次都抽10个人样本抽样次数越多,这个均值累计起来的大小会符合某一种分布。这种叫做渐进无偏性。说白了渐进无偏性叫放到历史长河中,你我不过是沧海一粟。就这个道理。

但是,我再改一下,我不每次固定10个人做为一个样本抽样。我每次不一定抽几个人作为一个样本进行抽样。这里的n就不一定了。如果我们已知总体(或者你抽样的总体的个数),这个n就是确定的,但是换句话来说,真实情况都属于上帝。但是我们不知道真实的总体,但我们可以知道每次抽样,就这个抽样来讲,他的最优或者最真实的部分就不应该是n了,应该是n-k个样本,因此,这叫无偏估计,是局部或者说每次的一个最优情况,也是总体最优情况中的一部分而已。

(3)但是这里要注意一点的是:最优包含无偏,无偏是最优的一部分,有偏是无限趋近于最优;但归根接地,真正的最优只有上帝知道。关于这个理解我们一定要理解两个词,一个叫包含和部分、趋近和渐进。是一件事的两个不同方面和角度。

(4)另外,我们这里知道了n-k这个东西。零还有x/n-k 或者1/n-k等等,如果除以这个n-k,这个玩意儿很多时候都能见到,叫做自由度。在整个一个大群体中你没有自由,所有就是n,但是在微观的情况下,每个个体也是不一样的,所以他们自己的由度,就是自由度。n-k就很容易理解了吧。属于一种无偏估计。

7另外说一下的是,在Eviews软件中关于自协方差和偏自相关函数的计算等,都用的是有偏估计,不是用的无偏估计。但是计算AIC等准则和其他东西,用的是无偏估计,因为有一个n-k自由度。因此n-k自由度是一个辨识无偏估计和有偏估计的重要标记。关于这个地方说的应该已经很透彻了,所以关于数学公式,数学字母,重中之重不是解题技巧,解题技巧就那么一种,重要的是对于公式和字母背后的逻辑和想要表达的东西。

8最近越来越发现,数学语言更像是佛学理论,佛学语言。属于一种高度哲学。其实也对,看看历史的发展,数学就是来自于哲学!亚里士多德,毕达哥拉斯等等。没毛病!