Estimation Theory [Steven M. Kay] 学习笔记
文章目录
- 前前言
- Estimation Theory
- 前言
- Chapter 1
- 1.2 估计的数学问题
- Chapter 2 最小方差无偏估计
- 2.1&2.2
- 2.3 无偏估计
- 2.4 最小方差准则
- 2.5 MVU的存在性
- 2.6 确定最小方差无偏估计
- 2.7 拓展到矢量
- Chapter 3
- 3.1&3.2
- 3.3 估计器精度考虑
- 3.4 CRLB
- 3.5 WGN中的一般CRLB
- 3.6 参数变形
- 3.7 拓展到矢量
- 3.8 矢量参数的变换
- 3.9 一般高斯情况的CRLB
- 总结
前前言
#个人学习笔记 #未考虑自己以外的读者体验 #有错请指正
教材:Steven M. Kay, Fundamentals of statistical signal processing: estimation theory[M]. Prentice-Hall, Inc., 1993.
Estimation Theory
前言
- primary focas: 获得可以在数字计算机上运算的最优估计算法
- data sets 是连续时间信号的采样,或者数据点序列
- 前序学科:数字信号处理、概率和随机过程、线性和矩阵算数
- overview:2-9章是经典估计,10-13是Bayesian估计。先讨论标量参数,再拓展到矢量参数。
Chapter 1
1.2 估计的数学问题
- PDF以未知数为参数。因此有一族PDF,当参数不同,数据集合(data set)的值不同。
用分号表示这种关系:
因此,可以根据的值推断出的值。 - 实际问题中并没有给出PDF,而是要选择一个不仅与问题的约束和先验知识一致的,而且在数学上也容易处理的PDF。
- classical estimation&Bayesian estimation
- classical estimation:感兴趣的参数假定为确定的但是未知
- Bayesian estimation:感兴趣的参数是随机变量
如:先验地知道,感兴趣的参数在是中的一个随机变量,不再是一个确定的参数,而且指定PDF,即可在之间均匀分布。
则数据由联合PDF描述:
其中,是先验PDF,概括了在数据观测以前关于的先验知识,是条件PDF,概括了在已知的条件下由数据提供的知识。
Chapter 2 最小方差无偏估计
2.1&2.2
- 利用最小均方误差MSE(通常导出的是不可实现的估计量)作为更为自然的误差准则
- 最小方差无偏估计(MVU)存在:利用Cramer-Rao Bound和充分统计概念,求出估计器
MVU不存在:更多限制条件(数据为线性数据)的估计器更容易实现,但是是次优的评估器
2.3 无偏估计
- 定义:参数是在区间上的任何值,无论的真值是多少,估计量的均值都等于真值。
数学表示:如果
那么估计器是无偏的,其中表示的可能取值范围。注:对所有,。 - 令,其中,这要求
- 如果估计器是有偏的,则偏差定义为
2.4 最小方差准则
- 均方误差mean square error定义
- 任何与偏差有关的估计器都不可实现。
- mse是不可实现的估计器,因为不可写成数据的唯一函数。
- MSE不可用 约束,求最小的估计器。 最小方差无偏估计MVU
2.5 MVU的存在性
- MVU不一定存在
2.6 确定最小方差无偏估计
- 确定CRLB,然后检查是否有满足CRLB(chapter3、4)
- 应用RBLS定理(chpter5)
- 进一步限制不仅是无偏的们还是线性的,然后在这些限制中找出最小方差无偏估计(chapter6)
2.7 拓展到矢量
- 未知参数矢量为,则无偏估计器满足
定义
也可定义为
Chapter 3
3.1&3.2
- CRLB可以确定一个estimator是MVU,或者给估计器性能比较一个benchmark。
- 如果不存在可以到达CRLB的估计器,可以渐进达到(in chapter 7)
- 标量参数的CRLB(3.6),如果满足(3.7)则可以达到下界;
- 另一种确定CRLB(3.12)
- 估计参数是一个函数时CRLB(3.16)
3.3 估计器精度考虑
- 估计精度与PDF直接相关:PDF对参数的依赖性越强,所得估计精度越高。
- PDF作为未知参数的函数时(固定),为似然函数。
- 似然函数的尖锐程度决定了估计未知参数的精度。用对数似然函数的负二阶导数度量尖锐性。
对数似然函数的平均曲率:
3.4 CRLB
- 定理:
正则条件——假设PDF满足
其中,期望是对求得。
下界——则任何无偏估计器的方差一定满足
其中,导数是在的真值处计算。
MVUE——对于某个函数和,当且仅当
时,对所有达到下界的unbiased estimator可求。这个估计器就是,且是MVUE,最小方差是. - 上面的数学期望还可以由下式给出
- Fisher Information——
直观理解:信息越多,下限越低。具有信息测度的基本性质:
- 非负的
- 独立观测是可加的
- 对于无法达到CRLB下限条件的例子中,不存在无偏且达到CRLB的估计器。但是MVU仍可能存在,目前只是无法确定MVU存在与否,Chapter5的充分统计量将解决此条件下MVU如果存在并如何求问题。
- Efficient——达到CRLB的估计器称为efficient。
- 另一种CRLB表示:
因为恒等式 - 由于fisher信息对于独立观测是可加的,则对个IID观测的CRLB是单次观测的。
3.5 WGN中的一般CRLB
- Example:
- Example3.5:
3.6 参数变形
- 已知参数的CRLB,计算的CRLB:
- 非线性变换会破坏估计器的有效性。线性(仿射affine)变换能够保持有效性。
即:是的有效估计器,则的有效估计器满足. - 对于非线性变换,如果数据量足够大,则估计器的有效性也可以近似保持。
3.7 拓展到矢量
- 对于向量,则无偏估计器的下界为
中的第个参数的下界为信息矩阵的转置矩阵的个元素。
其中,费雪信息矩阵为 - 两点:
- 估计参数越多,CRLB越大。
- 对不同参数的变化敏感度不同。
- 定理
正则条件——假设PDF满足
其中,期望是对求得。
下界——任何无偏估计的协方差矩阵满足
其中$\geqslant \mathbf{0} $解释为矩阵是半正定的。
费雪信息矩阵 ——
其中,导数是在的真值上计算的,数学期望是对求出的。
MVUE——对于某个维函数和矩阵,当且仅当
可求到达下界的的无偏估计。
3.8 矢量参数的变换
- 计算,是r-维函数
其中:
- 表示半正定
- 是
3.9 一般高斯情况的CRLB
- 多维高斯分布
- 数据
均值和协方差都依赖参数。
费雪信息矩阵为
其中
对于参数是标量情况
费雪信息则为
总结
[ref.]Kay S M. Fundamentals of statistical signal processing: estimation theory[M]. Prentice-Hall, Inc., 1993. [ch.1-ch.3]