Estimation Theory [Steven M. Kay] 学习笔记


文章目录

  • 前前言
  • Estimation Theory
  • 前言
  • Chapter 1
  • 1.2 估计的数学问题
  • Chapter 2 最小方差无偏估计
  • 2.1&2.2
  • 2.3 无偏估计
  • 2.4 最小方差准则
  • 2.5 MVU的存在性
  • 2.6 确定最小方差无偏估计
  • 2.7 拓展到矢量
  • Chapter 3
  • 3.1&3.2
  • 3.3 估计器精度考虑
  • 3.4 CRLB
  • 3.5 WGN中的一般CRLB
  • 3.6 参数变形
  • 3.7 拓展到矢量
  • 3.8 矢量参数的变换
  • 3.9 一般高斯情况的CRLB
  • 总结



前前言

#个人学习笔记 #未考虑自己以外的读者体验 #有错请指正 教材:Steven M. Kay, Fundamentals of statistical signal processing: estimation theory[M]. Prentice-Hall, Inc., 1993.


Estimation Theory

前言

  • primary focas: 获得可以在数字计算机上运算的最优估计算法
  • data sets 是连续时间信号的采样,或者数据点序列
  • 前序学科:数字信号处理、概率和随机过程、线性和矩阵算数
  • overview:2-9章是经典估计,10-13是Bayesian估计。先讨论标量参数,再拓展到矢量参数。

Chapter 1

1.2 估计的数学问题

  • PDF以未知数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计为参数。因此有一族PDF,当参数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计不同,数据集合(data set)的值不同。
    用分号表示这种关系:
    iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_03
    因此,可以根据iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_04的值推断出iOS 获取当前窗口的宽度 in the distance they saw a_概率论_05的值。
  • 实际问题中并没有给出PDF,而是要选择一个不仅与问题的约束和先验知识一致的,而且在数学上也容易处理的PDF。
  • classical estimation&Bayesian estimation
  • classical estimation:感兴趣的参数假定为确定的但是未知
  • Bayesian estimation:感兴趣的参数是随机变量
    如:先验地知道,感兴趣的参数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_06在是iOS 获取当前窗口的宽度 in the distance they saw a_概率论_07中的一个随机变量,iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_06不再是一个确定的参数,而且指定PDF,iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_06即可在iOS 获取当前窗口的宽度 in the distance they saw a_概率论_07之间均匀分布。
    则数据由联合PDF描述:

iOS 获取当前窗口的宽度 in the distance they saw a_概率论_11

其中,iOS 获取当前窗口的宽度 in the distance they saw a_概率论_12是先验PDF,概括了在数据观测以前关于iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的先验知识,iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_14是条件PDF,概括了在已知iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的条件下由数据iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_04提供的知识。

Chapter 2 最小方差无偏估计

2.1&2.2

  • 利用最小均方误差MSE(通常导出的是不可实现的估计量)作为更为自然的误差准则
  • 最小方差无偏估计(MVU)存在:利用Cramer-Rao Bound和充分统计概念,求出估计器
    MVU不存在:更多限制条件(数据为线性数据)的估计器更容易实现,但是是次优的评估器

2.3 无偏估计

  • 定义:参数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计是在区间iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_18上的任何值,无论iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的真值是多少,估计量的均值都等于真值。
    数学表示:如果
    iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_20
    那么估计器iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_21是无偏的,其中iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_22表示iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的可能取值范围。注:对所有iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_06iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_25
  • iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_26,其中iOS 获取当前窗口的宽度 in the distance they saw a_概率论_27,这要求
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_28
  • 如果估计器是有偏的,则偏差定义为
    iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_29

2.4 最小方差准则

  • 均方误差mean square error定义
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_30
  • 任何与偏差iOS 获取当前窗口的宽度 in the distance they saw a_学习_31有关的估计器都不可实现。
  • mse是不可实现的估计器,因为不可写成数据的唯一函数。
  • MSE不可用 iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_32 约束iOS 获取当前窗口的宽度 in the distance they saw a_学习_33,求iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_34最小的估计器。 iOS 获取当前窗口的宽度 in the distance they saw a_概率论_35最小方差无偏估计MVU

2.5 MVU的存在性

  • MVU不一定存在

iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_36

2.6 确定最小方差无偏估计

  1. 确定CRLB,然后检查是否有iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_21满足CRLB(chapter3、4)
  2. 应用RBLS定理(chpter5)
  3. 进一步限制不仅是无偏的们还是线性的,然后在这些限制中找出最小方差无偏估计(chapter6)

2.7 拓展到矢量

  • 未知参数矢量为iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_38,则无偏估计器iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_39满足
    iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_40
    定义
    iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_41
    也可定义为
    iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_42

Chapter 3

3.1&3.2

  • CRLB可以确定一个estimator是MVU,或者给估计器性能比较一个benchmark。
  • 如果不存在可以到达CRLB的估计器,可以渐进达到(in chapter 7)
  1. 标量参数的CRLB(3.6),如果满足(3.7)则可以达到下界;
  2. 另一种确定CRLB(3.12)
  3. 估计参数是一个函数时CRLB(3.16)

3.3 估计器精度考虑

  • 估计精度与PDF直接相关:PDF对参数的依赖性越强,所得估计精度越高。
  • PDF作为未知参数的函数时(iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_43固定),为似然函数。
  • 似然函数的尖锐程度决定了估计未知参数的精度。用对数似然函数的负二阶导数度量尖锐性。
    对数似然函数的平均曲率:
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_44

3.4 CRLB

  • 定理:
    正则条件——假设PDFiOS 获取当前窗口的宽度 in the distance they saw a_机器学习_45满足
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_46
    其中,期望是对iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_47求得。
    下界——则任何无偏估计器iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_21的方差一定满足
    iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_49
    其中,导数是在iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的真值处计算。
    MVUE——对于某个函数iOS 获取当前窗口的宽度 in the distance they saw a_概率论_51iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_52,当且仅当
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_53
    时,对所有iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计达到下界的unbiased estimator可求。这个估计器就是iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_55,且是MVUE,最小方差是iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_56.
  • 上面的数学期望还可以由下式给出
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_57
  • Fisher Information——iOS 获取当前窗口的宽度 in the distance they saw a_学习_58
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_59
    直观理解:信息越多,下限越低。具有信息测度的基本性质:
  1. 非负的
  2. 独立观测是可加的
  • 对于无法达到CRLB下限条件的例子中,不存在无偏且达到CRLB的估计器。但是MVU仍可能存在,目前只是无法确定MVU存在与否,Chapter5的充分统计量将解决此条件下MVU如果存在并如何求问题。
  • Efficient——达到CRLB的估计器称为efficient。
  • 另一种CRLB表示:
    iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_60
    因为恒等式iOS 获取当前窗口的宽度 in the distance they saw a_学习_61
  • 由于fisher信息对于独立观测是可加的,则对iOS 获取当前窗口的宽度 in the distance they saw a_概率论_62个IID观测的CRLB是单次观测的iOS 获取当前窗口的宽度 in the distance they saw a_学习_63

3.5 WGN中的一般CRLB

  • Example:iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_64
  • Example3.5:iOS 获取当前窗口的宽度 in the distance they saw a_学习_65

3.6 参数变形

  • 已知参数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的CRLB,计算iOS 获取当前窗口的宽度 in the distance they saw a_学习_67的CRLB:
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_68
  • 非线性变换会破坏估计器的有效性。线性(仿射affine)变换能够保持有效性。
    即:iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_21iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计的有效估计器,则iOS 获取当前窗口的宽度 in the distance they saw a_学习_71的有效估计器满足iOS 获取当前窗口的宽度 in the distance they saw a_学习_72.
  • 对于非线性变换,如果数据量足够大,则估计器的有效性也可以近似保持。

iOS 获取当前窗口的宽度 in the distance they saw a_学习_73

3.7 拓展到矢量

  • 对于向量iOS 获取当前窗口的宽度 in the distance they saw a_概率论_74,则无偏估计器iOS 获取当前窗口的宽度 in the distance they saw a_学习_75的下界为
    iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_76
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_77中的第iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_78个参数的下界为信息矩阵的转置矩阵iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_79个元素。
    其中,费雪信息矩阵iOS 获取当前窗口的宽度 in the distance they saw a_概率论_80
    iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_81
  • 两点:
  1. 估计参数越多,CRLB越大。
  2. iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_82对不同参数的变化敏感度不同。
  • 定理
    正则条件——假设PDFiOS 获取当前窗口的宽度 in the distance they saw a_概率论_83满足
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_84
    其中,期望是对iOS 获取当前窗口的宽度 in the distance they saw a_概率论_83求得。
    下界——任何无偏估计iOS 获取当前窗口的宽度 in the distance they saw a_概率论_86的协方差矩阵满足
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_87
    其中$\geqslant \mathbf{0} $解释为矩阵是半正定的。
    费雪信息矩阵 iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_88——
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_89
    其中,导数是在iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_90的真值上计算的,数学期望是对iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_91求出的。
    MVUE——对于某个iOS 获取当前窗口的宽度 in the distance they saw a_学习_92维函数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_93iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_94矩阵iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_95,当且仅当
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_96
    可求到达下界的iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_97的无偏估计iOS 获取当前窗口的宽度 in the distance they saw a_学习_98

3.8 矢量参数的变换

  • 计算iOS 获取当前窗口的宽度 in the distance they saw a_iOS 获取当前窗口的宽度_99iOS 获取当前窗口的宽度 in the distance they saw a_概率论_100是r-维函数
    iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_101
    其中:
  1. iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_102表示半正定
  2. iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_103iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_104

iOS 获取当前窗口的宽度 in the distance they saw a_机器学习_105

3.9 一般高斯情况的CRLB

  • 多维高斯分布
  • 数据
    iOS 获取当前窗口的宽度 in the distance they saw a_概率论_106
    均值和协方差都依赖参数iOS 获取当前窗口的宽度 in the distance they saw a_学习_77
    费雪信息矩阵
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_108
    其中
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_109
    对于参数iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计是标量情况
    iOS 获取当前窗口的宽度 in the distance they saw a_学习_111
    费雪信息则为
    iOS 获取当前窗口的宽度 in the distance they saw a_无偏估计_112

总结

[ref.]Kay S M. Fundamentals of statistical signal processing: estimation theory[M]. Prentice-Hall, Inc., 1993. [ch.1-ch.3]