概率(密度)表达给定下样本随机向量的可能性,而似然表达了给定样本下参数(相对于另外的参数)为真实值的可能性。
常说的概率是指给定参数后,预测即将发生的事件的可能性。
而似然概率正好与这个过程相反,我们关注的量不再是事件的发生概率,而是已知发生了某些事件,我们希望知道参数应该是多少。
最大似然概率,就是在已知观测的数据的前提下,找到使得似然概率最大的参数值。
参数估计
最大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。最大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
求最大似然函数估计值的一般步骤:
(1) 写出似然函数
(2) 对似然函数取对数,并整理
(3) 求导数
(4) 解似然方程
似然函数经常使用log-likelihood
为什么要使用对数似然函数?(https://zhuanlan.zhihu.com/p/35646059)
1.如果假设条件是独立同分布,那么似然函数往往是连乘的形式,这样子求偏导数,不容易;通过取对数的形式将连乘变为求和
2.概率值是小数,多个连乘的情况下,容易造成下溢
似然函数:(也就是说似然函数不是固定的,是关于参数的一个函数表达式)