似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性,概率,用于在已知一些参数的情况下,预测接下来在观测上所得到的结果;似然性,则是用于在已知某些观测所得到的结果时,对有关事物之性质的参数进行估值。
举个例子来说明:抛硬币大家一定都很熟悉 (代表正面朝上的概率,我们用H缩写正面朝上,T缩写正面朝下)
1、在概率问题中:我们是已知模型参数(这里假设),来预测抛硬币的结果。最简单的例如我们想知道抛两次硬币均正面朝上的概率是多少?
2、在似然问题中:关于模型的参数是未知的(我们不知道硬币正反面是否均匀),但已知抛硬币的结果。最简单的例如我们观察到抛了两次硬币结果均正面朝上。也就是说我们观察到一个实验现象(抛两次硬币均正面朝上),同时又我们又知道这个实验的数学模型(正面朝上的概率应该是 $\theta^2$)。
那么我们就写出这样一个似然函数:
不同于概率问题是有结论的;但似然问题最终得到了似然函数看上去没什么用。因此一般而言,似然问题都是为了解决最大似然问题的,也就是在当前观测结果下,估计参数最有可能的值
。回到上面例子中,
似然函数是,我们想最大化这个函数,也就是:
很容易能求得,当时,L可以取到最大值。也就是说如果只看到抛两次硬币结果都是正面朝上,最有可能的估计就是硬币极不均匀,两面都是正面。补充:只有当实验次数大量时,才能逐渐让趋近于合理的0.5。
为了大家更好地区分似然函数和概率函数,再多说几句。
假设一个函数为,如果令,这样就得到了一个二次函数;如果令,这样就得到了一个指数函数。可以看到二次函数和指数函数都源自一个函数,但在不同条件下拥有了不同的名称。这也被称作逆反函数。看到这里是不是就发现了似然函数也是概率函数的逆反,原函数都是,当已知时,它是概率函数;当已知时,它是似然函数。