1. 极大似然估计
假设有一枚硬币,我们想确定这枚硬币是否质地均匀。即想知道抛这枚硬币,正反面出现的概率各是多少?于是我们将这枚硬币抛了10次,得到的数据x0是:反正正正正反正正正反。我们想求的正面概率θ是模型参数,而抛硬币模型可以假设服从二项分布。
那么,出现实验结果x0(反正正正正反正正正反)的似然函数是多少呢?
而极大似然估计,顾名思义,就是要最大化这个函数。
我们可以画出f(θ)的图像:
从图像中可以观察到,θ=0.7时,函数取值最大。也就是说,我们通过最大化似然函数后,得到了模型参数的值,相应的,正反面出现的概率也就求出了。
极大似然估计需要保证所有的采样都是独立同分布的。
2. 容易混淆的概念极大似然估计就是最大似然估计。
极大似然概率这个名词描述是不准确的,笔者查阅了整个英文互联网,都没有找到 ‘Maximum likelihood probability’这个词。所以,不存在“极大似然概率”这个说法。
3. 最大后验概率与极大似然估计相比,使用最大后验概率估计θ时,首先认为θ本身存在一个分布,即θ有先验分布。
还是以判断一枚硬币是否质地均匀为例。假设正面概率θ满足均值为0.5,方差为1的先验分布,即:
那么,将这枚硬币抛了10次,得到的数据x0是:反正正正正反正正正反。
因为考虑了先验分布,所以实验结果x0的函数可以表示为:
因此,我们可以通过最大化这个后验概率函数求得θ,我们可以画出f(θ)的图像:
计算得到θ = 0.696。也就是说,采用最大后验概率计算得到硬币正面朝上的概率为0.696。
4. 似然与概率分别指的什么似然: 英文单词为likelihood,有道翻译的翻译结果为:十有八九。
概率: 如果我有一枚质地均匀的硬币,那么它出现正面朝上的概率是0.5。
似然: 如果我抛一枚硬币100次,正面朝上52次,那么它十有八九是质地均匀的。
再举一个例子加深理解。 假设有人向我挑战一个“有利可图的赌博游戏”。
概率: 帮助我们计算预期的收益和损失(平均值、众数、中值、方差、信息比率、风险值、赌徒破产等等)。
似然: 帮助我们量化是否首先应该相信那些概率。
实际上,似然几乎可以等价于置信度。