最大似然估计(MLE)gydF4y2Ba

最大似然估计(MLE)gydF4y2Ba是一种利用观测数据估计给定分布参数的技术。例如，如果已知一个种群遵循gydF4y2Ba正态分布gydF4y2Ba但是,gydF4y2Ba的意思是gydF4y2Ba而且gydF4y2Ba方差gydF4y2Ba， MLE可以用来估计他们使用有限的样本的人口，通过找到特定的平均值和方差的值，使观察是最有可能的结果已经发生。gydF4y2Ba

MLE在许多上下文中都很有用，从gydF4y2Ba计量经济学gydF4y2Ba到核磁共振成像到卫星成像。它也与gydF4y2Ba贝叶斯统计gydF4y2Ba．gydF4y2Ba

正式的定义gydF4y2Ba

让gydF4y2Ba $X_1 x_2 \ldots x_ngydF4y2Ba$ 观察gydF4y2Ba $ngydF4y2Ba$ 独立的gydF4y2Ba同分布gydF4y2Ba随机变量gydF4y2Ba从gydF4y2Ba概率分布gydF4y2Ba $f_0gydF4y2Ba$ ,在那里gydF4y2Ba $f_0gydF4y2Ba$ 已知是来自于gydF4y2Ba家庭gydF4y2Ba的分布gydF4y2Ba $fgydF4y2Ba$ 这取决于一些参数gydF4y2Ba $\θgydF4y2Ba$ ．例如,gydF4y2Ba $f_0gydF4y2Ba$ 可能是来自某某家族的gydF4y2Ba正态分布gydF4y2Ba $fgydF4y2Ba$ ，这取决于参数gydF4y2Ba $\σgydF4y2Ba$ (标准差)和gydF4y2Ba $\μgydF4y2Ba$ (平均),gydF4y2Ba $X_1 x_2 \ldots x_ngydF4y2Ba$ 会是来自gydF4y2Ba $f_0gydF4y2Ba$ ．gydF4y2Ba

MLE的目标是最大化gydF4y2Ba似然函数gydF4y2Ba：gydF4y2Ba

$L =f(x_1, x_2， \ldots, x_n | \theta)=f(x_1 | \theta) \乘以f(x_2 | \theta) \乘以\ldots \乘以f(x_n | \theta)gydF4y2Ba$

通常,gydF4y2Ba平均对数似gydF4y2Ba函数更容易使用:gydF4y2Ba

$\帽子{\魔法}= \压裂{1}{n} \ log L = \压裂{1}{n} \ sum_ {i = 1} ^ n \ log f (x_i | \θ)gydF4y2Ba$

MLE最终有几种工作方式:它可以发现参数gydF4y2Ba $\θgydF4y2Ba$ 根据给定的观测，它可以发现多个使似然函数最大化的参数，它可以发现不存在最大值，甚至可以发现不存在到最大值和的封闭形式gydF4y2Ba数值分析gydF4y2Ba找到MLE是必要的。gydF4y2Ba

尽管mle不一定是最优的(在某种意义上，有其他估计算法可以获得更好的结果)，但它有几个吸引人的特性，其中最重要的是gydF4y2Ba一致性gydF4y2Ba: mle序列(在不断增加的观测数量上)将gydF4y2Ba收敛gydF4y2Ba转换为参数的真值。下面是一个例子，与其他估计算法相比，MLE可能会给出略差的结果:gydF4y2Ba

例子gydF4y2Ba

最简单的情况是当分布和gydF4y2Ba参数空间gydF4y2Ba(参数的可能值)是离散的，这意味着每个参数都有有限数量的可能性。在这种情况下，MLE可以通过显式地尝试所有可能性来确定。gydF4y2Ba

一枚(可能不公平)硬币被抛100次，有61个正面朝上。硬币要么有概率gydF4y2Ba $\压裂{1},{3}\压裂{1}{2}gydF4y2Ba$ ,或gydF4y2Ba $\压裂{2}{3}gydF4y2Ba$ 每次抛一个头。这三个中哪一个是MLE?gydF4y2Ba

这里，我们讨论的分布是gydF4y2Ba二项分布gydF4y2Ba，只有一个参数gydF4y2Ba $pgydF4y2Ba$ ．因此gydF4y2Ba

${公关}\ \文本左(H = 61 | p = \压裂{1}{3}\右)= \ binom{100}{61} \离开(\压裂{1}{3}\右)^{61}\离开(1 - \压裂{1}{3}\右)^{39}\大约9.6 \ * 10 ^ {9}gydF4y2Ba$ ${公关}\ \文本左(H = 61 | p = \压裂{1}{2}\右)= \ binom{100}{61} \离开(\压裂{1}{2}\右)^{61}\离开(1 - \压裂{1}{2}\右)^{39}\约0.007gydF4y2Ba$ ${公关}\ \文本左(H = 61 | p = \压裂{2}{3}\右)= \ binom{100}{61} \离开(\压裂{2}{3}\右)^{61}\离开(1 - \压裂{2}{3}\右)^{39}\大约.040gydF4y2Ba$

因此MLE为gydF4y2Ba $p = \压裂{2}{3}gydF4y2Ba$ ．gydF4y2Ba

不幸的是，参数空间很少是离散的，并且gydF4y2Ba微积分gydF4y2Ba对于连续参数空间通常是必需的。例如,gydF4y2Ba

一枚(可能不公平)硬币被抛100次，有61个正面朝上。当之前对硬币一无所知时，MLE是什么?gydF4y2Ba

再一次,gydF4y2Ba二项分布gydF4y2Ba该模型是否使用单个参数gydF4y2Ba $pgydF4y2Ba$ ．似然函数为gydF4y2Ba

${公关}\文本(H = 61 | p) = \ binom {100} {61} p ^ {61} (1 - p) ^ {39}gydF4y2Ba$

最大化gydF4y2Ba $0 \leq p \leq 1gydF4y2Ba$ ．这可以通过分析gydF4y2Ba临界点gydF4y2Ba这个函数，当gydF4y2Ba

$\开始{对齐}\压裂{d} {dp} \ binom {100} {61} p ^ {61} (1 - p) ^ {39} & = \ binom{100}{61} \左(61 p ^ {60} (1 - p) ^ -39 p {39} ^ {61} (1 - p) ^ {38} \) \ \ & = \ binom {100} {61} p ^ {60} (1 - p) ^ {38} (61 (1 - p) -39 p) \ \ & = \ binom {100} {61} p ^ {60} (1 - p) ^ {38} (61 - 100 - p) \ \ & = 0 \{对齐}结束gydF4y2Ba$

所以要么gydF4y2Ba $p = 0, \压裂{61}{100}gydF4y2Ba$ ，或1。因此gydF4y2Ba $p = \压裂{61}{100}gydF4y2Ba$ 为MLE，否则似然函数为0。gydF4y2Ba

这个逻辑很容易概括:如果gydF4y2Ba $kgydF4y2Ba$ 的gydF4y2Ba $ngydF4y2Ba$ 二项试验结果为正面，则MLE为gydF4y2Ba $\压裂{k} {n}gydF4y2Ba$ ．gydF4y2Ba

有关……gydF4y2Ba

内容gydF4y2Ba

一枚(可能不公平)硬币被抛100次，有61个正面朝上。当之前对硬币一无所知时，MLE是什么?gydF4y2Ba