在統計學中,最大似然估計,也稱最大概似估計,是用來估計一個概率模型的參數的一種方法
通俗來講,最大似然估計是利用已知的樣本的結果,在使用某個模型的基礎上,反推最有可能導致這樣結果的模型參數值。定義
給定一個概率分布 ${displaystyle D}?$ ,已知其概率密度函數(連續分布)或概率質量函數(離散分布)為 $f_D?$,以及一個分布參數 ${displaystyle heta }?$ ,我們可以從這個分布中抽出一個具有$ {displaystyle n} ?$個值的采樣$ {displaystyle X_{1},X_{2},ldots ,X_{n}}?$,利用${displaystyle f_{D}}?$計算出其似然函數:
? $$lik( heta|x_1,...,Xn)=f_{ heta}(x_1,...x_n)$$
如何理解似然函數?? $L( heta|x)=f(x| heta)$
上述公式從兩個角度描述了某一事件發生的情況。該等式兩邊都表示這個事件發生的概率。
在給定樣本后,我們去想這個樣本出現的可能性到底有多大?在統計學上,我們認為樣本的出現是服從分布函數的,我們假設這個分布函數位$f$,里面含有參數$ heta$,對于不同的$ heta$,樣本的分布也不一樣。$f(x| heta)$ 就表示子在給定參數$ heta$的時候,x出現的概率為多少。
$L( heta|x)$則表示,在給定樣本的x的時候,存在哪一個參數$ heta$使得x出現的可能性最大。等式的意義表示給定一個參數$ heta$和一個樣本$x$的時候整個事件的可能性多大。
在這種意義上,似然函數可以理解為條件概率的逆反。在已知某個參數$ heta$時,事件A會發生的概率寫作:
? $$P(A| heta)=frac{P(A, heta)}{P( heta)}$$
然后似然函數是已知$X$對于$ heta$的函數,根據貝葉斯定理,
? $$P( heta|A)=frac{P(A| heta)P( heta)}{P(A)}$$
如何理解最大似然函數?最大似然估計:當我們知道總體的概率分布模型的時候,但是不知道概率分布函數的參數的情況下,我們用樣本來估計參數。
簡單來說,就是通過確定分布函數的參數是多少的情況下,使得我們抽的當下樣本的概率最大
對于極大似然估計采取的步驟一般為:
寫出似然函數;
如果無法直接求導的話,對似然函數取對數;
求導數,令導數為0,得到似然方程;
解似然方程,得到的參數即為所求;
1.如果假設條件是獨立同分布,那么似然函數往往是連乘的形式,這樣子求偏導數,不容易;通過取對數的形式將連乘變為求和
2.概率值是小數,多個連乘的情況下,容易造成下溢
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://specialneedsforspecialkids.com/yun/19720.html
摘要:將數據集中不含缺失值的變量稱為完全變量,數據集中含有缺失值的變量稱為不完全變量。這種程序的實施恰當地反映了由于缺失值引起的不確定性,使得統計推斷有效。 作者:xiaoyu 微信公眾號:Python數據科學 知乎:python數據分析師 showImg(https://segmentfault.com/img/remote/1460000015801387?w=1045&h=603);...
閱讀 2701·2021-09-26 10:19
閱讀 2141·2021-09-24 10:27
閱讀 2526·2021-09-01 10:42
閱讀 2307·2019-08-29 16:09
閱讀 2491·2019-08-29 15:17
閱讀 1452·2019-08-29 15:09
閱讀 638·2019-08-29 11:14
閱讀 2306·2019-08-26 13:25