問題背景
- 觀測數據:五週的火災次數為 0,1,1,0,0,共 5 次觀測,服從泊松分佈 Poisson(λ)。
- 先驗分佈:λ 的先驗分佈為無信息先驗 π(λ)∝λ1。
- 目標:求 λ 的 90% 可信區間(credible interval),即後驗分佈的 5% 和 95% 分位數。
步驟 1:似然函數
假設每週火災次數 xi 獨立服從 Poisson(λ),對於觀測數據 x1,x2,…,xn,似然函數為:
L(λ∣x)=i=1∏nxi!λxie−λ=∏xi!λ∑xie−nλ
給定數據:x1=0,x2=1,x3=1,x4=0,x5=0,其中 n=5,∑xi=0+1+1+0+0=2。因此,似然函數為:
L(λ∣x)∝λ2e−5λ
(這裡忽略了常數項 ∏xi!,因為它不影響後驗分佈的形狀。)
步驟 2:先驗分佈
給定的先驗分佈為 π(λ)∝λ1。這是一個無信息先驗(Jeffreys 先驗),適用於泊松分佈的參數 λ>0。
步驟 3:後驗分佈
根據貝氏定理,後驗分佈為:
π(λ∣x)∝L(λ∣x)⋅π(λ)∝λ2e−5λ⋅λ−1=λ2−1e−5λ=λe−5λ
這與伽馬分佈 Gamma(α,β) 的密度函數形式一致,其中:
- 形狀參數 α=2(因為指數為 λ2−1=λ1)。
- 速率參數 β=5(因為指數中的係數為 −5λ)。
因此,後驗分佈為:
λ∣x∼Gamma(2,5)
其中 Gamma(α,β) 的概率密度函數為:
f(λ)=Γ(α)βαλα−1e−βλ,λ>0
這裡 α=2,β=5,Γ(2)=1。
步驟 4:計算 90% 可信區間
90% 可信區間是後驗分佈 Gamma(2,5) 的 5% 和 95% 分位數。我們需要找到 λ1 和 λ2,使得:
P(λ1≤λ≤λ2∣x)=0.9
這意味著:
P(λ≤λ1)=0.05,P(λ≤λ2)=0.95
伽馬分佈的累積分佈函數(CDF)通常需要數值方法來計算。我們可以使用伽馬分佈的分位數函數來找到 λ1 和 λ2。
在 Gamma(α,β) 中:
- α=2,β=5(速率參數)。
- 均值:E[λ]=βα=52=0.4。
- 方差:Var(λ)=β2α=522=252=0.08。
為了計算分位數,我們可以利用伽馬分佈與卡方分佈的關係:
- 如果 λ∼Gamma(α,β),則 2βλ∼χ2(2α)。
- 這裡 α=2,所以 2α=4,β=5,因此 10λ∼χ2(4)。
我們需要找到 χ2(4) 分佈的 5% 和 95% 分位數,然後轉換回 λ。
根據標準卡方分佈表(自由度為 4):
- χ0.052(4)≈0.7107
- χ0.952(4)≈9.4877
轉換回 λ:
- 下限:λ1=2βχ0.052(4)=100.7107≈0.07107
- 上限:λ2=2βχ0.952(4)=109.4877≈0.94877
因此,90% 可信區間為:
[0.071,0.949]
(保留三位小數。)
步驟 5:驗證
為了確保正確性,我們可以用數值方法(例如 Python 或 R)直接計算 Gamma(2,5) 的分位數。使用 Python 的 scipy.stats.gamma:
python
from scipy.stats import gamma
alpha = 2
beta = 5
lower = gamma.ppf(0.05, a=alpha, scale=1/beta)
upper = gamma.ppf(0.95, a=alpha, scale=1/beta)
print(lower, upper)
這會給出相似的結果,確認我們的計算正確。
最終答案
λ 的 90% 可信區間為:
[0.071,0.949]
沒有留言:
張貼留言