2025年7月14日 星期一

觀測數據:五週的火災次數為 0 , 1 , 1 , 0 , 0 0,1,1,0,0,共 5 次觀測,服從泊松分佈 Poisson ( λ ) Poisson(λ)。

 

問題背景

  • 觀測數據:五週的火災次數為 0,1,1,0,00, 1, 1, 0, 0,共 5 次觀測,服從泊松分佈 Poisson(λ) \text{Poisson}(\lambda)
  • 先驗分佈λ\lambda 的先驗分佈為無信息先驗 π(λ)1λ\pi(\lambda) \propto \frac{1}{\lambda}
  • 目標:求 λ\lambda 的 90% 可信區間(credible interval),即後驗分佈的 5% 和 95% 分位數。

步驟 1:似然函數

假設每週火災次數 xix_i 獨立服從 Poisson(λ)\text{Poisson}(\lambda),對於觀測數據 x1,x2,,xnx_1, x_2, \ldots, x_n,似然函數為:

L(λx)=i=1nλxieλxi!=λxienλxi!L(\lambda | \mathbf{x}) = \prod_{i=1}^n \frac{\lambda^{x_i} e^{-\lambda}}{x_i!} = \frac{\lambda^{\sum x_i} e^{-n\lambda}}{\prod x_i!}

給定數據:x1=0,x2=1,x3=1,x4=0,x5=0x_1 = 0, x_2 = 1, x_3 = 1, x_4 = 0, x_5 = 0,其中 n=5n = 5xi=0+1+1+0+0=2\sum x_i = 0 + 1 + 1 + 0 + 0 = 2。因此,似然函數為:

L(λx)λ2e5λL(\lambda | \mathbf{x}) \propto \lambda^2 e^{-5\lambda}

(這裡忽略了常數項 xi!\prod x_i!,因為它不影響後驗分佈的形狀。)


步驟 2:先驗分佈

給定的先驗分佈為 π(λ)1λ\pi(\lambda) \propto \frac{1}{\lambda}。這是一個無信息先驗(Jeffreys 先驗),適用於泊松分佈的參數 λ>0\lambda > 0


步驟 3:後驗分佈

根據貝氏定理,後驗分佈為:

π(λx)L(λx)π(λ)λ2e5λλ1=λ21e5λ=λe5λ\pi(\lambda | \mathbf{x}) \propto L(\lambda | \mathbf{x}) \cdot \pi(\lambda) \propto \lambda^2 e^{-5\lambda} \cdot \lambda^{-1} = \lambda^{2-1} e^{-5\lambda} = \lambda e^{-5\lambda}

這與伽馬分佈 Gamma(α,β) \text{Gamma}(\alpha, \beta) 的密度函數形式一致,其中:

  • 形狀參數 α=2\alpha = 2(因為指數為 λ21=λ1\lambda^{2-1} = \lambda^1)。
  • 速率參數 β=5\beta = 5(因為指數中的係數為 5λ-5\lambda)。

因此,後驗分佈為:

λxGamma(2,5)\lambda | \mathbf{x} \sim \text{Gamma}(2, 5)

其中 Gamma(α,β)\text{Gamma}(\alpha, \beta) 的概率密度函數為:

f(λ)=βαΓ(α)λα1eβλ,λ>0f(\lambda) = \frac{\beta^\alpha}{\Gamma(\alpha)} \lambda^{\alpha-1} e^{-\beta\lambda}, \quad \lambda > 0

這裡 α=2\alpha = 2β=5\beta = 5Γ(2)=1\Gamma(2) = 1


步驟 4:計算 90% 可信區間

90% 可信區間是後驗分佈 Gamma(2,5)\text{Gamma}(2, 5) 的 5% 和 95% 分位數。我們需要找到 λ1\lambda_1λ2\lambda_2,使得:

P(λ1λλ2x)=0.9P(\lambda_1 \leq \lambda \leq \lambda_2 | \mathbf{x}) = 0.9

這意味著:

P(λλ1)=0.05,P(λλ2)=0.95P(\lambda \leq \lambda_1) = 0.05, \quad P(\lambda \leq \lambda_2) = 0.95

伽馬分佈的累積分佈函數(CDF)通常需要數值方法來計算。我們可以使用伽馬分佈的分位數函數來找到 λ1\lambda_1λ2\lambda_2

Gamma(α,β)\text{Gamma}(\alpha, \beta) 中:

  • α=2\alpha = 2β=5\beta = 5(速率參數)。
  • 均值:E[λ]=αβ=25=0.4E[\lambda] = \frac{\alpha}{\beta} = \frac{2}{5} = 0.4
  • 方差:Var(λ)=αβ2=252=225=0.08\text{Var}(\lambda) = \frac{\alpha}{\beta^2} = \frac{2}{5^2} = \frac{2}{25} = 0.08

為了計算分位數,我們可以利用伽馬分佈與卡方分佈的關係:

  • 如果 λGamma(α,β)\lambda \sim \text{Gamma}(\alpha, \beta),則 2βλχ2(2α)2\beta\lambda \sim \chi^2(2\alpha)
  • 這裡 α=2\alpha = 2,所以 2α=42\alpha = 4β=5\beta = 5,因此 10λχ2(4)10\lambda \sim \chi^2(4)

我們需要找到 χ2(4)\chi^2(4) 分佈的 5% 和 95% 分位數,然後轉換回 λ\lambda

根據標準卡方分佈表(自由度為 4):

  • χ0.052(4)0.7107\chi^2_{0.05}(4) \approx 0.7107
  • χ0.952(4)9.4877\chi^2_{0.95}(4) \approx 9.4877

轉換回 λ\lambda

  • 下限:λ1=χ0.052(4)2β=0.7107100.07107\lambda_1 = \frac{\chi^2_{0.05}(4)}{2\beta} = \frac{0.7107}{10} \approx 0.07107
  • 上限:λ2=χ0.952(4)2β=9.4877100.94877\lambda_2 = \frac{\chi^2_{0.95}(4)}{2\beta} = \frac{9.4877}{10} \approx 0.94877

因此,90% 可信區間為:

[0.071,0.949][0.071, 0.949]

(保留三位小數。)


步驟 5:驗證

為了確保正確性,我們可以用數值方法(例如 Python 或 R)直接計算 Gamma(2,5)\text{Gamma}(2, 5) 的分位數。使用 Python 的 scipy.stats.gamma

python
from scipy.stats import gamma
alpha = 2
beta = 5
lower = gamma.ppf(0.05, a=alpha, scale=1/beta)
upper = gamma.ppf(0.95, a=alpha, scale=1/beta)
print(lower, upper)

這會給出相似的結果,確認我們的計算正確。


最終答案

λ\lambda 的 90% 可信區間為:

[0.071,0.949]\boxed{[0.071, 0.949]}

沒有留言: