Taylor's Home: 貝氏 Vs 經典

好的，我不會在畫布中生成任何內容。以下是對您之前要求的進一步說明，確保所有內容以純文字形式呈現，並以教科書的形式完整整理貝氏估計與經典估計的比較，使用智力測驗例子：觀測數據 \( X \sim N(\theta, 100) \)，先驗分佈 \( \theta \sim N(100, 225) \)，單次測驗結果 \( X = 115 \)，並聚焦於估計 \(\theta\)、均方誤差（MSE）、標準誤（SE）以及兩者的關係。

---

# 貝氏估計與經典估計：以智力測驗為例的比較

## 1. 問題背景

假設我們進行一次智力測驗，測驗分數 \( X \) 服從正態分佈 \( X \sim N(\theta, 100) \)，其中 \(\theta\) 是未知的真實平均分數，方差 \(\sigma^2 = 100\)。我們有以下信息：

- **觀測數據**：單次測驗分數 \( X = 115 \)，樣本數 \( n = 1 \)。

- **先驗分佈**：根據歷史數據或專家意見，假設 \(\theta\) 服從正態分佈 \( \theta \sim N(100, 225) \)，即先驗均值 \(\mu_0 = 100\)，先驗方差 \(\sigma_0^2 = 225\)。

- **目標**：估計 \(\theta\)，計算其均方誤差（MSE）和標準誤（SE），並比較貝氏估計與經典估計的差異。

本章將詳細推導經典估計與貝氏估計的結果，分析它們在點估計、誤差衡量（MSE 和 SE）以及區間估計上的差異，並闡述兩者的關係。

---

## 2. 經典估計（頻率學派）

### 2.1 方法

經典估計（也稱頻率學派估計）假設參數 \(\theta\) 是固定的未知常數，僅依賴觀測數據進行推斷。我們使用**最大似然估計（MLE）**來估計 \(\theta\)。

對於正態分佈 \( X \sim N(\theta, \sigma^2) \)，似然函數為：

L(\theta | X) = \frac{1}{\sqrt{2\pi \sigma^2}} \exp\left(-\frac{(X - \theta)^2}{2\sigma^2}\right)

最大化似然函數等價於最小化 \((X - \theta)^2\)。對於單次觀測 \( X = 115 \)，樣本均值為：

\bar{X} = 115

因此，MLE 估計為：

\hat{\theta}_{\text{MLE}} = \bar{X} = 115

### 2.2 標準誤（SE）

標準徒（Standard Error, SE）衡量估計量 \(\hat{\theta}\) 的變異性，計算公式為：

SE = \sqrt{\text{Var}(\hat{\theta})} = \frac{\sigma}{\sqrt{n}}

其中：

- \(\sigma^2 = 100\)，所以 \(\sigma = \sqrt{100} = 10\)；

- 樣本數 \( n = 1 \)；

代入計算：

SE = \frac{10}{\sqrt{1}} = 10

### 2.3 均方誤差（MSE）

均方誤差（MSE）衡量估計量 \(\hat{\theta}\) 與真實參數 \(\theta\) 之間誤差的期望值，公式為：

\text{MSE}(\hat{\theta} | X) = \text{Var}(\hat{\theta} | X) + [\text{Bias}(\hat{\theta} | X)]^2

其中：

- **方差**：因為 \(\hat{\theta} = \bar{X} \sim N(\theta, \sigma^2 / n)\)，所以：

\text{Var}(\hat{\theta} | X) = \text{Var}(\bar{X}) = \frac{\sigma^2}{n} = \frac{100}{1} = 100

- **偏差**：因為 \(\bar{X}\) 是無偏估計量，期望值為：

E(\hat{\theta}) = E(\bar{X}) = \theta

所以：

\text{Bias}(\hat{\theta} | X) = E(\hat{\theta}) - \theta = \theta - \theta = 0

- **MSE**：

\text{MSE}(\hat{\theta} | X) = 100 + 0 = 100

### 2.4 置信區間

95% 置信區間（Confidence Interval）使用正態近似：

\hat{\theta} \pm 1.96 \cdot SE

代入數值：

115 \pm 1.96 \cdot 10 = 115 \pm 19.6 = (95.4, 134.6)

**解釋**：如果重複多次這樣的實驗，95% 的置信區間會包含真實的 \(\theta\)。這是一個基於長期頻率的陳述，不表示 \(\theta\) 有 95% 的概率在 \([95.4, 134.6]\) 內。

### 2.5 經典估計結果

- 點估計：\(\hat{\theta} = 115\)

- 標準誤：\( SE = 10 \)

- MSE：\( 100 \)

- 95% 置信區間：\([95.4, 134.6]\)

---

## 3. 貝氏估計

### 3.1 方法

貝氏估計假設 \(\theta\) 是隨機變量，具有先驗分佈。給定先驗 \(\theta \sim N(100, 225)\) 和觀測數據 \( X \sim N(\theta, 100) \)，我們使用貝氏定理計算後驗分佈：

P(\theta | X) \propto P(X | \theta) \cdot P(\theta)

因為正態分佈具有共軛性質，當先驗和似然均為正態分佈時，後驗分佈仍是正態分佈 \( \theta | X \sim N(\mu_{\text{post}}, \sigma_{\text{post}}^2) \)。後驗均值和方差的公式如下：

#### 3.1.1 後驗均值

\mu_{\text{post}} = \frac{\frac{\mu_0}{\sigma_0^2} + \frac{n \bar{X}}{\sigma^2}}{\frac{1}{\sigma_0^2} + \frac{n}{\sigma^2}}

代入數值：

- 先驗：\(\mu_0 = 100\), \(\sigma_0^2 = 225\)；

- 數據：\(\sigma^2 = 100\), \( n = 1 \), \(\bar{X} = 115\)。

- 分母：

\frac{1}{\sigma_0^2} + \frac{n}{\sigma^2} = \frac{1}{225} + \frac{1}{100} = \frac{100 + 225}{225 \cdot 100} = \frac{325}{22500} = \frac{13}{900}

- 分子：

\frac{\mu_0}{\sigma_0^2} = \frac{100}{225} = \frac{4}{9} \approx 0.4444

\frac{n \bar{X}}{\sigma^2} = \frac{1 \cdot 115}{100} = 1.15

\frac{4}{9} + 1.15 \approx 0.4444 + 1.15 = 1.5944

- 後驗均值：

\mu_{\text{post}} = \frac{1.5944}{\frac{13}{900}} = 1.5944 \cdot \frac{900}{13} \approx 110.2615

#### 3.1.2 後驗方差

\sigma_{\text{post}}^2 = \frac{1}{\frac{1}{\sigma_0^2} + \frac{n}{\sigma^2}}

代入數值：

\sigma_{\text{post}}^2 = \frac{1}{\frac{1}{225} + \frac{1}{100}} = \frac{1}{\frac{13}{900}} = \frac{900}{13} \approx 69.2308

後驗標準差：

\sigma_{\text{post}} = \sqrt{69.2308} \approx 8.3187

因此，後驗分佈為：

\theta | X \sim N(110.2615, 69.2308)

貝氏估計通常取後驗均值作為點估計：

\hat{\theta}_{\text{Bayes}} \approx 110.26

### 3.2 均方誤差（MSE）

在貝氏框架中，當使用後驗均值作為估計量時，MSE 等於後驗方差（因為後驗均值是條件期望，無偏於後驗分佈）：

\text{MSE}_{\text{Bayes}} = \sigma_{\text{post}}^2 \approx 69.2308

### 3.3 可信區間

95% 可信區間（Credible Interval）使用後驗分佈的分位數：

\mu_{\text{post}} \pm 1.96 \cdot \sigma_{\text{post}}

代入數值：

110.2615 \pm 1.96 \cdot 8.3187 \approx 110.2615 \pm 16.3047 = (93.9568, 126.5662)

**解釋**：根據後驗分佈，\(\theta\) 有 95% 的概率落在 \([93.96, 126.57]\) 內，這是一個直接的概率陳述。

### 3.4 貝氏估計結果

- 點估計：\(\hat{\theta} \approx 110.26\)

- 後驗標準差：\(\sigma_{\text{post}} \approx 8.32\)

- MSE：\( \approx 69.2308 \)

- 95% 可信區間：\([93.96, 126.57]\)

---

## 4. 比較與分析

以下將經典估計與貝氏估計的結果進行比較，並分析它們在點估計、誤差衡量（MSE 和 SE）以及區間估計上的差異。

### 4.1 結果比較

| | 經典估計 | 貝氏估計 |

|---|---|---|

| **點估計** | 115 | 110.26 |

| **方差** | 100 | 69.2308 |

| **標準誤/標準差** | 10 | 8.32 |

| **MSE** | 100 | 69.2308 |

| **95% 區間** | [95.4, 134.6] | [93.96, 126.57] |

| **區間解釋** | 長期頻率（95% 的區間包含真值） | 直接概率（95% 概率 \(\theta\) 在區間內） |

### 4.2 差異分析

1. **點估計**：

- **經典估計**：\(\hat{\theta} = 115\)，直接使用樣本均值 \(\bar{X} = 115\)，完全依賴觀測數據。

- **貝氏估計**：\(\hat{\theta} \approx 110.26\)，是先驗均值 (\(\mu_0 = 100\)) 和觀測值 (\(\bar{X} = 115\)) 的加權平均。由於樣本數 \( n = 1 \)，數據信息有限，先驗分佈 (\(\sigma_0^2 = 225\)) 對結果影響較大，將估計值拉向 100。

2. **標準誤/標準差**：

- **經典估計**：標準誤 \( SE = 10 \)，由數據方差 \(\sigma^2 / n = 100 / 1 = 100\) 的平方根計算，反映數據的變異性。

- **貝氏估計**：後驗標準差 \(\sigma_{\text{post}} \approx 8.32\)，低於經典估計的 SE，因為先驗信息縮小了不確定性。後驗方差 \(\sigma_{\text{post}}^2 \approx 69.2308\) 是先驗方差 (\( 225 \)) 和數據方差 (\( 100 \)) 的調和結果。

3. **均方誤差（MSE）**：

- **經典估計**：\(\text{MSE} = 100\)，等於估計量方差，因為 \(\hat{\theta} = \bar{X}\) 無偏 (\(\text{Bias} = 0\))。

- **貝氏估計**：\(\text{MSE} \approx 69.2308\)，等於後驗方差，低於經典估計，因為先驗信息減少了估計的不確定性。雖然貝氏估計可能引入偏差（取決於真實 \(\theta\) 與先驗均值 100 的差異），但總體 MSE 較低，反映了偏差-方差的權衡。

4. **區間估計**：

- **經典估計**：95% 置信區間 \([95.4, 134.6]\) 較寬，反映了小樣本 (\( n = 1 \)) 的高不確定性。置信區間的解釋基於長期頻率。

- **貝氏估計**：95% 可信區間 \([93.96, 126.57]\) 較窄，因為先驗信息減少了不確定性。可信區間提供直接的概率解釋，適合決策分析。

### 4.3 MSE 與 SE 的關係

- **經典估計**：

- MSE 公式：

\text{MSE}(\hat{\theta} | X) = \text{Var}(\hat{\theta} | X) + [\text{Bias}(\hat{\theta} | X)]^2

因為 \(\hat{\theta} = \bar{X}\) 無偏，\(\text{Bias} = 0\)，所以：

\text{MSE} = \text{Var}(\hat{\theta}) = \frac{\sigma^2}{n} = 100

- 標準誤：

SE = \sqrt{\text{Var}(\hat{\theta})} = \sqrt{100} = 10

- 關係：當估計量無偏時，\(\text{MSE} = SE^2 = 10^2 = 100\)。

- **貝氏估計**：

- MSE 等於後驗方差，因為後驗均值是條件期望，無偏於後驗分佈：

\text{MSE}_{\text{Bayes}} = \sigma_{\text{post}}^2 \approx 69.2308

- 後驗標準差（類似於 SE）：

\sigma_{\text{post}} = \sqrt{69.2308} \approx 8.32

- 關係：\(\text{MSE}_{\text{Bayes}} = \sigma_{\text{post}}^2 = (8.32)^2 \approx 69.2308\)。

---

## 5. 結論

- **經典估計**：

- 點估計 \(\hat{\theta} = 115\)，標準誤 \( SE = 10 \)，MSE = 100，95% 置信區間 \([95.4, 134.6]\)。

- **優點**：無需先驗，計算簡單，結果客觀，特別適合大樣本或標準化問題。

- **缺點**：在小樣本 (\( n = 1 \)) 時，MSE 和 SE 較大，反映高不確定性，且無法利用外部信息。

- **貝氏估計**：

- 點估計 \(\hat{\theta} \approx 110.26\)，後驗標準差 \(\sigma_{\text{post}} \approx 8.32\)，MSE \(\approx 69.2308\)，95% 可信區間 \([93.96, 126.57]\)。

- **優點**：結合先驗信息 \( \theta \sim N(100, 225) \)，降低 MSE 和不確定性，特別在小樣本時表現更好。可信區間的概率解釋直觀。

- **缺點**：結果依賴先驗選擇，若先驗不準確，可能引入偏差。

- **MSE 與 SE 的關係**：

- 在經典估計中，當估計量無偏時，\(\text{MSE} = SE^2\)，本例中 \(\text{MSE} = 100 = 10^2\)。

- 在貝氏估計中，MSE 等於後驗方差，後驗標準差類似於 SE，但因先驗信息影響，數值較小 (\(\text{MSE} \approx 69.2308 = (8.32)^2\))。

---

## 6. 實際應用

- **經典估計**：適用於數據充足、需要客觀結果的場景，如標準化測驗、質量控制或大規模調查。本例中，單次測驗 (\( n = 1 \)) 導致較高的 MSE 和 SE，顯示小樣本的局限性。

- **貝氏估計**：適用於有歷史數據或專家知識的場景，如醫療試驗、機器學習或小樣本分析。本例中的先驗 \(\theta \sim N(100, 225)\) 假設平均智力分數接近 100（符合常見標準化測驗），結合單次觀測 \( X = 115 \)，提供了更穩定的估計（MSE 較低）。

若先驗分佈不準確（例如，假設 \(\theta \sim N(150, 225)\)），貝氏估計可能偏離真實 \(\theta\)，需謹慎選擇先驗。本例的先驗合理，因為智力測驗的平均分數通常標準化為 100。

---

## 7. 總結

通過智力測驗例子，我們展示了經典估計和貝氏估計在估計 \(\theta\) 及其誤差上的差異：

- 經典估計依賴數據，簡單但在小樣本時不確定性高（MSE = 100，SE = 10）。

- 貝氏估計結合先驗和數據，降低不確定性（MSE \(\approx 69.2308\)，後驗標準差 \(\approx 8.32\)），但結果受先驗影響。

- MSE 與 SE 的關係在無偏估計下為 \(\text{MSE} = SE^2\)，在貝氏框架中則為 \(\text{MSE} = \sigma_{\text{post}}^2\)。

如果需要進一步推導（如不同先驗的影響、計算偏差或後驗分佈的視覺化），請告知！

Taylor's Home

2025年7月14日星期一

貝氏 Vs 經典

沒有留言:

張貼留言

2025年7月14日 星期一

貝氏 Vs 經典

沒有留言:

張貼留言

2025年7月14日星期一