2025年7月31日 星期四

泊松分佈與指數分佈的關係

 

泊松分佈與指數分佈的關係

1. 引言

泊松分佈和指數分佈是概率論與統計學中描述隨機過程的重要分佈,特別是在泊松過程(Poisson Process)的框架下。這兩個分佈分別從不同角度描述隨機事件的行為:泊松分佈關注固定時間或空間內事件發生的次數,指數分佈則關注相鄰事件之間的時間間隔。本節將詳細闡述它們的定義、數學性質、相互關係,以及在泊松過程中的角色。


2. 泊松過程的定義

泊松過程是一種描述隨機事件在連續時間或空間內以固定平均速率發生之行為的數學模型。假設事件以平均速率 λ\lambda(每單位時間或空間的事件數)發生,泊松過程具有以下特性:

  1. 獨立性:在不重疊的時間或空間區間內,事件發生次數相互獨立。
  2. 穩定性:事件發生的平均速率 λ\lambda 不隨時間或空間變化。
  3. 無同時發生:在極短的時間間隔內,發生多於一個事件的機率趨近於零。
  4. 無記憶性:事件發生的時間間隔不依賴於之前的歷史。

在泊松過程中,泊松分佈和指數分佈分別描述了事件次數和等待時間的隨機特性。


3. 泊松分佈

3.1 定義

泊松分佈是一個離散機率分佈,用於描述在固定時間間隔 tt 或空間範圍內,隨機事件發生次數 XX 的機率。其機率質量函數(Probability Mass Function, PMF)為:

P(X=k)=(λt)keλtk!,k=0,1,2,P(X = k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}, \quad k = 0, 1, 2, \dots

其中:

  • XX:表示在時間間隔 tt 內事件發生的次數。
  • λ\lambda:單位時間內事件的平均發生率(次/單位時間)。
  • tt:時間間隔的長度。
  • λt\lambda t:表示在時間 tt 內預期的平均事件數。

3.2 期望值與變異數

  • 期望值:E[X]=λtE[X] = \lambda t
  • 變異數:Var(X)=λt\text{Var}(X) = \lambda t 這表明泊松分佈的均值與變異數相等,這是其特有性質。

3.3 應用實例

假設某電話交換中心每小時平均接收 10 個呼叫(λ=10\lambda = 10t=1t = 1 小時),則在 1 小時內接收 kk 個呼叫的機率為:

P(X=k)=10ke10k!P(X = k) = \frac{10^k e^{-10}}{k!}

例如,接收正好 5 個呼叫的機率為:

P(X=5)=105e105!0.0378P(X = 5) = \frac{10^5 e^{-10}}{5!} \approx 0.0378

4. 指數分佈

4.1 定義

指數分佈是一個連續機率分佈,用於描述泊松過程中相鄰兩個隨機事件之間的等待時間 TT。其機率密度函數(Probability Density Function, PDF)為:

f(t)=λeλt,t0f(t) = \lambda e^{-\lambda t}, \quad t \geq 0

其中:

  • TT:相鄰事件之間的時間間隔。
  • λ\lambda:單位時間內事件的平均發生率,與泊松分佈中的 λ\lambda 一致。

累積分佈函數(Cumulative Distribution Function, CDF)為:

P(Tt)=1eλt,t0P(T \leq t) = 1 - e^{-\lambda t}, \quad t \geq 0

4.2 期望值與變異數

  • 期望值:E[T]=1λE[T] = \frac{1}{\lambda}
  • 變異數:Var(T)=1λ2\text{Var}(T) = \frac{1}{\lambda^2} 這表示平均等待時間為 1λ\frac{1}{\lambda} 單位時間。

4.3 無記憶性

指數分佈具有無記憶性(Memoryless Property),這是其核心特性之一:

P(T>s+tT>s)=P(T>t)P(T > s + t \mid T > s) = P(T > t)

這意味著,無論已經等待了多久時間 ss,下一個事件發生的等待時間仍服從相同的指數分佈。此性質與泊松過程的隨機性相符。

4.4 應用實例

繼續以電話交換中心為例,若每小時平均接收 10 個呼叫(λ=10\lambda = 10),則相鄰兩個呼叫之間的時間間隔 TT 服從指數分佈,平均等待時間為:

E[T]=110=0.1 小時=6 分鐘E[T] = \frac{1}{10} = 0.1 \text{ 小時} = 6 \text{ 分鐘}

兩個呼叫間隔小於 5 分鐘(即 t=560=112t = \frac{5}{60} = \frac{1}{12} 小時)的機率為:

P(T112)=1e101121e0.8330.565P(T \leq \frac{1}{12}) = 1 - e^{-10 \cdot \frac{1}{12}} \approx 1 - e^{-0.833} \approx 0.565

5. 泊松分佈與指數分佈的關係

在泊松過程中,泊松分佈和指數分佈是互補的,它們分別描述了同一隨機過程的不同面向。以下是它們之間的數學與概念關係:

5.1 泊松過程中的事件次數與等待時間

  • 泊松分佈:描述在固定時間 tt 內,事件發生次數 N(t)N(t) 的分佈: P(N(t)=k)=(λt)keλtk!P(N(t) = k) = \frac{(\lambda t)^k e^{-\lambda t}}{k!}
  • 指數分佈:描述相鄰兩個事件之間的時間間隔 TT,例如從時間 0 到第一次事件發生,或從第 ii 次事件到第 i+1i+1 次事件的等待時間。

5.2 數學推導

泊松分佈與指數分佈的關係可以通過泊松過程的性質推導出來:

  • 在泊松過程中,時間 tt 內無事件發生的機率(即 N(t)=0N(t) = 0)為: P(N(t)=0)=(λt)0eλt0!=eλtP(N(t) = 0) = \frac{(\lambda t)^0 e^{-\lambda t}}{0!} = e^{-\lambda t}
  • 第一次事件的等待時間 T1T_1 大於 tt 的機率為: P(T1>t)=P(N(t)=0)=eλtP(T_1 > t) = P(N(t) = 0) = e^{-\lambda t}
  • 因此,第一次事件的累積分佈函數為: P(T1t)=1P(T1>t)=1eλtP(T_1 \leq t) = 1 - P(T_1 > t) = 1 - e^{-\lambda t}
  • tt 求導,得到機率密度函數: f(t)=ddt(1eλt)=λeλtf(t) = \frac{d}{dt} (1 - e^{-\lambda t}) = \lambda e^{-\lambda t}

這正是指數分佈的密度函數,證明第一次事件的等待時間服從指數分佈。

  • 更一般地,泊松過程的獨立增量性質保證了任意相鄰事件的等待時間(例如第 kk 次與第 k+1k+1 次事件之間的間隔)同樣服從指數分佈,參數為 λ\lambda

5.3 第 kk 次事件的等待時間

若考慮從時間 0 到第 kk 次事件發生的總等待時間 Sk=T1+T2++TkS_k = T_1 + T_2 + \dots + T_k(其中 TiT_i 是第 i1i-1 次與第 ii 次事件之間的獨立等待時間,均服從指數分佈),則 SkS_k 服從伽馬分佈(Gamma Distribution),其密度函數為:

fSk(t)=λktk1eλt(k1)!,t0f_{S_k}(t) = \frac{\lambda^k t^{k-1} e^{-\lambda t}}{(k-1)!}, \quad t \geq 0

k=1k = 1 時,伽馬分佈退化為指數分佈。

5.4 關係總結

  • 事件次數:在時間 tt 內的事件次數 N(t)N(t) 服從泊松分佈,參數為 λt\lambda t
  • 等待時間:相鄰事件的時間間隔 TT 服從指數分佈,參數為 λ\lambda
  • 無記憶性:指數分佈的無記憶性保證了泊松過程的隨機性,使得事件的發生不依賴於之前的歷史。
  • 數學一致性:泊松分佈描述事件的計數,指數分佈描述事件的間隔,兩者共同構成了泊松過程的完整機率框架。

6. 實際應用

泊松分佈與指數分佈在許多領域有廣泛應用,特別是在排隊論、可靠性工程、通信系統等。以下是一些典型應用:

  1. 泊松分佈
    • 通信系統:計算單位時間內接收到的數據包數量。
    • 交通流量:分析某段時間內通過某路口的車輛數。
    • 服務系統:估計某商店在特定時段的顧客到達次數。
  2. 指數分佈
    • 排隊論:分析顧客之間的到達時間間隔或服務時間。
    • 可靠性工程:計算設備故障前的運行時間。
    • 通信網絡:建模數據包傳輸之間的時間間隔。

應用實例

假設某工廠的機器每小時平均發生 2 次故障(λ=2\lambda = 2):

  • 泊松分佈:計算 1 小時內發生正好 3 次故障的機率: P(N(1)=3)=23e23!=8e260.180P(N(1) = 3) = \frac{2^3 e^{-2}}{3!} = \frac{8 e^{-2}}{6} \approx 0.180
  • 指數分佈:計算兩次故障之間的時間間隔小於 0.5 小時的機率: P(T0.5)=1e20.5=1e10.632P(T \leq 0.5) = 1 - e^{-2 \cdot 0.5} = 1 - e^{-1} \approx 0.632

7. 總結

泊松分佈和指數分佈是泊松過程的兩個核心組成部分,分別描述了隨機事件的次數和等待時間。它們的關係可以概括如下:

  • 泊松分佈:描述固定時間內事件次數的離散分佈,參數為 λt\lambda t
  • 指數分佈:描述相鄰事件間時間間隔的連續分佈,參數為 λ\lambda
  • 數學聯繫:泊松過程中的事件次數與等待時間通過機率分佈相互關聯,指數分佈的無記憶性是泊松過程隨機性的基礎。
  • 應用場景:兩者結合可廣泛應用於隨機過程的建模,如排隊系統、可靠性分析和通信網絡。

通過理解泊松分佈與指數分佈的關係,我們可以更全面地分析和預測隨機事件的行為,為實際問題提供數學基礎。若需更深入的數學推導或特定應用場景的分析,請進一步提問。