2024年11月25日 星期一

看棒球 學 GAN

 以下是捕手配球策略與打者對抗的 min-max 最優化問題,用純文字表示:


問題建模 (純文字形式)

定義變量與函數:

  1. 捕手策略 X:
    捕手的配球方案,包括球的類型、速度、落點等。

  2. 打者策略 Y:
    打者根據捕手策略選擇的揮棒行為。

  3. 成功概率函數 P(X, Y):
    捕手的配球策略 XX 和打者的揮棒策略 YY 的對抗博弈結果,表示打者擊球成功的概率。


目標函數:

捕手與投手希望最小化打者成功率,而打者希望最大化自己的成功率。目標為: 最小化捕手策略 X 下的最大化打者策略 Y 的成功概率:
Minimize X Maximize Y P(X, Y)


約束條件:

  1. 捕手策略空間 X:
    捕手的策略 XX 必須滿足配球的限制,例如球速、球種等,具體為:

    • XXX=x1,x2,...,xnX ∈ X,X = {x1, x2, ..., xn},其中 xixi 為合法的配球選項。
  2. 打者策略空間 Y:
    打者的策略 YY 必須符合揮棒的物理條件,例如揮棒範圍與時機,具體為:

    • YYY=y1,y2,...,ymY ∈ Y,Y = {y1, y2, ..., ym},其中 yjyj 為合法的揮棒選項。
  3. 成功概率的限制:
    成功概率 P(X,Y)P(X, Y) 的值域為 [0, 1],具體為:

    • 0P(X,Y)10 ≤ P(X, Y) ≤ 1

類比 GAN 的生成與判別:

  1. 捕手策略 XX 對應於生成器的輸出樣本。
  2. 打者策略 YY 對應於判別器的識別行為。
  3. 成功概率 P(X,Y)P(X, Y) 對應於 GAN 的損失函數。

數學形式總結:

最終公式為: Minimize X Maximize Y P(X, Y)
Subject to:

  1. XXX ∈ X
  2. YYY ∈ Y
  3. 0P(X,Y)10 ≤ P(X, Y) ≤ 1

以上用純文字描述了捕手與打者對抗的最優化問題,展示了如何用數學形式和條件來表達實際情境中的策略對抗問題。

沒有留言: