超到位的提問。
下面把整條路徑「建模 → 評估(決策樹 / 變量消除 / 轉成 BN)→ 擴充為動態」一次講清楚,並用你熟的 SMT reflow 當母例。
1) 建模:把問題變成一張有向無環圖(ID / DAG)
元件
-
決策節點 D(方框):reflow 參數(speed、各 zone 溫度、soak time、peak)。
-
機率節點 C(圓):板子熱容量、錫膏批次、環境溫度、裝機差異…;以及 ML 輸出(溫度曲線、缺陷率、良率),視作條件分佈。
-
效用節點 U(菱形/橢圓):
-
邊:表依賴/資訊流(無環)。
典型結構(簡化)
ML 模型(如 Stacked Bi-LSTM + PE)在圖上就是從父節點到「Profile / Defects / Yield」的條件分佈近似器;務必做機率校準與不確定性估計(如溫度曲線區間、缺陷率分佈),否則下游效用會失真。
硬性約束(JEDEC:ramp rate、TAL、ΔT、peak)→ 當成可行域 ;不符即給大懲罰或直接裁掉。
2) 評估(Evaluation):三條經典路徑
2A. 轉成「決策樹」並折返(fold-back)
-
做法:離散化 D 與關鍵 C;展開所有路徑 → 在葉節點計算期望效用 → 自底向上折返挑最大 EU。
-
優點:非常直觀,易講解給現場/管理層。
-
缺點:狀態空間爆炸;多維 D、連續 C 會很痛。
-
實務:用 蒙地卡羅場景樹(每個決策分支抽樣若干情境),估計
選 。
2B. 變量消除(Variable Elimination / Arc Reversal + Node Removal)
-
核心:用圖演算法把「中介隨機變數」逐個邊際化,最後對每個可行的父資訊 找
-
步驟(影響圖評估經典套路)
-
刪 barren nodes(對 U 無影響者)。
-
消 deterministic nodes(ML 的純函數映射可替換)。
-
選消除順序(min-fill/min-degree 以降樹寬)。
-
Chance nodes 做期望、Decision nodes 做極大化。
-
-
複雜度:與誘導樹寬相關,遠小於全展開樹;適合中大型網路。
小訣竅:把「溫度曲線」當低秩表徵(幾個 shape basis + 時間參數)可大幅降維,再做消除更穩。
2C. 轉成「貝氏網路」(只做機率推理)
-
做法:去掉 D 與 U,只留 C(含 ML 的條件分佈)→ 得到 BN/DBN。
-
用途:
-
做 機率查詢(如在某環境與設定下「缺陷率 < 0.5%」的機率)。
-
生成資料(合成 profile/defect 樣本,支援 DOE)。
-
與 實測對比做 model 校準 / 偏移偵測。
-
-
限制:BN 自身不給出最優決策,要回到 ID 或額外加上策略比較 。
3) 擴充為動態(DID → MDP/POMDP/RL)
當你要「多批/多期調參」或「設備老化/批次差異 / 環境季節性」時,就要時間展開。
動態影響圖(兩期示意)
對應數學框架:
-
MDP(可完全觀測):
-
POMDP(部分可觀測):維護 belief (對「熱容/貼片密度/爐況偏移」的後驗),用
-
Bayesian RL:把未知模型參數 (如爐齡化偏移)放進狀態或維護其後驗,邊運行邊學。
策略設計選項
-
有限期:Backward induction。
-
長期:Policy Iteration / Value Iteration。
-
黑箱可微:Decision-Focused Learning(端到端以 EU 為損失、對 ML + 決策可微近似,直逼最終效用);或 Bandit/Thompson Sampling 做線上自適應。
風險/魯棒性
-
風險厭惡:用 或對 U 做 concave 變換。
-
領域轉移:Distributionally-Robust(Wasserstein ball)對抗 ML 偏移。
-
探測價值:EVPI / EVPPI 評估多裝一支熱電偶或多量一次 DOE 的資訊價值。
-
。
-
4) 一頁式實作藍圖(SMT Reflow)
Step 0 變量表與約束
-
:滿足 JEDEC 與設備上限;離散化或連續皆可。
-
:Paste lot、Board mass、Ambient、Line load。
-
ML1:(帶不確定性)。
-
ML2:。
-
:按權重合成,或學得的效用。
Path A(決策樹)
-
產生 K 個候選 ,每個抽 N 個 。
-
Monte-Carlo 估計 ;選最大者或前 M 名進一步微調。
Path B(變量消除)
-
刪 barren / 合併 deterministic。
-
選消除順序;先把 Profile 壓成低維(如 PCA/basis)。
-
逐步對 C 取期望,對 D 取極大;得 。
Path C(轉 BN)
-
用 BN/DBN 做敏感度、邊際查詢與數據合成;支援 A/B 的場景生成與校準。
Dynamic(DID/MDP)
-
狀態含爐況/批次後驗;策略 用 RL / Bayesian 更新;目標最大化 。
5) 實務小撇步
-
校準 > 準確:下游看的是 EU,寧可可置信區間對、分佈準,別只追 RMSE。
-
簡化圖寬:先做因果/常識剪枝(哪個 C 其實不影響 U?);min-fill 選消除序。
-
把物理塞進去:把 JEDEC/熱傳等式當成 deterministic nodes,能大幅提升外推穩定性。
-
逐層上線:先 ID+VE 做離線策略,穩了再 DID/RL 線上自調。
如果你要,我可以直接把:
-
「靜態 ID 的 DAG」
-
「VE 消除順序 示意」
-
「兩期 DID」
畫成一張合成教學圖(或給你一個可編輯的 canvas)。你想用哪種視覺化格式(簡報一頁、Canvas、或可執行的 Python 範例)?
沒有留言:
張貼留言