M09 MLOps 與系統部署整合

M09.01

訓練出一個好模型只是起點 — 讓它在真實世界穩定運作才是挑戰的開始

MLOps 機器學習 DevOps ML生命週期模型部署持續學習資料漂移監控維運

M09.02

你還在用 model_v2_final_REALLY_FINAL.pkl 命名嗎？是時候認真對待模型版本管理了

模型版本管理 DVC MLflow 實驗追蹤模型登錄資料版本控制可重現性超參數調整

M09.03

自動化不只是懶人的工具 — 在 ML 系統中，它是確保品質和可重現性的唯一方式

CI/CD 持續整合持續部署自動化測試 ML Pipeline 模型測試金絲雀部署 A/B測試

M09.04

訓練好的模型如果沒辦法被其他系統使用，它就只是一個孤立的 .pkl 檔

模型服務化 REST API gRPC 批次推論即時推論 FastAPI TensorFlow Serving 推論延遲吞吐量

M09.05

『在我的電腦上可以跑』已經不夠了 — 容器化讓環境一致，雲端讓規模彈性

Docker Kubernetes 容器化雲端部署 AWS SageMaker GCP Vertex AI Azure ML 自動擴展邊緣運算

M09.06

部署只是開始 — 真正的挑戰是確保模型在真實世界不悄悄變差

模型監控資料漂移概念漂移效能退化 A/B測試觀測性預警系統線上評估

M09.07

不是訓練一次就永遠好用 — 聰明的重訓練策略才是長期競爭力

模型重訓練觸發條件排程重訓持續學習線上學習增量學習訓練流程自動化模型版本管理

M09.08

不是所有 AI 都需要雲端 — 在裝置端跑 AI 才是真正改變世界的方式

Edge AI 端側部署模型壓縮量化剪枝 ONNX TensorRT 嵌入式AI 行動端推論

M09.09

準確率 99% 但掛掉 10% 的時間 — 可靠性才是 AI 上線的真正門檻

可靠性工程 SLA SLO 故障容錯降級策略負載均衡高可用性服務可用性熔斷器

M09.10

一個模型上線不難 — 難的是讓整個組織持續、可靠、有效率地做 AI

MLOps成熟度 Google ML成熟度組織轉型 AI治理機器學習平台自動化流水線 CI/CD 特徵工程平台技術債