← 回首頁
資料素養與資料流程
📊

M02 資料素養與資料流程

理解資料的型態、品質、清理流程,以及隱私與安全的基本功

共 10 講
資料的本質:什麼是資料,為什麼 AI 離不開它
M02.01

資料的本質:什麼是資料,為什麼 AI 離不開它

沒有資料的 AI 就像沒有食材的廚師 — 再厲害也煮不出菜

資料定義 資料驅動 AI基礎
資料類型全覽:結構化、半結構化、非結構化
M02.02

資料類型全覽:結構化、半結構化、非結構化

Excel 表格、JSON 檔案、一張照片 — AI 看待它們的方式完全不同

結構化資料 半結構化 非結構化 資料類型
資料品質:垃圾進垃圾出的真相
M02.03

資料品質:垃圾進垃圾出的真相

AI 模型只能跟資料一樣好 — 餵垃圾進去,吐垃圾出來

資料品質 GIGO 品質維度
資料蒐集:從哪裡來、怎麼取得、合法嗎
M02.04

資料蒐集:從哪裡來、怎麼取得、合法嗎

資料不是天上掉下來的 — 每一筆都有成本、來源和法律邊界

資料蒐集 資料來源 合法性
資料清理與前處理:AI 專案最花時間的步驟
M02.05

資料清理與前處理:AI 專案最花時間的步驟

資料科學家 80% 的時間不是在建模型,而是在洗資料

資料清理 前處理 ETL
特徵工程:把原始資料變成模型看得懂的語言
M02.06

特徵工程:把原始資料變成模型看得懂的語言

原始資料是生肉,特徵工程是料理 — 同樣的食材,手藝不同差很多

特徵工程 特徵選擇 維度災難
資料標註:教 AI 什麼是對、什麼是錯
M02.07

資料標註:教 AI 什麼是對、什麼是錯

AI 不是自學成才 — 每一個正確答案的背後,都有人類老師在標記

資料標註 監督式學習 標註品質
資料隱私與個資保護:GDPR、台灣個資法
M02.08

資料隱私與個資保護:GDPR、台灣個資法

蒐集資料很容易,搞砸隱私很簡單 — 罰款和商譽損失才是真正的代價

資料隱私 個資保護 GDPR 個資法
資料偏誤:你的資料決定了 AI 的偏見
M02.09

資料偏誤:你的資料決定了 AI 的偏見

AI 不會歧視,但它會忠實地學會資料裡的歧視

資料偏誤 公平性 偏誤檢測
資料治理:建立企業的資料管理制度
M02.10

資料治理:建立企業的資料管理制度

資料是新石油?那你需要一套油田管理制度,不然只會漏油

資料治理 資料管理 資料策略