← M02 資料素養 M02 資料素養

M02.10|資料治理:建立企業的資料管理制度

資料是新石油?那你需要一套油田管理制度,不然只會漏油

L1-AI基礎知識-資料治理基礎 L1-AI應用規劃-企業資料策略 L2-AI系統部署-資料管理實務
資料治理 資料管理 資料策略
📋

本講學習重點

什麼是資料治理?
治理框架包含什麼?
資料管家是誰?
小公司也需要治理嗎?

確保資料在整個生命週期中被正確管理、保護和使用的制度

政策、標準、角色、流程、技術工具五大支柱

負責特定資料領域品質和標準的人,通常是業務端而非IT

需要但可以簡化,至少做到資料目錄+存取權限+品質基線

📌 資料治理是讓資料從負債變成資產的管理制度,規模不論大小都需要基本的治理框架。
資料治理:建立企業的資料管理制度

🎙️ Podcast(中文)

0:00 / 0:00

一句話搞懂

資料治理就是「誰可以看什麼資料、資料要怎麼存、壞了誰負責修、用完了怎麼刪」— 一套讓企業資料從混亂變有序的管理制度。

白話解說

想像你家的冰箱。如果沒有任何管理規則:每個人買菜隨便塞、過期的沒人丟、誰放的什麼都搞不清楚、冷藏和冷凍混著放。最後冰箱就會變成一個噁心的災難現場。

企業的資料也是一樣。沒有治理的資料環境長這樣:業務部門的 Excel 跟行銷部門的 Excel 定義不同(同一個「活躍客戶」兩邊的數字差三倍)、沒人知道某個資料庫是誰建的、客戶個資散落在十幾個系統裡面沒有統一管理、離職員工的帳號還能存取敏感資料。

資料治理(Data Governance) 就是建立一套制度來解決這些問題。它有五大支柱:

政策(Policy):定義資料相關的規則。例如「客戶個資只能保存三年」、「所有資料存取都要留日誌」、「新增資料欄位需要資料管家審核」。

標準(Standards):統一資料的定義和格式。例如「活躍客戶」的定義是「過去 90 天內有登入的客戶」— 全公司統一用這個定義,不允許各部門自己解讀。這通常會建立一個資料字典(Data Dictionary)資料目錄(Data Catalog)

角色(Roles):明確誰負責什麼。最重要的角色是資料管家(Data Steward)— 負責特定資料領域的品質和標準的人。注意:資料管家通常是業務端的人(例如財務部門的人管財務資料),不是 IT 部門。因為只有業務端的人才真正懂得那些資料代表什麼意義。

流程(Process):標準化的操作程序。例如新增資料來源的審批流程、資料品質問題的通報和修復流程、資料刪除請求的處理流程。

技術工具(Technology):支撐治理的軟體系統。例如資料目錄工具(Apache Atlas、Alation)、資料品質監控工具(Great Expectations、dbt tests)、存取控制系統(RBAC 角色基礎存取控制)。

應用場景

場景:一家台灣中型製造業的資料治理之旅

這家公司有 500 名員工、三家工廠,使用了 ERP、CRM、MES(製造執行系統)和十幾個 Excel 檔案。他們在導入 AI 品質檢測系統時發現:同一種產品缺陷在三家工廠的記錄方式完全不同。

他們的治理路線圖分三階段:

階段 目標 具體做法 時間
第一階段:盤點 知道我們有什麼資料 建立資料目錄,列出所有系統的資料欄位和負責人 2 個月
第二階段:統一 統一定義和標準 建立資料字典,統一三家工廠的缺陷分類碼 3 個月
第三階段:制度化 建立持續運作的機制 指派資料管家、建立品質監控儀表板、制定存取權限政策 3 個月

第一階段的震撼發現:公司內部有 847 個 Excel 檔案散落在各部門的共用資料夾裡,其中 23% 超過兩年沒有更新,15% 沒有人知道是誰建的。這些「資料孤島」每年造成的重工和錯誤決策成本估計超過 500 萬。

治理上路後的改變:AI 品質檢測系統的訓練資料終於有了一致的標準,模型準確率從 78% 提升到 91%。

常見誤區

  1. 「資料治理是大企業的事,我們小公司不需要」 — 小公司更需要,因為資料出問題的影響相對更大。你不需要一個五十人的治理團隊,但至少需要三件事:(a) 一份資料目錄(知道資料在哪裡),(b) 基本的存取權限控管(不是每個人都能看到所有資料),(c) 關鍵資料欄位的定義統一。這三件事一個人花一個月就能做到。

  2. 「資料治理是 IT 部門的工作」 — 資料治理是業務和 IT 的共同責任。IT 提供工具和技術支援,但資料的定義、品質標準和使用規則,必須由業務端來主導。「營收」的定義不同會導致財務報表不一致 — 這不是 IT 能決定的事。

  3. 「買一套資料治理工具就算治理了」 — 工具只是治理的一部分。沒有政策、流程和人來配合,再貴的工具也只是擺設。很多企業花了大錢買 Collibra 或 Informatica,結果因為沒有專人維護資料目錄、沒有業務部門配合,工具淪為蚊子軟體。

小練習

  1. 資料目錄練習:為你部門最重要的一個資料來源(如 CRM、ERP、或某份關鍵 Excel),建立一份迷你資料目錄,至少包含:
    • 資料來源名稱
    • 負責人(誰維護這份資料?)
    • 更新頻率(即時/每日/每月?)
    • 包含哪些主要欄位
    • 有無個資?如果有,保護措施是什麼?
    • 目前已知的品質問題
  2. 治理成熟度自評:用以下五個問題評估你公司的資料治理成熟度,每題 1-5 分:
    • (a) 公司有沒有統一的資料字典?
    • (b) 每個資料來源都有明確的負責人嗎?
    • (c) 資料存取有權限控管嗎?
    • (d) 資料品質有定期檢查機制嗎?
    • (e) 有個資保護和刪除的標準流程嗎?
點擊查看參考答案

練習 1:CRM 資料目錄範例

| 項目 | 內容 | |------|------| | 資料來源 | Salesforce CRM | | 負責人 | 業務部 王主任 | | 更新頻率 | 即時(業務人員每日更新) | | 主要欄位 | 公司名稱、聯繫人、電話、Email、商機金額、成交狀態、最後互動日期 | | 個資 | 有(姓名、電話、Email)→ 存取限業務部+主管 | | 已知品質問題 | ① 20% 電話號碼已過期 ② 商機金額單位不統一(有些含稅有些未稅) ③ 離職業務的客戶無人接手更新 | > **價值**:光是做完這張表,你就能發現很多之前沒意識到的問題。資料治理的第一步不是買工具,而是「知道自己有什麼」。

練習 2:治理成熟度對照表

| 總分 | 等級 | 建議 | |------|------|------| | 5-8 分 | **初始級** | 從建立資料目錄和指派負責人開始 | | 9-13 分 | **發展級** | 統一定義、建立基本存取權限 | | 14-18 分 | **成熟級** | 自動化品質監控、定期審查制度 | | 19-22 分 | **優化級** | 進階分析、AI 治理整合 | | 23-25 分 | **領先級** | 持續改進、資料驅動文化 | > **台灣中小企業平均**:約 7-10 分(初始級到發展級之間)。不用氣餒 — 大多數企業都在這個階段。重要的是開始行動,而不是追求完美。

關鍵字自我檢核

✅ 資料治理框架 ✅ 資料管家 ✅ 資料生命週期 ✅ 資料目錄