M02.10|資料治理:建立企業的資料管理制度
資料是新石油?那你需要一套油田管理制度,不然只會漏油
本講學習重點
確保資料在整個生命週期中被正確管理、保護和使用的制度
政策、標準、角色、流程、技術工具五大支柱
負責特定資料領域品質和標準的人,通常是業務端而非IT
需要但可以簡化,至少做到資料目錄+存取權限+品質基線
🎙️ Podcast(中文)
一句話搞懂
資料治理就是「誰可以看什麼資料、資料要怎麼存、壞了誰負責修、用完了怎麼刪」— 一套讓企業資料從混亂變有序的管理制度。
白話解說
想像你家的冰箱。如果沒有任何管理規則:每個人買菜隨便塞、過期的沒人丟、誰放的什麼都搞不清楚、冷藏和冷凍混著放。最後冰箱就會變成一個噁心的災難現場。
企業的資料也是一樣。沒有治理的資料環境長這樣:業務部門的 Excel 跟行銷部門的 Excel 定義不同(同一個「活躍客戶」兩邊的數字差三倍)、沒人知道某個資料庫是誰建的、客戶個資散落在十幾個系統裡面沒有統一管理、離職員工的帳號還能存取敏感資料。
資料治理(Data Governance) 就是建立一套制度來解決這些問題。它有五大支柱:
政策(Policy):定義資料相關的規則。例如「客戶個資只能保存三年」、「所有資料存取都要留日誌」、「新增資料欄位需要資料管家審核」。
標準(Standards):統一資料的定義和格式。例如「活躍客戶」的定義是「過去 90 天內有登入的客戶」— 全公司統一用這個定義,不允許各部門自己解讀。這通常會建立一個資料字典(Data Dictionary)或資料目錄(Data Catalog)。
角色(Roles):明確誰負責什麼。最重要的角色是資料管家(Data Steward)— 負責特定資料領域的品質和標準的人。注意:資料管家通常是業務端的人(例如財務部門的人管財務資料),不是 IT 部門。因為只有業務端的人才真正懂得那些資料代表什麼意義。
流程(Process):標準化的操作程序。例如新增資料來源的審批流程、資料品質問題的通報和修復流程、資料刪除請求的處理流程。
技術工具(Technology):支撐治理的軟體系統。例如資料目錄工具(Apache Atlas、Alation)、資料品質監控工具(Great Expectations、dbt tests)、存取控制系統(RBAC 角色基礎存取控制)。
應用場景
場景:一家台灣中型製造業的資料治理之旅
這家公司有 500 名員工、三家工廠,使用了 ERP、CRM、MES(製造執行系統)和十幾個 Excel 檔案。他們在導入 AI 品質檢測系統時發現:同一種產品缺陷在三家工廠的記錄方式完全不同。
他們的治理路線圖分三階段:
| 階段 | 目標 | 具體做法 | 時間 |
|---|---|---|---|
| 第一階段:盤點 | 知道我們有什麼資料 | 建立資料目錄,列出所有系統的資料欄位和負責人 | 2 個月 |
| 第二階段:統一 | 統一定義和標準 | 建立資料字典,統一三家工廠的缺陷分類碼 | 3 個月 |
| 第三階段:制度化 | 建立持續運作的機制 | 指派資料管家、建立品質監控儀表板、制定存取權限政策 | 3 個月 |
第一階段的震撼發現:公司內部有 847 個 Excel 檔案散落在各部門的共用資料夾裡,其中 23% 超過兩年沒有更新,15% 沒有人知道是誰建的。這些「資料孤島」每年造成的重工和錯誤決策成本估計超過 500 萬。
治理上路後的改變:AI 品質檢測系統的訓練資料終於有了一致的標準,模型準確率從 78% 提升到 91%。
常見誤區
-
「資料治理是大企業的事,我們小公司不需要」 — 小公司更需要,因為資料出問題的影響相對更大。你不需要一個五十人的治理團隊,但至少需要三件事:(a) 一份資料目錄(知道資料在哪裡),(b) 基本的存取權限控管(不是每個人都能看到所有資料),(c) 關鍵資料欄位的定義統一。這三件事一個人花一個月就能做到。
-
「資料治理是 IT 部門的工作」 — 資料治理是業務和 IT 的共同責任。IT 提供工具和技術支援,但資料的定義、品質標準和使用規則,必須由業務端來主導。「營收」的定義不同會導致財務報表不一致 — 這不是 IT 能決定的事。
-
「買一套資料治理工具就算治理了」 — 工具只是治理的一部分。沒有政策、流程和人來配合,再貴的工具也只是擺設。很多企業花了大錢買 Collibra 或 Informatica,結果因為沒有專人維護資料目錄、沒有業務部門配合,工具淪為蚊子軟體。
小練習
- 資料目錄練習:為你部門最重要的一個資料來源(如 CRM、ERP、或某份關鍵 Excel),建立一份迷你資料目錄,至少包含:
- 資料來源名稱
- 負責人(誰維護這份資料?)
- 更新頻率(即時/每日/每月?)
- 包含哪些主要欄位
- 有無個資?如果有,保護措施是什麼?
- 目前已知的品質問題
- 治理成熟度自評:用以下五個問題評估你公司的資料治理成熟度,每題 1-5 分:
- (a) 公司有沒有統一的資料字典?
- (b) 每個資料來源都有明確的負責人嗎?
- (c) 資料存取有權限控管嗎?
- (d) 資料品質有定期檢查機制嗎?
- (e) 有個資保護和刪除的標準流程嗎?