隨著互聯網的普及和信息技術的發展,數據開始成為各行各業發展的重要資產。如何對大量的數據進行有效的處理分析成了必須面對的問題,“數據治理”的概念應運而生。

一、數據治理的概念
數據治理(DataGovernance),百度百科對其的解釋是:數據治理是是組織中涉及數據使用的一整套管理行為。由企業數據治理部門發起并推行,關于如何制定和實施針對整個企業內部數據的商業應用和技術管理的一系列政策和流程。美國全球數據管理協會認為:數據治理是對數據資產管理行使權利和控制的活動的集合。桑尼爾·索雷斯提出:數據治理是廣義信息治理計劃的一部分,即制定與大數據有關的數據優化、隱私保護與數據變現的政策。
二、數據治理包含內容
數據治理是一套持續改善管理機制,通常包括了數據架構組織、數據模型、政策及體系制定、技術工具、數據標準、數據質量、影響度分析、作業流程、監督及考核等內容。從技術角度來看,數據治理涉及的IT技術主題包括元數據、數據標準、數據質量、數據集成、主數據、數據資產、數據交換、生命周期、數據安全多產品組成的一整套解決方案。

元數據:采集匯總企業系統數據屬性的信息,幫助各行各業用戶獲得更好的數據洞察力。
數據標準:對分散在各系統中的數據提供一套統一的數據命名、數據定義、數據類型、賦值規則等的定義基準,并通過標準評估確保數據在復雜數據環境中維持企業數據模型的一致性、規范性。
數據質量:有效識別各類數據質量問題,建立數據監管,形成數據質量管理體系,監控并揭示數據質量問題,提供問題明細查詢和質量改進建議。
數據集成:可對數據進行清洗、轉換、整合、模型管理等處理工作。既可以用于問題數據的修正,也可以用于為數據應用提供可靠的數據模型。
主數據:幫助企業創建并維護內部共享數據的單一視圖,從而提高數據質量,統一商業實體定義,簡化改進商業流程并提高業務的響應速度。
數據資產:匯集企業所有能夠產生價值的數據資源,為用戶提供資產視圖,快速了解企業資產,發現不良資產,為管理員提供決策依據,提升數據資產的價值。
數據交換:用于實現不同機構不同系統之間進行數據或者文件的傳輸和共享,提高信息資源的利用率。
數據安全:提供數據加密、脫敏、模糊化處理、賬號監控等各種數據安全策略,確保數據在使用過程中有恰當的認證、授權、訪問和審計等措施。
生命周期:管理數據生命周期,建立數據自動歸檔和銷毀,全面監控展現數據的生命過程。
數據治理涵蓋數據的整個生命周期,既包括數據的收集、傳輸和存儲,也包括數據的處理、應用和消亡。因此,換個角度來說,數據治理的范疇不僅僅包括數據本身,還包括加工處理數據的算法和數據分析結果的智能化應用。數據治理不僅涵蓋數據的數字化、網絡化和智能化三個階段,還包括每個階段涉及的政策、技術和產業等多個方面。數據治理的重點包括統一的標識空間、清晰的權屬確認、可控的使用授權、完善的隱私保護、明確的交易規則,以及支撐上述治理要求的倫理規則、技術和系統平臺等。

做好數據治理,盤活數據要素,是發展數字經濟的關鍵核心。