- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2023-07-17來源:小情歌瀏覽數:173次
眾所周知,數據治理對企業來說意義干系重大,數據治理不好,數據質量得不到保障,下游的數據應用都是空談。
DAMA的知識體系中,對數據治理的定義非常抽象,其對數據治理的定義是:對數據資產管理行使權力和控制的活動集合。
其實從生產實踐來看,通俗地說,數據治理其實就是在做改善數據質量的工作,為數據應用打基礎,做準備。
通過數據治理,企業可以達到如下效果:
1.搞清楚自己都有哪些數據;
2.搞清楚這些數據是什么含義,怎么用;
3.搞清楚數據的質量狀況如何
4.對數據質量進行力所能及的提升。

然而,目標很清晰,現實很殘酷。數據治理對于大多數企業來說,及枯燥,又困難,想做出成績很難。
為何這樣講呢?
數據治理經常是盲目的,缺少目標性和方向性。很多數字化轉型中的企業,數據量非常大,數據系統也非常多,數據鏈路錯綜復雜,十分混亂。
在領導的層面,經常遇到同一個問題,當詢問不同的業務出口時,竟然得到截然不同的數據回答。
因此順利成章地理解為,既然的一個取數工作都做不好,那么數據治理工作仿佛勢在必行!很多治理項目就這樣因為領導的耐心突然崩潰,匆匆上馬了。
然而,數據治理工作不光是說說,而是要投入真金白銀。數據治理項目雖然不一定涉及到大量的IT系統開發,但是其對于人力成本的投入甚至更加令人驚駭。
對于一張普通的人員名單數據表,僅僅為了確認這些人員是否還在真實的崗位上,就需要動用大量的組織人力來逐一核實。
類似的事情,數不勝數,這對于業務人員的消耗是不可估量的,為主營業務的正常運營帶來非常多的額外“負擔”。
數據治理,治理的其實不是數據,而是信息。

數據治理的成本消耗能力,成為推廣的最大阻力,因此,在面對數據治理任務時,人力資源永遠是稀缺的。這就導致一個結果,數據治理必須是有選擇的。
凝練數據治理的范圍、目標,就成為擋在前面的第一個難題。
數據治理是應用導向的,知道數據怎么用,數據用在哪,才能“倒推”出來究竟需要治理什么內容,怎么治理,以及治理到什么程度才算夠用。
再次強調,數據質量不是越優越好,而是夠用即可。如果企業層面并不覺得數據應用和數據質量是有關系的,這個邏輯關系鏈路想不通,參不透,那么治理項目就一定推不動。
很多企業主在探討到數據治理以及數據中臺建設的必要性,難以下決心,也正是這樣的原因,歸根到底,是因為對數據的認知不足,不理解到底為什么數據質量好壞會對當前的業務,甚至未來的業務產生影響。
數據如果亂,但是對我沒影響,那么我為什么要治理,又為什么要花錢?
當然,除了目標層面難以統一思想,難以堅定推動,執行層面同樣困難。數據質量包括完整性、唯一性、一致性、準確性、規范性、及時性。
這里面每一項都極具挑戰。數據治理包括數據問題識別和數據問題整改兩個關鍵步驟。
對于準確性,光識別出問題就十分困難。數據能否準確地反映客觀事實,是需要驗證的,如果有其他來源的數據庫交叉驗證,則是最好,否則就只能投入人力現場進行核驗。
一致性的問題同樣困難。
同樣的數據對象,在不同業務系統都有記錄,應當以哪個為主?
究竟應當如何確立權威數據源,這就涉及到對整個IT架構的全面梳理,這又要去觸碰企業那些不愿意面對的歷史問題:
廠商換了一撥又一波;系統之間互相嫁接復用;人工超越權限直接對數據源手動“打補丁” ... ...
關于數據治理,第三個問題在于,很難做到真正形成“長效機制"。
一方面,數據治理很難實際落地。數據治理的過程十分繁瑣,而且不一定有機會通過業務場景馬上得到有效性的驗證,因此數據治理任務很難長期得到業務上的重視。
其次,業務人員通常對數據標準的理解不到位,數據質量責任也經常難以貫徹落實,數據治理工作經常是“被動”的,出了問題才治理,難以在數據源頭把控數據質量問題;
第三方面,也是最難的問題,就是治不了。很多問題即使發現了,也沒有辦法解決,數據問題歷史久遠,難以對產生數據的原因和責任人溯源,再或者,整改數據的成本遠大于數據質量提升所帶來的收益。
因此,為了真正做好數據治理工作,很多時候要關注的不是治理本身,而是數據管理機制的建設,數據責任的落實,數據質量評價和整改的自動化處理技術,以及數據系統的流程控制與審核等等