有效
數據治理的幾個原則
一個好的數據中心將利用自己現有的技術和設備,向用戶提供服務,盡量減少操作和維護成本,并最大限度地提高利潤。如果你經常擔心數據的準確性,并將大部分時間用于處理數據,而不是思考和分析業務,那么你就需要很好地管理數據。
有效數據治理的6大原則一、為什么要進行數據治理
不知道你是否有這樣的感受,看到數據后,一臉懵逼,不知道各個表和字段代表什么意思,再看看別的同事寫的SQL,一條SQL語句有幾百行,各種表關聯,然后問了其中一個同事,他說“別提了,數據都不準,我快被數據折磨死了!”,此時你是不是“想死”!欲哭無淚……
究其背后的原因,是因為負責的人只是問題使然,哪有問題哪里去補,沒有整體的統籌規劃,一步錯,步步錯,數據最后是越來越重,查詢越來越復雜,數據準確性還沒有人敢打保票,同時修復的難度也大大增加。
二、如何進行數據治理
如果要想將數據治理好的話,需要遵循以下六大原則、合理制定數據中間表模型以及埋點采集到應用全流程的把控。
1.六大原則
原則1:關鍵概念多方共識
關鍵概念若涉及多方,比如成交客戶的定義,要確保公司內部和客戶相關的所有業務人員理解一致。
原則2:某個類型的值經常發生變動,則需要冗余一個通用字段冗余值
處理過數據的同學都知道,某個指標的實現可能和其它幾個關鍵指標相關,那么該指標的異常排查就需要逐個檢查是哪個相關指標出問題了,查找到原因可能2,3天的時間就沒了,但如果事先開發人員冗余了一個通用字段代表該類消費指標,那么后續不管業務人員上線多少個消費類型的任務,都不會對原來的指標產生影響。
原則3:每個實體都有唯一、不變的ID,最好沒有實際意義
一是為了實體的唯一性,二是為了表關聯或更新時不受業務的影響。
原則4:涉及協作的數據,發現問題要從修改源頭做起,保證下一次拿到正確的數據
協作的數據可以說是一個串聯的過程,源頭的數據會逐層影響下層的數據,不要為了一時方便,只修改目前發現問題的地方,要從修改源頭做起,方便他人即方便自己。
原則5:編寫操作清單,操作前請三思
數據間存在關聯,把數據間的關聯關系陳列清楚、注意事項標注清楚,操作前一一核對,小數據量驗證無錯后,大數據量執行。
原則6:系統工程的方法管理數據,盡可能使用系統,監控數據錯誤并及時修復。
將使用數據的相關方都畫在一張系統循環圖中,觀察數據錯誤產生于系統哪個環節,如何影響后續各個環節,避免惡性循環的產生。
完整的數據治理體系
億信華辰自主研發的睿治包含元數據、數據標準、數據質量、數據集成、主數據、數據資產、數據交換、數據生命周期、數據安全等高度融合的9大核心模塊,各模塊可獨立或者組合使用,打通數據治理各環節,實現了數據治理場景的全覆蓋。

(部分內容來源網絡,如有侵權請聯系刪除)