日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

大數據治理的新范例

時間:2018-12-26來源:億信華辰瀏覽數:652


數十年來,數據科學家已經擁有沙箱來探索數據并找到有價值的見解。在看似愉快的折衷方案中,分析師可以快速加載,操縱和組合企業和行業數據,以尋找新的見解和預測,而無需擔心它們會危及敏感數據或生產工作流程。雖然這加速了創造新的見解,但將它們投入生產是一場噩夢。在未部署的環境中創建的一組自定義代碼和數據需要在部署之前進行轉換,質量控制和優化。企業通常需要一年的大部分時間才能從幾周內收集的洞察中獲得價值。?

大數據的幽靈有可能使情況變得更糟- 在很大程度上?,F在,分析師們正在使用IT外部的數據結構和編程語言。外部數據源的數量和復雜性正在爆炸式增長。如果沒有新的方法,在大數據沙箱中發現的洞察力可能永遠不會投入生產。?

所出現的是一種新的范例,它將數據治理- 大多數分析師的詛咒這一術語 - 帶入了大數據。但是,大數據治理不是嚴格限制數據使用和文檔,而是靈活,協作和高效。它使分析師參與而非分離,以獲取他們的學習以加速生產準備。最重要的是,它取代了沙箱數據的大規模轉換,并采用“促銷”流程,確保分析數據在大數據平臺上生產就緒。?

大數據治理要求我們從頭開始重新思考治理。大數據治理不是物理地分離沙箱和生產數據,而是邏輯地控制訪問和使用,因為數據從“原始”到“準備”成熟。您如何判斷數據是否已準備好生產?元數據。任何支持生產使用的大數據平臺都必須具有跟蹤數據攝取,驗證,準備和使用生命周期的元數據。元數據需要管理數據訪問權限,捕獲數據分析結果以及數據開發人員和最終用戶的評論。元數據存儲定義生產準備的策略,并能夠實施它們。沒有元數據,數據湖就變成了數據沼澤。?

但為了實現這一點,元數據捕獲必須是自動化和相關的。大數據治理的第二個原則與當前的教條相矛盾:從一開始就使用模式來豐富元數據。大多數業務數據都是結構化的,無論是關系數據庫,日志文件,XML還是大型機副本。該結構可用于自動評估原始數據的質量,完整性和內容。這不僅為分析師提供了對數據的洞察力,還建立了一個可以構建的元數據基礎。

大數據治理的第三個原則是記分卡驅動的優先級。并非所有數據都需要嚴格的質量和訪問管理。實際上,假設大多數原始數據都不會被使用- 因此豐富其元數據是浪費時間。相反,記分卡是為數據的各種用途而創建的 - 合規報告,營銷分析,供應鏈分析等。某些策略適用于所有記分卡 - 需要屏蔽PII數據 - 其他則非常具體 - 需要數據沿襲所有合規報告。使用元數據基礎,可以輕松地為任何數據集創建記分卡。然后,這些記分卡用于識別治理工作并確定其優先級,以使最重要的數據生產就緒。?

從哪兒開始?如果您的數據庫元數據較差,那么就建議您先評估現有資產的質量和內容。自動化工具可以填充元數據存儲庫,作為創建記分卡的基礎。使湖泊的內容和質量透明是邁向大數據治理的第一步。



(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢