日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺

睿治作為國內(nèi)功能最全的數(shù)據(jù)治理產(chǎn)品之一,入選IDC企業(yè)數(shù)據(jù)治理實施部署指南。同時,在IDC發(fā)布的《中國數(shù)據(jù)治理市場份額》報告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場份額第一。

大數(shù)據(jù)發(fā)展過程中的質(zhì)量問題

時間:2022-01-14來源:互聯(lián)網(wǎng)瀏覽數(shù):616

要體現(xiàn)數(shù)據(jù)價值,前提就是數(shù)據(jù)質(zhì)量的保障,質(zhì)量沒有得到 100% 保證的數(shù)據(jù)是很難體現(xiàn)出業(yè)務價值的,如果基于這些有問題的數(shù)據(jù)做決策支持,或做業(yè)務辦理,將會得到災難性的結(jié)果,讓領導層和數(shù)據(jù)使用方對大數(shù)據(jù)失去信心。

根據(jù)哈工大王志宏先生在科技導報發(fā)表的研究表明,如果沒有良好的數(shù)據(jù)質(zhì)量,大數(shù)據(jù)將會對決策產(chǎn)生誤導,甚至產(chǎn)生有害的結(jié)果。
在數(shù)倉建設上,50% 的數(shù)據(jù)倉庫因數(shù)據(jù)質(zhì)量而被取消或延遲。
在經(jīng)濟損失上,數(shù)據(jù)錯誤每年對美國工業(yè)界造成的經(jīng)濟損失約占 GDP 的 6%。
在醫(yī)療事故上,根據(jù)美國醫(yī)療委員會的統(tǒng)計,由于數(shù)據(jù)錯誤引起的醫(yī)療事故僅在美國每年就導致高達 98000 名患者喪生。
在電信產(chǎn)業(yè)上,數(shù)據(jù)錯誤經(jīng)常導致故障排除的延誤、多余設備租用和服務費收取錯誤,損害了企業(yè)信譽甚至會因此失去很多用戶。
在商業(yè)上,美國零售業(yè)每年僅因標價錯誤就損失 25 億美元。
在金融企業(yè)中:因數(shù)據(jù)質(zhì)量問題導致的信用卡欺詐失察在 2008 年即造成 48 億美元的損失。
被譽為“數(shù)據(jù)博士”的 Jim barker,用一個簡單的醫(yī)學概念來定義兩種類型的數(shù)據(jù)質(zhì)量問題:
第一類數(shù)據(jù)質(zhì)量問題是比較簡單而明顯的問題,我們可以使用自動化工具檢測到。
第二類數(shù)據(jù)質(zhì)量問題是非常隱秘的問題,大家都知道它是存在的,但它看不見摸不著,更處理不了,因為它需要放在特殊情境才能被檢測到。

它們之間的區(qū)別簡而言之可歸納為如下幾點:
第一類數(shù)據(jù)質(zhì)量問題首先需要“know what”才能來檢測數(shù)據(jù)的完整性、一致性、唯一性和有效性。這些屬性靠數(shù)據(jù)質(zhì)量軟件甚至手動很好地找到。你不需要有很多的背景知識,或者數(shù)據(jù)分析經(jīng)驗。只要按照 4 個屬性驗證它的存在,就可以判定它錯誤的。例如,如果我們在性別領域插入一個 3,我們就可以判定它到底是不是一個有效值。
第二類數(shù)據(jù)質(zhì)量問題需要“know why”來檢測時效性、一致性和準確性屬性。需要研究能力、洞察力和經(jīng)驗,而不是簡簡單單就可以找得出來的。這些數(shù)據(jù)集經(jīng)常從表面上看起來沒有問題。但是問題往往存在于細節(jié)中,需要時間去發(fā)現(xiàn)。Jim 舉的例子就是一份退休人員的雇傭記錄,如果我們不知道他們早已退休的話,是看不出來這個數(shù)據(jù)是錯的。
所以,解決這些數(shù)據(jù)質(zhì)量問題的關鍵就是需要一個復雜的、策略化的方法,而非孤立的、片面的來看問題。一旦數(shù)據(jù)質(zhì)量不好,我們就需要尋求自動化與人工的雙重方式才能解決這個問題了。

根據(jù) Jim barker 的經(jīng)驗:
第一類基本涵蓋了 80% 的數(shù)據(jù)質(zhì)量問題,但只消耗了我們 20% 的經(jīng)費成本。
第二類數(shù)據(jù)問題往往需要多方的輸入,以便發(fā)現(xiàn)、標記和根除。雖然我們客戶關系管理系統(tǒng)中的每個人都有購買日期,但購買日期可能不正確,或者與發(fā)票或發(fā)貨清單不符。只有專家才能通過仔細核查其內(nèi)容來解決問題并手動改進客戶關系管理系統(tǒng)。
第一類數(shù)據(jù)質(zhì)量的挑戰(zhàn)可以快速解決,但第二類問題提出了一個挑戰(zhàn),必須依靠人類的專業(yè)知識才可以解決。事實上,我們可以簡單地通過引入一些工具和規(guī)則就可以解決 80% 的問題,也可以引入一個復雜的系統(tǒng)工程來解決 100% 的質(zhì)量問題,取決于我們希望達到什么樣的質(zhì)量標準。
(部分內(nèi)容來源網(wǎng)絡,如有侵權(quán)請聯(lián)系刪除)
立即申請數(shù)據(jù)分析/數(shù)據(jù)治理產(chǎn)品免費試用 我要試用
產(chǎn)品功能
平臺化

全面覆蓋數(shù)據(jù)治理9大領域,采用微服務架構(gòu),融合度高,延展性強

可視化

實現(xiàn)數(shù)據(jù)從創(chuàng)建到消亡全生命周期的可視化,也實現(xiàn)全角色的可視化

智能化

豐富的智能元素和功能,大大縮短數(shù)據(jù)管理周期、減少成本浪費

customer

在線咨詢

在線咨詢

點擊進入在線咨詢