日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺

睿治作為國內(nèi)功能最全的數(shù)據(jù)治理產(chǎn)品之一,入選IDC企業(yè)數(shù)據(jù)治理實施部署指南。同時,在IDC發(fā)布的《中國數(shù)據(jù)治理市場份額》報告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場份額第一。

數(shù)據(jù)質(zhì)量評估體系主要參考以下5個指標

時間:2019-11-07來源:知乎瀏覽數(shù):23208

數(shù)據(jù)質(zhì)量評估體系主要參考以下指標:
數(shù)據(jù)完整性
數(shù)據(jù)準確性
數(shù)據(jù)有效性
數(shù)據(jù)時效性
數(shù)據(jù)一致性

依據(jù)以上指標,針對不同的信息系統(tǒng)做出定量的數(shù)據(jù)質(zhì)量評估,也可根據(jù)實際情況,在評估執(zhí)行中進行取舍。


數(shù)據(jù)質(zhì)量評估具體檢測的內(nèi)容
數(shù)據(jù)完整性檢測
完整性,描述數(shù)據(jù)信息缺失的程度,是數(shù)據(jù)質(zhì)量中最基礎(chǔ)的一項評估標準。數(shù)據(jù)缺失的情況可以分為數(shù)據(jù)信息記錄缺失和字段信息記錄缺失。數(shù)據(jù)完整性檢測的步驟是
1、對于數(shù)據(jù)信息記錄缺失的檢測,可以通過對比源庫上的表數(shù)據(jù)量和目的庫上對應(yīng)表的數(shù)據(jù)量來判斷數(shù)據(jù)是否存在缺失。
2、對于字段信息記錄缺失的檢測,選擇需要進行完整性檢查的字段,計算該字段中空值數(shù)據(jù)的占比,通常來說表的主鍵及非空字段空值率為0%??罩德试叫≌f明字段信息越完善,空值率越大說明字段信息缺失的越多。

數(shù)據(jù)準確性檢測
準確性,用于描述一個值與它所描述的客觀事物的真實值之間的接近程度,通俗來說就是指數(shù)據(jù)記錄的信息是否存在異常或錯誤。例如業(yè)務(wù)員在上報系統(tǒng)上填寫客戶信息時,手誤輸錯了某一信息,造成了數(shù)據(jù)庫里存在的信息與客觀事實不一樣。數(shù)據(jù)準確性的檢測較為困難,一般情況下很難解決。在某些特定的情況下,例如性別,年齡,出生日期,籍貫等信息可以通過校驗身份證號來檢測,前提是確保身份證號碼是正確的。

數(shù)據(jù)有效性檢測
有效性,描述數(shù)據(jù)遵循預(yù)定的語法規(guī)則的程度,是否符合其定義,比如數(shù)據(jù)的類型、格式、取值范圍等。數(shù)據(jù)有效性檢測的步驟是用戶選擇需要進行有效性檢測的字段,針對每個字段設(shè)定有效性規(guī)則。有效性規(guī)則包括類型有效、格式有效和取值有效等。類型有效檢測字段數(shù)據(jù)的類型是否符合其定義,例如可以通過求和來判斷是否是數(shù)值型,通過時間操作來判斷是否是時間類型。格式有效性檢測可以通過正則表達式來判斷數(shù)據(jù)是否與其定義相符。取值有效檢測則通過計算最大最小值來判斷數(shù)據(jù)是否在有效的取值范圍之內(nèi)。

數(shù)據(jù)時效性檢測
時效性,是指信息僅在一定時間段內(nèi)對決策具有價值的屬性。數(shù)據(jù)從生成到錄入數(shù)據(jù)庫存在一定的時間間隔,若該間隔較久,就可能導(dǎo)致分析得出的結(jié)論失去了借鑒意義。例如當(dāng)天的交易數(shù)據(jù)生成后沒有及時的錄入數(shù)據(jù)庫或者源庫與目的庫之間的同步延遲,則會導(dǎo)致統(tǒng)計結(jié)果和真實結(jié)果存在一定誤差。

數(shù)據(jù)一致性檢測
把待檢測的表作為主表,首先用戶確定一致性檢測的主表字段,然后選擇需要給定檢測的從表和從表字段,設(shè)置好主表和從表之間的關(guān)聯(lián)項,關(guān)聯(lián)項可以是多個字段,但是關(guān)聯(lián)項必須是擁有匹配值的相似字段。匹配關(guān)聯(lián)之后檢查主表和從表相同或者類似字段字段值是否一致。

數(shù)據(jù)質(zhì)量評估流程
數(shù)據(jù)質(zhì)量的評估流程首先確定要檢測的數(shù)據(jù)質(zhì)量指標和評估規(guī)則,然后編寫相應(yīng)的 SQL 腳本來檢測分析數(shù)據(jù),最后計算滿足各個規(guī)則的數(shù)據(jù)的百分比得分。系統(tǒng)的綜合得分的計算可以通過把每條規(guī)則的得分計算出來,然后綜合后取平均值,但更為合理的方法就是可以把每條規(guī)則的得分按照給定的權(quán)重進行評價,做出一個合理的數(shù)據(jù)質(zhì)量評價等級。由用戶規(guī)定每個檢測規(guī)則的權(quán)重,做出一個權(quán)重方案,然后按照各個檢測規(guī)則的權(quán)重進行整體的計算統(tǒng)計,得到一個合理的數(shù)據(jù)質(zhì)量評估得分。

下面介紹一款數(shù)據(jù)質(zhì)量管理平臺來解決數(shù)據(jù)質(zhì)量問題
EsDataClean數(shù)據(jù)質(zhì)量管理平臺是億信華辰自主研發(fā)的數(shù)據(jù)質(zhì)量管理平臺,提供了業(yè)界領(lǐng)先的質(zhì)量規(guī)則管理方法、質(zhì)量評估方法、零編碼質(zhì)檢規(guī)則、跨數(shù)據(jù)源比對、質(zhì)量分析報告、數(shù)據(jù)質(zhì)量整改、質(zhì)量績效評估等主要功能,以數(shù)據(jù)標準為數(shù)據(jù)檢核依據(jù),以元數(shù)據(jù)為數(shù)據(jù)檢核對象,通過向?qū)Щ?、可視化等簡易操作手段,將質(zhì)量評估、質(zhì)量檢核、質(zhì)量整改與質(zhì)量報告等工作環(huán)節(jié)進行流程整合,形成完整的數(shù)據(jù)質(zhì)量管理閉環(huán)。


億信數(shù)據(jù)質(zhì)量管理平臺從找到問題數(shù)據(jù)開始,控制數(shù)據(jù)質(zhì)量,貫徹始終,全面提升數(shù)據(jù)的完整性、規(guī)范性、及時性、一致性,減少因數(shù)據(jù)不可靠導(dǎo)致的決策偏差和損失。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)
立即申請數(shù)據(jù)分析/數(shù)據(jù)治理產(chǎn)品免費試用 我要試用
  • 相關(guān)主題
  • 相關(guān)大數(shù)據(jù)問答
  • 相關(guān)大數(shù)據(jù)知識
產(chǎn)品功能
平臺化

全面覆蓋數(shù)據(jù)治理9大領(lǐng)域,采用微服務(wù)架構(gòu),融合度高,延展性強

可視化

實現(xiàn)數(shù)據(jù)從創(chuàng)建到消亡全生命周期的可視化,也實現(xiàn)全角色的可視化

智能化

豐富的智能元素和功能,大大縮短數(shù)據(jù)管理周期、減少成本浪費

customer

在線咨詢

在線咨詢

點擊進入在線咨詢