基于數(shù)據(jù)決策的前提是數(shù)據(jù)可靠且相關,數(shù)據(jù)必須是“真實可信的”,否則“輸出將是誤導和無效的”。但是學校所收集的數(shù)據(jù)可能不完全,或者更新不及時。不完全的數(shù)據(jù),特別是不準確的數(shù)據(jù),可能會帶來更危險的決策。但是,所收集的數(shù)據(jù)來源多樣,種類豐富,也很容易出現(xiàn)同一個數(shù)據(jù)(比如一所高校的在校生人數(shù)) 從不同的部門得到的數(shù)值不一樣的情況。IBM 認為,高質(zhì)量的數(shù)據(jù)具有以下四個特征:

完整性(Completeness): 要從所有可能的來源中關聯(lián)相關的數(shù)據(jù)。
準確性(Accuracy): 數(shù)據(jù)必須是正確的、一致的,沒有輸入錯誤。
可用性(Availability): 數(shù)據(jù)必須在需要時可以獲得。
時效性(Timeliness): 當下的數(shù)據(jù)必須可以獲得。
為了提高數(shù)據(jù)的質(zhì)量,可能需要多管齊下。
首先要制訂
數(shù)據(jù)治理政策,其次要開發(fā)和部署專門的工具來簡化數(shù)據(jù)收集過程。美國的大多數(shù)高校會選擇
數(shù)據(jù)質(zhì)量工具通過數(shù)據(jù)清理、匹配、監(jiān)控和其他方式, 讓質(zhì)量保證過程自動化。
2013年圣母大學(University of Notre Dame)建立了
商業(yè)智能(business intelligence)項目dataND ,經(jīng)過摸索,發(fā)現(xiàn)制訂數(shù)據(jù)治理政策非常有必要,即要定義數(shù)據(jù)是什么,如何使用這些數(shù)據(jù),誰應該有權(quán)訪問這些數(shù)據(jù)。其經(jīng)驗總結(jié)如下:
1.如何統(tǒng)一數(shù)據(jù)定義:雇傭了一個數(shù)據(jù)治理管家(a campus data steward)在部門之間協(xié)調(diào),建立關于數(shù)據(jù)的共識。
2.如何確定誰能訪問什么數(shù)據(jù):正確的問題不是這個業(yè)務是否需要這個數(shù)據(jù),而是獲取這個數(shù)據(jù)是否會給大學帶來風險,因為數(shù)據(jù)治理的目的是為了支持更廣泛地使用數(shù)據(jù),為了避免使用數(shù)據(jù)帶來的風險,要加強對能夠獲得數(shù)據(jù)的人進行培訓。當數(shù)據(jù)可能對大學造成重大傷害時,要有嚴格的限制。
2013年圣母大學(University of Notre Dame)建立了商業(yè)智能(business intelligence)項目dataND ,經(jīng)過摸索,發(fā)現(xiàn)制訂數(shù)據(jù)治理政策非常有必要,即要定義數(shù)據(jù)是什么,如何使用這些數(shù)據(jù),誰應該有權(quán)訪問這些數(shù)據(jù)。其經(jīng)驗總結(jié)如下:
1.如何統(tǒng)一數(shù)據(jù)定義:雇傭了一個數(shù)據(jù)治理管家(a campus data steward)在部門之間協(xié)調(diào),建立關于數(shù)據(jù)的共識。
2.如何確定誰能訪問什么數(shù)據(jù):正確的問題不是這個業(yè)務是否需要這個數(shù)據(jù),而是獲取這個數(shù)據(jù)是否會給大學帶來風險,因為數(shù)據(jù)治理的目的是為了支持更廣泛地使用數(shù)據(jù),為了避免使用數(shù)據(jù)帶來的風險,要加強對能夠獲得數(shù)據(jù)的人進行培訓。當數(shù)據(jù)可能對大學造成重大傷害時,要有嚴格的限制。
(部分內(nèi)容來源網(wǎng)絡,如有侵權(quán)請聯(lián)系刪除)