企業在傳統數據平臺使用數據時會遇見哪些常見問題或挑戰呢?
為幫助你快速理解,下面我將通過一個真實案例進行切入。
數據分析師:“老大,昨天會議上你說的供應商評價場景,我感覺目前數據存在問題。你看 10 年前上的系統與去年上的新系統供應商編碼、物料編碼、人員編碼、數據單位都不一致,根本關聯不起來。
就拿其中一個指標來說吧,近 3 年的及時到貨量 = 及時到貨數量 / 到貨數量,目前我們連這個簡單的場景都做不了。因為當時編碼沒有定規則,企業沒有制定統一的
數據標準,不僅這個場景做不了,涉及需要大量歷史數據訓練 AI 模型的場景也無法實現。”
老大:“他們沒有上
主數據系統以此保證主數據的一致性嗎?也沒有人定義標準?看來這個坑不小呀。下面我們抓緊建立一套
數據質量體系吧,針對不符合規范的內容,通過郵件定時發送給業務部門負責人。通知發送后,如果再出現問題那就是業務部門的事情了,要不然老板還懷疑我們的能力不行,這個鍋我們不背。”
算法工程師:“老大,要訓練的銷量預測數據感覺有問題,問了一圈業務領域的人,就沒有一個對歷史數據全局能說明白的,每個人都只知道自己的那一塊數據。我看了一下,營銷數據、訂單數據、采購數據、供應鏈數據統計口徑都不一致。我已經很盡力地拉了幾次會議了,可每次組織會議時,大家都有時間的情況不多,所以這個事情部門之間就推來推去,都想讓其他部門改,最后會議都是以不了了之收場。”
研發工程師:“老大,昨天采購那邊好像改了什么字段或數據,導致下游的報表數據都出現了問題,今晚又得加班了,主要是現在還不清楚問題到底在哪?”
通過以上這段對話可知,
數據治理一般存在以下 4 種挑戰:

第一,數據不可知:作為業務人員/企業管理者不清楚數據與業務之間的關系到底是什么,對于數據資產完全不清晰。
第二,數據不可控:現有數據質量不高,導致業務人員的工作瑣碎,工作量巨大,且容易出錯。
第三,數據不可取:業務人員無法根據真實需求從數據源中快速提取數據,導致業務需求無法快速被滿足。
第四,數據不關聯:因各個數據之間沒有任何關聯性,導致數據難以支撐企業實際業務。
也正是因為所使用的數據存在一系列的問題,且問題還在不斷涌現,所以企業有必要對數據進行治理,以此提升數據的價值,并為企業實現數字化戰略打好基礎。
(部分內容來源網絡,如有侵權請聯系刪除)