- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2023-01-15來源:寶寶瀏覽數:2942次
精益數據方法強調通過共享、開放、協同的方式,讓企業的數據流動起來,共享起來,充分的協作起來,同時將數據治理融入業務場景中,在數據生產的全鏈路中實施數據治理工作。
為了實現這一個目標,企業需要對應的技術平臺,也就是企業級數據資產目錄。
數據資產目錄的定義和價值
1. 數據資產目錄的定義
數據資產目錄是公司數據資產的清單,方便用戶快速找到所需的信息。
該目錄包含元數據,它提供其他數據的基本信息,結合數據治理和數據探索的相關工具,構成了企業級數據資產目錄,如圖?5-12?所示。

圖?5-12 數據資產目錄在企業中的定位
企業數據資產目錄是對企業所有數據資產進行中心化管理的手段,企業通過元數據將數據源和數據產品等進行標準化的注冊、管理等操作,讓最終的數據用戶可以方便地使用。
2. 數據資產目錄的 4 個核心價值
數據資產目錄是數據管理的核心抓手,企業通過數據資產目錄能夠提高數據使用和開發的效率。
數據資產目錄主要有如下?4?個價值。

(1)統一數據管理
企業的?IT?團隊無法為越來越多的業務人員和數據分析師提供所需的所有數據,導致業務人員和數據分析師無法了解企業現有的數據集數量、數據集的內容以及每個數據集的質量和實用性。他們花費太多時間來查找和理解數據,經常重新創建已經存在的數據集,經常使用不正確的數據集,導致分析不充分和不正確,這也是精益數據方法所提到的浪費的核心根源。
所以幫助業務人員和數據分析師實現自助式數據生產是數據治理的根本,為此,要先實現數據的統一管理。
數據資產目錄應該是企業唯一且統一的數據資產管理工具,也是企業單一可信的數據出口。所以,數據資產目錄應該清晰、結構化地將所有的數據資產按類別或標簽進行管理,讓所有的用戶能夠在一套數據體系下、一個平臺上獲取、分析和利用數據,讓數據更容易被理解,從而減少錯誤,降低風險,提高數據分析效率,從而實現數據自助服務和分析。
(2)自助式探索分析
數據資產目錄應該對不同角色的用戶提供對應的數據探索、瀏覽和分析的功能,從而讓用戶方便地根據業務需要,用自己熟悉的方式瀏覽、查找、探索數據。
(3)安全合規保障
數據資產目錄對所有的數據、數據產品和服務進行分級、分類、分權限管理,根據不同的身份對用戶授權,滿足企業的數據安全合規的要求。
(4)高效協同生產
數據資產目錄是所有用戶訪問數據的唯一入口,要讓所有用戶能夠高效協同,比如提供統一的知識庫、數據自服務、數據標簽以及協同開發等功能。
3. 數據資產目錄優化企業數據生產全鏈路
在沒有數據資產目錄的時候,企業的數據生產全鏈路如圖?5-13?所示。

圖?5-13 沒有數據資產目錄時的企業數據生產全鏈路
由于沒有統一的數據管理工具,所有的數據相關的文檔、數據產品和數據都分散在企業不同的系統中,所以當需要數據的時候,工作人員就只能通過分散的文檔和各種溝通會議來獲得數據,然后評估數據是不是完整,再進行數據的探索和理解。如果數據不準確或者不是所需要的,則又要回到原點去尋找數據。
在數據處理和數據分析階段,相關人員如果需要更多的數據,就要尋找更多的數據文檔和組織更多的溝通會議。從尋找數據開始,到數據分析結果出來,再到數據產品構建好,這個過程費時費力,并且新的數據分析結果和數據產品又變成了數據孤島,當別人利用數據的時候依然需要溝通。這樣的過程低效、隨機性很大,并且很容易導致數據質量問題。
當企業構建起數據資產目錄后,數據生產的全鏈路就形成了,如圖?5-14?所示。

數據資產目錄支撐下的數據生產全鏈路
數據資產目錄是企業所有數據產品和元數據的管理工具,能夠集中地注冊、管理數據資產,全面地監控數據生產的過程,讓用戶對數據進行探索分析,把數據治理的工作分散融入數據生產全鏈路中。這樣從尋找數據、獲取數據、評估數據、理解數據、數據處理、分析數據,到最后數據結果和數據產品的分享,所有工作人員都可以實時通過數據資產目錄協作,而且所有的操作都會被記錄下來,不同人可以對數據進行點評、打標簽,分享自己對這個數據的理解,從而幫助其他人更好地查找和利用數據。數據資產目錄的目標是提供快速且低成本的方式來盤點、分類和組織分散且雜亂無章的數據資產,讓所有人用同一個工具進行數據的查找、訪問和協作。數據資產目錄幫助企業構建統一的一站式數據治理能力,是精益數據治理的典型實現方式。
數據資產目錄的典型功能模塊
企業數據資產目錄是數據治理和利用的核心工具,主要由如圖?5-15?所示的
功能模塊構成。
數據資產目錄的?8?個核心功能模塊

1. 數據獲取
數據資產目錄要提供全面的數據連接、獲取的功能,讓企業的各類數據能夠接入進來。在現在數據復雜度越來越高的情況下,企業數據資產目錄要兼容數據倉庫、數據湖、云上數據系統等多種數據源。但是,數據的存儲并不是數據資產目錄的核心功能,數據依然可以按業務需求以多種形式存儲在不同的地方。數據資產目錄要建立全面的數據注冊、接入、管理的能力,從而管理好每一個數據的全生命周期。
2. 數據探索
數據探索是數據資產目錄被使用最頻繁的功能,能幫助用戶縮短查找數據的時間,大幅度提升數據生產的效率。數據資產目錄提供的數據探索功能主要
有以下幾點作用。
●?幫助用戶搜索到需要的數據和數據產品。
●?幫助用戶查看數據,為用戶提供全面的數據描述信息,也就是元數據,
幫助用戶更好地理解數據。
●?幫助數據探索數據的全生命周期信息,也就是數據血緣,從而確認數據
的正確性。
所以,數據資產目錄要提供多樣化的數據探索功能,主要包括按關鍵詞搜索、按標簽搜索、按訪問熱度瀏覽、按相關性瀏覽等。數據運營人員要對用戶的行為數據等進行深度挖掘分析,從而幫助用戶快速定位到正確的數據,通過數據資產目錄給用戶推薦更匹配的數據。
3. 數據管理
數據資產目錄是根據數據資產藍圖構建的,界面信息呈樹狀結構。企業所有的數據資產,包括源數據、數據集、數據產品等,都要歸類并掛接到數據資產目錄中。并且數據資產目錄要通過豐富的業務和技術元數據對這些數據資產進行全面、清晰的描述,方便用戶打標簽和評論。
精益數據方法認為,數據資產目錄不僅要管理好源數據,還要將所有二次加工的數據、報表、數據集等納入管理。
4. 數據質量管理
數據資產目錄不僅具備數據資產倉庫的作用,還要依據元數據和數據質量標準規范,構建起數據質量管理的能力。數據資產目錄要按業務需求對所有的數據資產進行掃描,然后將數據質量反饋記錄下來,從而在管理數據的同時全面監控數據質量。數據資產目錄要能夠跟蹤數據質量,生成數據日志,方便用戶整理和準備數據。此外,數據資產目錄使用人工智能來自動管理數據質量,主要管理工作包括檢測最近更新的數據存儲的異常情況,將業務術語和標簽添加到新數據集,檢測可能關聯的數據集,改善搜索體驗。
5. 異常監測和管理
數據資產目錄要構建起自動的數據監測功能,通過將數據治理的規范標準嵌入腳本中,掃描數據資產實時獲取數據資產和數據加工過程中的異常情況,起到監測重要數據問題的作用。
6. 數據可視化和分析
用戶在找到數據后要進行數據可視化和數據分析,所以數據資產目錄也需要將數據可視化和分析的功能集成進來,為用戶提供流暢的使用體驗。
7. 數據共享和協作
數據的生產、加工和利用是一個集體活動,所以數據資產目錄也要提供一定的共享和協作功能,大幅減少用戶在查找、生產和利用數據過程中的浪費。
具體的共享和協作功能如下。
●?用戶可以共同編輯、維護元數據信息和數據知識庫。
●?用戶可以共享自己的數據探索、分析、生產、利用的成果,供其他用戶使用。
●?用戶可以給數據資產打標簽,做評論,從而發現問題,提出問題,供他人參考。
●?每一個數據和數據產品都關聯到具體的人或團隊,方便用戶之間進行交流。
●?用戶可以協作開發、協作編輯、協作建模。
8. 元數據管理
元數據管理是數據資產目錄最重要的功能,也是最基礎的功能。數據資產目錄的整體運作就是以元數據為基礎的。數據資產目錄應該全面地管理所有數據的兩類元數據:技術元數據和業務元數據。數據資產目錄不僅要實現對元數據的定義和管理,還要通過工具和技術手段對接入的數據源自動進行元數據的采集和生成,從而減少人工的工作量,提升數據治理的效率。
下一篇:指標中臺建設方法與實踐...