數(shù)據(jù)目錄是企業(yè)中的數(shù)據(jù)資產(chǎn)的有組織清單。
數(shù)據(jù)目錄被定義為一個(gè)組織中所有數(shù)據(jù)資產(chǎn)的清單。它幫助數(shù)據(jù)專業(yè)人員為任何分析或業(yè)務(wù)目的找到最相關(guān)的數(shù)據(jù)。數(shù)據(jù)目錄使用元數(shù)據(jù)來(lái)創(chuàng)建一個(gè)組織中所有數(shù)據(jù)資產(chǎn)的信息和可搜索清單。本文討論了數(shù)據(jù)目錄的定義,其構(gòu)建過(guò)程,以及數(shù)據(jù)目錄的十大最佳實(shí)踐。
什么是數(shù)據(jù)目錄?
數(shù)據(jù)目錄是一個(gè)組織中所有數(shù)據(jù)資產(chǎn)的清單,幫助數(shù)據(jù)專業(yè)人員為任何分析或業(yè)務(wù)目的找到最相關(guān)的數(shù)據(jù)。它作為一個(gè)數(shù)據(jù)清單,并提供必要的信息來(lái)評(píng)估數(shù)據(jù)對(duì)預(yù)期用途的適用性。它還幫助分析師和其他數(shù)據(jù)用戶找到他們?yōu)樘囟康乃璧哪繕?biāo)數(shù)據(jù)。
我經(jīng)常用圖書館對(duì)其進(jìn)行類比。
當(dāng)你想知道某本書在圖書館是否可用時(shí),你一般會(huì)使用圖書館目錄。除了它的可用性之外,目錄還告訴你這本書的版本和位置。
簡(jiǎn)而言之,目錄為你提供了該書的各種細(xì)節(jié),以決定你是否需要它。如果你想要,它還告訴你如何找到它。這是今天許多對(duì)象存儲(chǔ)、數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)基本提供。
現(xiàn)在讓我們把圖書館目錄的力量擴(kuò)展到全國(guó)的每一個(gè)圖書館。想象一下,你只有一個(gè)用戶界面(UI),而你可以找到全國(guó)每一個(gè)有你要找的書的圖書館。你還可以在這個(gè)用戶界面上找到你想要的關(guān)于這些書的所有細(xì)節(jié)。
這正是數(shù)據(jù)目錄對(duì)你所有的組織數(shù)據(jù)的作用。它為你提供了一個(gè)單一的、全面的視圖,對(duì)你的所有數(shù)據(jù)都有可見性,而不是每次只看到一個(gè)數(shù)據(jù)存儲(chǔ)。
Aberdeen Strategy & Research最近進(jìn)行的研究表明,數(shù)據(jù)目錄賦予用戶分析能力,這反過(guò)來(lái)又推動(dòng)了業(yè)務(wù)績(jī)效。擁有數(shù)據(jù)目錄的用戶不僅報(bào)告了總客戶群的增加,而且還報(bào)告了現(xiàn)有客戶滿意度的提高。
數(shù)據(jù)目錄的元數(shù)據(jù)主題

數(shù)據(jù)目錄元數(shù)據(jù)主題
在當(dāng)今大數(shù)據(jù)和自助分析時(shí)代,數(shù)據(jù)目錄已成為元數(shù)據(jù)管理的關(guān)鍵。現(xiàn)代的元數(shù)據(jù)比商業(yè)智能 (BI) 時(shí)代的元數(shù)據(jù)要廣泛得多。

數(shù)據(jù)目錄用戶推動(dòng)增強(qiáng)業(yè)務(wù)執(zhí)行(來(lái)源:Aberdeen Strategy & Research)根據(jù) Aberdeen 的研究, 當(dāng)今的公司處理的數(shù)據(jù)環(huán)境年增長(zhǎng)率超過(guò) 30%,有些遠(yuǎn)高于此。
數(shù)據(jù)目錄工具使數(shù)據(jù)團(tuán)隊(duì)能夠通過(guò)在集中式平臺(tái)上組織來(lái)自多個(gè)來(lái)源的數(shù)據(jù)來(lái)更有效地定位、理解和利用數(shù)據(jù)。數(shù)據(jù)目錄主要關(guān)注數(shù)據(jù)集(即可用數(shù)據(jù)的清單),然后將這些數(shù)據(jù)集與豐富的信息聯(lián)系起來(lái),讓相關(guān)人員了解管理數(shù)據(jù)的信息。數(shù)據(jù)目錄的核心包含以下元數(shù)據(jù)主題,讓我們?cè)敿?xì)看看每個(gè)元數(shù)據(jù)主題:
1、數(shù)據(jù)集
數(shù)據(jù)集是組織人員訪問(wèn)的文件和表。這些可能駐留在數(shù)據(jù)湖、倉(cāng)庫(kù)、主數(shù)據(jù)存儲(chǔ)庫(kù)或任何其他共享數(shù)據(jù)資源中。
2、人員元數(shù)據(jù)
這描述了使用數(shù)據(jù)的人員,包括消費(fèi)者、策展人、管家、主題專家等。
3、搜索元數(shù)據(jù)
此元數(shù)據(jù)支持標(biāo)記和關(guān)鍵字,以幫助人們查找數(shù)據(jù)。
4、處理元數(shù)據(jù)
此類別詳細(xì)說(shuō)明了在數(shù)據(jù)在其整個(gè)生命周期中進(jìn)行管理時(shí)應(yīng)用的各種轉(zhuǎn)換和派生。
5、供應(yīng)商元數(shù)據(jù)
供應(yīng)商元數(shù)據(jù)包括從外部來(lái)源獲取的數(shù)據(jù),因?yàn)樗嬷c數(shù)據(jù)相關(guān)的來(lái)源和訂閱或許可限制。
數(shù)據(jù)目錄流程:示例的關(guān)鍵步驟
構(gòu)建有效的數(shù)據(jù)目錄有五個(gè)步驟,讓我們?cè)敿?xì)看看每個(gè)步驟:
1、采集數(shù)據(jù)
構(gòu)建數(shù)據(jù)目錄需要采集所有數(shù)據(jù)。為了確保收集到正確的數(shù)據(jù),需要回答兩個(gè)問(wèn)題:要采集哪些元數(shù)據(jù)以及如何采集它?讓我們一次解決每一個(gè)問(wèn)題。
要采集哪些元數(shù)據(jù)?使用數(shù)據(jù)的形狀、結(jié)構(gòu)和語(yǔ)義填充數(shù)據(jù)目錄是構(gòu)建數(shù)據(jù)目錄的第一步。大多數(shù)數(shù)據(jù)用戶,例如數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師、業(yè)務(wù)分析師和其他人,都根據(jù)數(shù)據(jù)所在的模式或表來(lái)引用數(shù)據(jù)。
考慮以下問(wèn)題和答案作為示例:
我在哪里可以找到至少購(gòu)買了一件商品的客戶?檢查“cust_purchases”表 發(fā)票是如何產(chǎn)生的?
發(fā)票中包含一個(gè)或多個(gè)訂單。檢查“發(fā)票”和“訂單”表的數(shù)據(jù)。如果已支付發(fā)票,您可以在“付款”表中找到付款。
如今,流式數(shù)據(jù)和非表格數(shù)據(jù)(例如 JSON、Parquet 結(jié)構(gòu))隨處可見,而且它們的數(shù)量正在以越來(lái)越快的速度增長(zhǎng)。即使您今天不使用這些技術(shù),也要尋找支持嵌套數(shù)據(jù)結(jié)構(gòu)并允許您在未來(lái)集成流技術(shù)的數(shù)據(jù)目錄。
最后,有效的數(shù)據(jù)目錄必須能夠采集數(shù)據(jù)血緣。數(shù)據(jù)血緣使用戶能夠查看數(shù)據(jù)的來(lái)源以及數(shù)據(jù)的軌跡。這對(duì)于提供用戶在使用數(shù)據(jù)時(shí)經(jīng)常需要的上下文至關(guān)重要。
如何采集元數(shù)據(jù)?
構(gòu)建數(shù)據(jù)目錄后,您將需要一個(gè)可以代表您輕松填充目錄的工具。這可以節(jié)省大量時(shí)間,因?yàn)樗苊饬耸謩?dòng)更新數(shù)據(jù)生態(tài)系統(tǒng)中的每個(gè)數(shù)據(jù)庫(kù)、表和字段。所有主要數(shù)據(jù)庫(kù)和數(shù)據(jù)存儲(chǔ)(例如,AWS S3)都有可用的 API,允許您提取表示數(shù)據(jù)形狀和語(yǔ)義的元數(shù)據(jù)。因此,您應(yīng)該考慮在構(gòu)建數(shù)據(jù)目錄時(shí)自動(dòng)填充元數(shù)據(jù)的能力。
在某些情況下,您可能無(wú)法直接連接到您的數(shù)據(jù)庫(kù)。例如,考慮您不想公開敏感數(shù)據(jù),或者您正在使用不公開的托管數(shù)據(jù)庫(kù)。在這種情況下,您應(yīng)該能夠使用數(shù)據(jù)存儲(chǔ)中的示例文件和提取作為直接連接到數(shù)據(jù)庫(kù)的替代方法。
在最壞的情況下,當(dāng)一切都失敗時(shí),您應(yīng)該能夠自行快速采集數(shù)據(jù)而無(wú)需自動(dòng)化。記住不同數(shù)據(jù)庫(kù)的所有客戶端庫(kù)的更改頻率,不能保證完美的流程或工具。因此,選擇自己解決問(wèn)題對(duì)于構(gòu)建強(qiáng)大的數(shù)據(jù)目錄至關(guān)重要。
2、指定聯(lián)絡(luò)點(diǎn)
構(gòu)建數(shù)據(jù)目錄后,確定每個(gè)數(shù)據(jù)資產(chǎn)的重要人員是誰(shuí)很重要。因此,將所有者等數(shù)據(jù)用戶分配給您的數(shù)據(jù)資產(chǎn)非常重要。這使有其他問(wèn)題或疑問(wèn)的用戶可以聯(lián)系到合適的人。
各種數(shù)據(jù)用戶的問(wèn)題可以分為兩類:
此數(shù)據(jù)資產(chǎn)的業(yè)務(wù)上下文
Null 對(duì)這個(gè)字段意味著什么?
數(shù)據(jù)資產(chǎn)的技術(shù)屬性
誰(shuí)可以將此新字段添加到架構(gòu)中?
數(shù)據(jù)目錄可能有多種類型的所有者(例如,數(shù)據(jù)管理員、技術(shù)所有者、業(yè)務(wù)所有者、執(zhí)行所有者等)。但是,數(shù)據(jù)管理員和技術(shù)所有者發(fā)揮著重要作用。數(shù)據(jù)管理員使您的用戶能夠知道向誰(shuí)尋求所有與業(yè)務(wù)相關(guān)的信息。同時(shí),技術(shù)所有者可以回答數(shù)據(jù)用戶可能遇到的面向技術(shù)的問(wèn)題。
創(chuàng)建數(shù)據(jù)目錄時(shí),您可以將任務(wù)分配給您的所有者。這些任務(wù)旨在確保您的數(shù)據(jù)目錄有據(jù)可查并且對(duì)其他團(tuán)隊(duì)成員有用。
3、記錄每一次互動(dòng)
當(dāng)你開始在數(shù)據(jù)目錄中記錄你的數(shù)據(jù)時(shí),你希望捕捉的信息量一開始可能會(huì)顯得很龐大。假設(shè)你有兩個(gè)數(shù)據(jù)庫(kù),每個(gè)數(shù)據(jù)庫(kù)有幾十個(gè)表。每張表又有少量的字段。在這一刻,你似乎已經(jīng)看到了幾千個(gè)數(shù)據(jù)資產(chǎn)。
因此,你可以從選擇一個(gè)單一的方法論開始,并隨著時(shí)間的推移慢慢增加文檔。這將確保你在幾個(gè)月內(nèi)達(dá)到一定的覆蓋率,也許是90%或更少。
一些常見的方法論包括:
每當(dāng)你了解到這一點(diǎn),就把它記錄下來(lái)
每個(gè)人都應(yīng)該負(fù)責(zé)更新數(shù)據(jù)目錄,當(dāng)他們了解到一些還沒有被記錄的新東西時(shí)。
當(dāng)代碼發(fā)生變化時(shí),改變文檔的內(nèi)容
當(dāng)團(tuán)隊(duì)發(fā)布新功能時(shí),相關(guān)的團(tuán)隊(duì)成員應(yīng)該更新數(shù)據(jù)文檔。
為團(tuán)隊(duì)成員留出時(shí)間
要求你的每個(gè)團(tuán)隊(duì)成員每周花一個(gè)小時(shí),或者每天早上花15分鐘在數(shù)據(jù)目錄上。這將使他們能夠?yàn)樗麄兪煜さ臄?shù)據(jù)資產(chǎn)添加新的文檔,或者研究他們不知道的數(shù)據(jù)資產(chǎn)。所有的數(shù)據(jù)資產(chǎn)在數(shù)據(jù)目錄中都應(yīng)該有豐富的文本文檔,讓用戶能夠突出關(guān)鍵點(diǎn)。數(shù)據(jù)目錄還應(yīng)該為用戶提供能力,將資產(chǎn)歸入共同集。這可以通過(guò)對(duì)數(shù)據(jù)的標(biāo)記來(lái)實(shí)現(xiàn)。例如,如果你想看到一份關(guān)于你所有個(gè)人身份信息(PII)的報(bào)告,你可以用 "PII "來(lái)標(biāo)記你所有包含此類數(shù)據(jù)的表和字段。此外,當(dāng)你的數(shù)據(jù)目錄允許你的用戶與你的數(shù)據(jù)進(jìn)行對(duì)話時(shí),你就能釋放出文檔的力量。當(dāng)一個(gè)用戶有一個(gè)關(guān)于數(shù)據(jù)的問(wèn)題,并且該數(shù)據(jù)最終得到了回答--那么這個(gè)問(wèn)題、答案以及導(dǎo)致答案的對(duì)話都應(yīng)該在目錄中被記錄下來(lái)。 這允許下一個(gè)有類似問(wèn)題的數(shù)據(jù)用戶能夠查看之前的對(duì)話,并了解答案的背景。這可以節(jié)省時(shí)間,因?yàn)闊o(wú)數(shù)次重復(fù)相同問(wèn)題和答案的對(duì)話都會(huì)被記錄下來(lái)。比如說(shuō)。
A:我如何從我的電腦連接到數(shù)據(jù)庫(kù)?
B:你只需要登錄到VPN,就可以直接指向數(shù)據(jù)庫(kù)主機(jī)。(有記錄)
在這個(gè)例子中,A君可以參考B君的文檔化答案,了解所需的解決方案。
4、確保數(shù)據(jù)目錄是最新的
組織所面臨的主要挑戰(zhàn)之一是保持?jǐn)?shù)據(jù)目錄的新鮮。開發(fā)人員一般會(huì)在一段時(shí)間內(nèi)改變數(shù)據(jù)庫(kù)的結(jié)構(gòu),并經(jīng)常創(chuàng)建新的管道。
數(shù)據(jù)科學(xué)家和業(yè)務(wù)分析師一般會(huì)創(chuàng)建數(shù)據(jù)立方體或在分析環(huán)境之間移動(dòng)數(shù)據(jù),以創(chuàng)建新的儀表板,也同樣頻繁。引用這些模式,你的數(shù)據(jù)目錄應(yīng)該盡可能地自動(dòng)識(shí)別這些變化,并相應(yīng)地更新自己。
為了確保數(shù)據(jù)目錄是新鮮的,一些用戶互動(dòng)來(lái)仔細(xì)檢查信息的質(zhì)量和呆滯性是很重要的。你的數(shù)據(jù)目錄可以使用治理行動(dòng)來(lái)推動(dòng)你的用戶在他們認(rèn)為基礎(chǔ)文件可能是舊的或過(guò)時(shí)的時(shí)候采取行動(dòng)。
5、根據(jù)需要進(jìn)行優(yōu)化
每個(gè)公司都根據(jù)他們的要求和需要來(lái)使用數(shù)據(jù)目錄。所以,你需要為你希望你的組織利用數(shù)據(jù)目錄的方式設(shè)定標(biāo)準(zhǔn)和規(guī)范。這里需要注意的是,你的團(tuán)隊(duì)計(jì)劃使用數(shù)據(jù)目錄的方式將高度影響你捕捉文檔的方式。
因此,如果你不知道你的團(tuán)隊(duì)將如何使用數(shù)據(jù)目錄,那么你花在記錄數(shù)據(jù)上的時(shí)間很可能會(huì)導(dǎo)致不充分的結(jié)果。你的團(tuán)隊(duì)可以做的一些常見做法,以優(yōu)化你與數(shù)據(jù)目錄的互動(dòng):
設(shè)置標(biāo)準(zhǔn)化的文檔格式,并跨數(shù)據(jù)庫(kù)、模式、字段和數(shù)據(jù)線使用。
確定關(guān)鍵的學(xué)習(xí)模塊,并用一個(gè)共同的主題來(lái)標(biāo)記每個(gè)學(xué)習(xí)模塊中包含的資產(chǎn)。
強(qiáng)調(diào)團(tuán)隊(duì)對(duì)數(shù)據(jù)目錄使用的規(guī)范。這將使數(shù)據(jù)文化在團(tuán)隊(duì)成員中深深扎根。
數(shù)據(jù)目錄的十大最佳實(shí)踐
數(shù)據(jù)目錄可以成為強(qiáng)大的數(shù)據(jù)管理平臺(tái)。然而,如果沒有適當(dāng)?shù)臄?shù)據(jù)編目方法,數(shù)據(jù)目錄的力量和功能可能會(huì)付之東流。考慮到這一點(diǎn),以下是數(shù)據(jù)目錄的十大最佳實(shí)踐。

數(shù)據(jù)目錄的十大最佳實(shí)踐
1、把所有的東西都加入到你的清單中
數(shù)據(jù)無(wú)處不在--文本文件、電子表格,以及更多。
盡管數(shù)據(jù)可能是分散的,然而在你清點(diǎn)所有東西之前,你甚至無(wú)法開始解決數(shù)據(jù)問(wèn)題。團(tuán)隊(duì)中的每個(gè)人都應(yīng)該接受培訓(xùn),思考他們的數(shù)據(jù)可能依附的所有地方。然后確保每一個(gè)分散的數(shù)據(jù)都被編入目錄。
2、管理數(shù)據(jù)流
數(shù)據(jù)脈絡(luò)和出處工具是好的,但它們中的大多數(shù)都是在一個(gè)已知的領(lǐng)域或一組領(lǐng)域內(nèi)映射出數(shù)據(jù)流。
一個(gè)好的數(shù)據(jù)目錄,一個(gè)由數(shù)據(jù)流發(fā)現(xiàn)支持的目錄,往往會(huì)識(shí)別不同數(shù)據(jù)集之間的流動(dòng)。這樣的安排可以幫助你發(fā)現(xiàn)你的組織內(nèi)可能不為人知的數(shù)據(jù)流動(dòng)。然后,這些流動(dòng)可以被檢查是否有效。因此,管理數(shù)據(jù)流是建立一個(gè)有效的數(shù)據(jù)目錄的良好做法。
3、優(yōu)先處理敏感數(shù)據(jù)
有效的數(shù)據(jù)目錄的主要目的之一是幫助識(shí)別敏感數(shù)據(jù)的位置。
在多個(gè)地方發(fā)現(xiàn)相同的敏感數(shù)據(jù)的情況下,它可以幫助識(shí)別冗余的數(shù)據(jù)。因此,管理敏感數(shù)據(jù)和冗余數(shù)據(jù)可以使你最大限度地減少漏洞的表面積,并建立強(qiáng)大的數(shù)據(jù)保護(hù),防止任何外部攻擊。
4、考慮非結(jié)構(gòu)化數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)(文檔、網(wǎng)頁(yè)、電子郵件、社交媒體內(nèi)容、移動(dòng)數(shù)據(jù)、圖像、音頻和視頻)是不符合數(shù)據(jù)模型的數(shù)據(jù),沒有容易識(shí)別的結(jié)構(gòu)。
它并不適合主流的關(guān)系型數(shù)據(jù)庫(kù)。也就是說(shuō),你的數(shù)據(jù)目錄可以幫助將隱性的數(shù)據(jù)結(jié)構(gòu)顯性化。這可以通過(guò)根據(jù)團(tuán)隊(duì)或組織要求重新設(shè)計(jì)整體數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)。因此,考慮 "非結(jié)構(gòu)化 "數(shù)據(jù)對(duì)任何數(shù)據(jù)目錄都是至關(guān)重要的。
5、指定可發(fā)現(xiàn)的名稱和描述
一個(gè)好的名稱和冗長(zhǎng)的描述將使你的數(shù)據(jù)更容易被相關(guān)的團(tuán)隊(duì)成員發(fā)現(xiàn)。描述可以指出同一對(duì)象的其他名稱,并幫助建立一個(gè)全面的數(shù)據(jù)本體。
6、區(qū)別對(duì)待數(shù)據(jù)湖表
在關(guān)系型數(shù)據(jù)庫(kù)中,數(shù)據(jù)可能分散在多個(gè)表中。然而,數(shù)據(jù)湖傾向于將大量的數(shù)據(jù)擠入單個(gè)文件。
在商業(yè)智能領(lǐng)域,一個(gè)單一的數(shù)據(jù)集可能會(huì)將措施和維度存儲(chǔ)在一起,而不是分開。即使是在數(shù)據(jù)庫(kù)中以表格形式表示數(shù)據(jù)的系統(tǒng)也是如此。這可能會(huì)使數(shù)據(jù)的可發(fā)現(xiàn)性降低,但數(shù)據(jù)目錄可以正面解決這個(gè)問(wèn)題。
7、提供透明的評(píng)級(jí)
在你的數(shù)據(jù)目錄中,眾包的評(píng)級(jí)、認(rèn)可和負(fù)面評(píng)級(jí)可以幫助用戶以更快的方式獲得相關(guān)和可靠的信息。但這需要嚴(yán)格的標(biāo)準(zhǔn)。數(shù)據(jù)不應(yīng)該得到五星評(píng)級(jí),除非它符合一個(gè)非常高標(biāo)準(zhǔn)的基準(zhǔn)。
同樣地,好的數(shù)據(jù)也不應(yīng)該被評(píng)為差的。用戶需要對(duì)評(píng)級(jí)有信心,否則他們就不會(huì)信任它們。因此,一個(gè)組織應(yīng)該確保標(biāo)準(zhǔn)的統(tǒng)一和精確。
8、讓它成為一個(gè)湖,而不是一個(gè)沼澤
在你的數(shù)據(jù)湖中對(duì)所有的東西進(jìn)行編目,使你能夠組織它并使它可用。一旦你的湖被編入目錄,你就可以在其中建立區(qū)域,使其成為業(yè)務(wù)用戶獲取數(shù)據(jù)的首選之地,而不僅僅是他們傾倒數(shù)據(jù)的地方。
9、采用數(shù)據(jù)驗(yàn)證規(guī)則
數(shù)據(jù)目錄中的英文描述很重要,因?yàn)樗鼈冇兄谟涗浐土魍ㄋ^的過(guò)時(shí)的知識(shí)給各種業(yè)務(wù)用戶。這需要技術(shù)專家的參與,因?yàn)閲?yán)格的數(shù)據(jù)驗(yàn)證規(guī)則可以幫助驗(yàn)證數(shù)據(jù)是否符合目錄的定義。這樣的過(guò)程保證了數(shù)據(jù)質(zhì)量,并作為對(duì)更多定性星級(jí)的檢查。
因此,在數(shù)據(jù)目錄中采用精簡(jiǎn)的驗(yàn)證規(guī)則可以在數(shù)據(jù)用戶中灌輸信任。
10、利用機(jī)器學(xué)習(xí)技術(shù)
由于數(shù)據(jù)量的增加,手工編目在今天是一項(xiàng)不可能完成的任務(wù)。
隨著新數(shù)據(jù)的到來(lái),編目工作根本無(wú)法完成,甚至無(wú)法跟上步伐。然而,機(jī)器學(xué)習(xí)(ML)是一個(gè)很有前途的工具,可以對(duì)數(shù)量問(wèn)題進(jìn)行控制。ML模型可以識(shí)別數(shù)據(jù)類型和關(guān)系。這有助于在更多的數(shù)據(jù)集上建立你的目錄。它也比手動(dòng)目錄更快地在更多的對(duì)象上傳播數(shù)據(jù)標(biāo)簽。
因此,如果你的數(shù)據(jù)目錄沒有在實(shí)際數(shù)據(jù)中利用ML,你可能在數(shù)據(jù)驅(qū)動(dòng)的旅程中面臨巨大的阻力。總之,數(shù)據(jù)目錄是你的數(shù)據(jù)的指南,它以對(duì)你、你的團(tuán)隊(duì)和你的業(yè)務(wù)有意義的方式來(lái)組織。
有了一個(gè)精簡(jiǎn)的方法,你就能在管理、治理和利用你的數(shù)據(jù)方面發(fā)揮其最大的潛力。以上的頂級(jí)實(shí)踐應(yīng)該給你在數(shù)據(jù)目錄的道路上一個(gè)良好的開端。
關(guān)鍵點(diǎn)總結(jié)
在一個(gè)組織實(shí)現(xiàn)數(shù)據(jù)智能的過(guò)程中,數(shù)據(jù)目錄發(fā)揮著關(guān)鍵作用。它是推動(dòng)收入、優(yōu)化運(yùn)營(yíng)效率、促進(jìn)創(chuàng)新和增長(zhǎng)的一個(gè)重要因素。既然你已經(jīng)意識(shí)到了數(shù)據(jù)目錄的意義,我們希望你能部署一個(gè)最適合你的業(yè)務(wù)需求的數(shù)據(jù)目錄。
億信ABI是什么
ABI = ALL in one BI,億信ABI是一款全能型數(shù)據(jù)分析產(chǎn)品,融合了數(shù)據(jù)源適配、ETL數(shù)據(jù)處理、數(shù)據(jù)建模、數(shù)據(jù)分析、數(shù)據(jù)填報(bào)、工作流、門戶、移動(dòng)應(yīng)用等核心功能而打造的一站式數(shù)據(jù)分析平臺(tái),為企業(yè)提供一站式大數(shù)據(jù)BI解決方案。
來(lái),先一張圖了解整體架構(gòu)↓

再來(lái)一張圖了解能力地圖↓

02億信ABI能做什么
沉淀17年,億信華辰致力于為企業(yè)提供一站式大數(shù)據(jù)BI解決方案,我們一直在不斷拓展億信ABI的應(yīng)用場(chǎng)景邊界,支持以下應(yīng)用場(chǎng)景:
1.企業(yè)運(yùn)營(yíng)看板/大屏
億信ABI內(nèi)置300+可視化組件,讓用戶在短時(shí)間內(nèi),快速搭建一個(gè)酷炫的可視化看板或大屏,支持包括指揮中心、會(huì)議展廳、匯報(bào)演示等業(yè)務(wù)場(chǎng)景應(yīng)用,實(shí)時(shí)監(jiān)控核心數(shù)據(jù)、智能預(yù)警,讓企業(yè)的運(yùn)營(yíng)者、管理者實(shí)時(shí)了解生產(chǎn)運(yùn)營(yíng)情況,快速做出戰(zhàn)略決策。

2.中國(guó)式復(fù)雜報(bào)表
億信ABI采用類Excel在線設(shè)計(jì)器,支持多級(jí)表頭、分組、表元合并、斜線表元、多級(jí)浮動(dòng)、多表體等復(fù)雜報(bào)表樣式,讓業(yè)務(wù)人員無(wú)需依賴于IT人員,也能夠快速、高效地設(shè)計(jì)任意“格式復(fù)雜、信息量大”的中國(guó)式復(fù)雜報(bào)表,滿足公司業(yè)務(wù)需求。

3.自助式探索分析
億信ABI可以通過(guò)拖拉拽的方式進(jìn)行數(shù)據(jù)的分析和探索。拖拽維度和指標(biāo),即可快速生成圖表。同時(shí),能夠根據(jù)數(shù)據(jù)特征自動(dòng)適配圖形進(jìn)行展示,并提供圖形推薦列表供用戶選擇。自助式數(shù)據(jù)探索,賦能于業(yè)務(wù)人員,實(shí)現(xiàn)人人都是數(shù)據(jù)分析師。

4.數(shù)據(jù)填報(bào)分析一體化
通過(guò)表單填報(bào)、表格填報(bào)實(shí)現(xiàn)數(shù)據(jù)的采集與補(bǔ)錄,支持添加校驗(yàn)及流程審批,可保障數(shù)據(jù)完整性,提升數(shù)據(jù)分析質(zhì)量,也可輕松打造采集與分析一體化的業(yè)務(wù)應(yīng)用系統(tǒng)。

5.數(shù)據(jù)處理分析一體化
集數(shù)據(jù)建模及ETL設(shè)計(jì)的功能于一體,可預(yù)先對(duì)數(shù)據(jù)源進(jìn)行整合及處理,幫助政府和企業(yè)構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),提高數(shù)據(jù)質(zhì)量,實(shí)現(xiàn)數(shù)據(jù)融合。

6.多樣化的報(bào)告分析
億信ABI支持圖文并茂的word分析報(bào)告,采用參數(shù)過(guò)濾的方式來(lái)制作報(bào)告,圖表取自于報(bào)表,對(duì)報(bào)表中相應(yīng)的數(shù)據(jù)格添加過(guò)濾條件,這樣就可以實(shí)現(xiàn)報(bào)告自動(dòng)化。同時(shí)還支持即席報(bào)告、PPT報(bào)告。

7.語(yǔ)音交互, 智能分析
億信ABI也是一款智能BI,可通過(guò)文字輸入或語(yǔ)音方式提問(wèn) ,利用自然語(yǔ)言分析引擎解析翻譯,深度識(shí)別用戶意圖,幫助用戶更容易地獲得數(shù)據(jù)洞見,實(shí)現(xiàn)分析結(jié)果隨思而行,即問(wèn)即答,極大降低數(shù)據(jù)分析門檻。

8.移動(dòng)跨屏分析
億信ABI支持PC、iPad和手機(jī)等移動(dòng)設(shè)備的應(yīng)用,無(wú)縫對(duì)接微信、釘釘?shù)華PP,可隨時(shí)隨地地通過(guò)移動(dòng)設(shè)備進(jìn)行數(shù)據(jù)的采集和分析,實(shí)時(shí)跟蹤業(yè)務(wù)變化,高效協(xié)同辦公,從而輔助決策。

03億信ABI的優(yōu)勢(shì)在哪
億信華辰一直以來(lái),希望用更智能、更多元、更好用的產(chǎn)品,為企業(yè)提供BI數(shù)據(jù)分析與可視化展現(xiàn)于一體的解決方案,而億信ABI作為BI領(lǐng)域集大成者,更是優(yōu)勢(shì)突出:
1.一站式數(shù)據(jù)服務(wù)能力
覆蓋數(shù)據(jù)接入、到數(shù)據(jù)建模與處理、再到數(shù)據(jù)分析與挖掘整個(gè)數(shù)據(jù)應(yīng)用全鏈路,降低實(shí)施、集成成本。
2.一體化的數(shù)據(jù)建模能力
支持跨不同數(shù)據(jù)查詢整合,與分布式ETL一體化,提供敏捷建模、智能計(jì)算,全面支撐各種數(shù)據(jù)準(zhǔn)備需求。
3.超大數(shù)據(jù)量實(shí)時(shí)處理
依靠強(qiáng)大的計(jì)算分析引擎,高速緩存等技術(shù),完美支持海量歷史數(shù)據(jù)多維查詢與分析等場(chǎng)景,大大提高計(jì)算性能,實(shí)現(xiàn)億級(jí)秒級(jí)響應(yīng)。
4.領(lǐng)先的智能分析能力
運(yùn)用自然語(yǔ)言分析、機(jī)器學(xué)習(xí)等智能分析能力,提升分析廣度和深度,自動(dòng)化的AI技術(shù),催生更多“民間數(shù)據(jù)科學(xué)家”。
當(dāng)然,這種展示在用戶眼前的界面上的內(nèi)容,除了要好看、易用,最重要的是要速度,不能給人一種很慢,很卡頓的感覺,這樣才能提升用戶體驗(yàn)。有啥技術(shù)亮點(diǎn),話不多說(shuō)上圖。

其實(shí)產(chǎn)品的特色有很多,不是通過(guò)簡(jiǎn)單的一兩句話能闡述清楚。說(shuō)到這里,如果您有BI數(shù)據(jù)分析的難題,就直接聯(lián)系我們吧,相信我們定能助您一臂之力。
(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)