日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數(shù)據(jù)治理平臺(tái)

睿治作為國(guó)內(nèi)功能最全的數(shù)據(jù)治理產(chǎn)品之一,入選IDC企業(yè)數(shù)據(jù)治理實(shí)施部署指南。同時(shí),在IDC發(fā)布的《中國(guó)數(shù)據(jù)治理市場(chǎng)份額》報(bào)告中,連續(xù)四年蟬聯(lián)數(shù)據(jù)治理解決方案市場(chǎng)份額第一。

數(shù)據(jù)中臺(tái)-標(biāo)簽建設(shè)-標(biāo)簽層設(shè)計(jì)

時(shí)間:2022-10-17來(lái)源:我不難過(guò)瀏覽數(shù):927

前言

中臺(tái):貼源?- 數(shù)倉(cāng) - 標(biāo)簽 - 應(yīng)用

標(biāo)簽層對(duì)象-標(biāo)識(shí)-標(biāo)簽層次-標(biāo)簽設(shè)計(jì)-標(biāo)簽匯集表

標(biāo)簽設(shè)計(jì)

通過(guò)標(biāo)簽類(lèi)目設(shè)計(jì),已經(jīng)有了某類(lèi)對(duì)象的標(biāo)簽體系框架,只是還沒(méi)有具體的標(biāo)簽內(nèi)容。標(biāo)簽設(shè)計(jì)就是設(shè)計(jì)合適的標(biāo)簽并將其掛載到標(biāo)簽類(lèi)目。

前面介紹標(biāo)簽按照產(chǎn)生和計(jì)算方式的不同可以分為屬性標(biāo)簽、統(tǒng)計(jì)標(biāo)簽、算法標(biāo)簽,每一類(lèi)標(biāo)簽深挖下去,都可以有無(wú)數(shù)個(gè)。這里探討什么樣的標(biāo)簽才是需要的、有什么原則以及注意事項(xiàng)。

標(biāo)簽本質(zhì)上是一種對(duì)客觀世界中實(shí)體對(duì)象的度量或描述,是經(jīng)過(guò)縝密的邏輯分析和處理后的產(chǎn)物,用以引導(dǎo)發(fā)揮數(shù)據(jù)應(yīng)用價(jià)值。數(shù)據(jù)必須轉(zhuǎn)化成能幫助業(yè)務(wù)提升的標(biāo)簽才具有價(jià)值,否則就是數(shù)據(jù)負(fù)累。因此大數(shù)據(jù)業(yè)內(nèi)一直嘗試探索的最核心環(huán)節(jié)就是數(shù)據(jù)的商業(yè)變現(xiàn),或者叫數(shù)據(jù)到商機(jī)價(jià)值之間的橋梁通道建設(shè)。

標(biāo)簽即業(yè)務(wù)需求的數(shù)據(jù)呈現(xiàn),商業(yè)價(jià)值核心承載在標(biāo)簽上,再配以相應(yīng)的工程化能力,將標(biāo)簽快速、穩(wěn)定、便捷地輸送到業(yè)務(wù)以供使用,即完成了數(shù)據(jù)服務(wù)過(guò)程。

將數(shù)據(jù)提煉轉(zhuǎn)化為標(biāo)簽的過(guò)程就叫標(biāo)簽化,也就是標(biāo)簽設(shè)計(jì)過(guò)程。一個(gè)好的標(biāo)簽設(shè)計(jì),等于已經(jīng)完成了好的數(shù)據(jù)服務(wù)50%的工作,標(biāo)簽設(shè)計(jì)考驗(yàn)的是理解、抽象、提煉、提升業(yè)務(wù)場(chǎng)景的數(shù)據(jù)能力。標(biāo)簽設(shè)計(jì)要充分考慮兩大前提條件。

1)標(biāo)簽必須是業(yè)務(wù)上需要的,能體現(xiàn)業(yè)務(wù)價(jià)值,幫助業(yè)務(wù)人員做出業(yè)務(wù)判斷或者能創(chuàng)造性的地喚醒新業(yè)務(wù)場(chǎng)景的數(shù)據(jù)項(xiàng),在業(yè)務(wù)中往往會(huì)稱(chēng)其為屬性、特征、指標(biāo)、參數(shù)等。

2)必須要探查清楚根據(jù)業(yè)務(wù)需求提煉、整理出的標(biāo)簽是否具有數(shù)據(jù)可行性,是否有原始數(shù)據(jù)可以用于加工成標(biāo)簽,不能天馬行空,沒(méi)有落地點(diǎn)。

在分析業(yè)務(wù)需求,設(shè)計(jì)出初始業(yè)務(wù)所需標(biāo)簽的基礎(chǔ)上,要進(jìn)行數(shù)據(jù)可行性分析,剔除沒(méi)有數(shù)據(jù)支撐的標(biāo)簽,這是一個(gè)篩減調(diào)整的過(guò)程。數(shù)據(jù)可行性的判斷需要了解數(shù)據(jù)源有哪些,了解數(shù)據(jù)普查信息及數(shù)據(jù)字典信息,充分利用數(shù)據(jù)設(shè)計(jì)豐富的標(biāo)簽以保障標(biāo)簽的落地可行性。更多:用戶(hù)畫(huà)像-標(biāo)簽體系(dwt層)

了解了標(biāo)簽設(shè)計(jì)的兩個(gè)前提條件,就可以著手設(shè)計(jì)滿(mǎn)足條件的標(biāo)簽了。標(biāo)簽的設(shè)計(jì)是業(yè)務(wù)需求與經(jīng)驗(yàn)結(jié)合的結(jié)晶,是一個(gè)漫長(zhǎng)的持續(xù)迭代的過(guò)程,沒(méi)有一個(gè)具體的步驟可以快速構(gòu)建。

提到標(biāo)簽,有一些容易混淆的概念,比如標(biāo)簽類(lèi)目和標(biāo)簽、標(biāo)簽與標(biāo)簽值。標(biāo)簽設(shè)計(jì)的內(nèi)容不僅包括標(biāo)簽名,還要有歸屬標(biāo)簽類(lèi)目、計(jì)算邏輯、取值范圍、安全等級(jí)等。

另外標(biāo)簽設(shè)計(jì)也有一些必須關(guān)注的事項(xiàng)。厘清標(biāo)簽設(shè)計(jì)容易混淆的一些概念、設(shè)計(jì)所包含的內(nèi)容及注意事項(xiàng),有助于設(shè)計(jì)出更規(guī)范化、體系化、可擴(kuò)展的標(biāo)簽體系。

1.標(biāo)簽根目錄、標(biāo)簽類(lèi)目、標(biāo)簽和標(biāo)簽值

標(biāo)簽根目錄指的是標(biāo)簽的對(duì)象,往往是一種較為模糊、寬泛、簡(jiǎn)單的名詞或動(dòng)詞,例如購(gòu)房者、旅游酒店、報(bào)修。按照之前提到的大數(shù)據(jù)思維,世上的一切事物都可以歸類(lèi)為人、物、場(chǎng)景三類(lèi)對(duì)象,因此一個(gè)用來(lái)指向某個(gè)對(duì)象的詞(名詞指向人、物,動(dòng)詞指向場(chǎng)景)都不應(yīng)該是標(biāo)簽,往往是根目錄。在物理層面可以和某張大寬表中的主鍵對(duì)應(yīng),這張大寬表是對(duì)該主鍵對(duì)象的詳細(xì)刻畫(huà)和數(shù)據(jù)記錄。

對(duì)對(duì)象的拆分及對(duì)象的角度、層面或過(guò)程,一般是類(lèi)目,例如基本信息、地理位置、社交關(guān)系、功能效用、從屬關(guān)系、準(zhǔn)備、過(guò)程、結(jié)果等,也往往由名詞構(gòu)成。在物理層面可以和某張具體表對(duì)應(yīng),多張這樣的具體表按照共同的主鍵關(guān)聯(lián)在一起就可以形成該主鍵對(duì)象的大寬表。對(duì)對(duì)象具體屬性、特征、信息、內(nèi)容的字段級(jí)刻畫(huà),是標(biāo)簽,例如購(gòu)房者姓名、購(gòu)房者電話(huà)、旅游酒店地址、報(bào)修工單號(hào)、報(bào)修時(shí)間,往往由前后兩個(gè)名詞構(gòu)成,前一次名詞作為定語(yǔ)修飾后一個(gè)名詞。

在物理層面可以和某張具體表中的字段對(duì)應(yīng),因此最近1天報(bào)修工單量、最近3天報(bào)修工單量、最近7天報(bào)修工單量,這些時(shí)間維度不同、統(tǒng)計(jì)方式和統(tǒng)計(jì)對(duì)象相同的標(biāo)簽,屬于3個(gè)標(biāo)簽,因?yàn)樗牡讓佑?個(gè)字段一一對(duì)應(yīng)。對(duì)對(duì)象屬性、特征、信息、內(nèi)容的具體取值,是標(biāo)簽值,例如張三、李四是購(gòu)房者名稱(chēng)這個(gè)標(biāo)簽的標(biāo)簽值,男、女是性別這個(gè)標(biāo)簽的標(biāo)簽值,往往由形容詞、名詞、數(shù)字組成。在物理層面可以和某張具體表中的字段值字典對(duì)應(yīng),標(biāo)簽值有些是可枚舉的離散值,有些是不可枚舉的連續(xù)值。

要特別注意的是,往常習(xí)慣給別人打標(biāo)簽、貼標(biāo)簽的動(dòng)作,其實(shí)不是在設(shè)計(jì)標(biāo)簽,而是在設(shè)計(jì)標(biāo)簽值。例如對(duì)某個(gè)人的定義“女、20~30歲、白領(lǐng)、活潑開(kāi)朗”,分別是性別、年齡段、職業(yè)、性格標(biāo)簽的具體標(biāo)簽值。

在標(biāo)簽設(shè)計(jì)實(shí)際過(guò)程中,經(jīng)常會(huì)碰到的問(wèn)題是,同一個(gè)標(biāo)簽是否能夠多掛,即一個(gè)標(biāo)簽是否會(huì)屬于多個(gè)葉子類(lèi)目。

在標(biāo)簽體系方法論中,沒(méi)有嚴(yán)格規(guī)定允許還是不允許多掛,方法論的最核心思維是必須結(jié)合企業(yè)自身需要來(lái)設(shè)計(jì)組織標(biāo)簽類(lèi)目體系。因此一家企業(yè)如果按照自身需要用嚴(yán)格不冗余的做法來(lái)組織安排標(biāo)簽分類(lèi)的話(huà),就不能多掛。如果企業(yè)沒(méi)有嚴(yán)格要求,為了最大限度幫助業(yè)務(wù)同事用數(shù)據(jù)的方式理解事物,或在所需場(chǎng)景中找到所需數(shù)據(jù),或根據(jù)現(xiàn)有數(shù)據(jù)激發(fā)新場(chǎng)景思考設(shè)計(jì),則在必要時(shí)可以多掛,但這并不意味著所有可以多掛的標(biāo)簽都要多掛,因?yàn)槟菢訒?huì)引起冗余問(wèn)題。

一般情況下,如果是個(gè)別標(biāo)簽具備多種類(lèi)目歸屬,是可以多掛的;但是如果是一整片大批量標(biāo)簽都有多重屬性,建議單獨(dú)成立一個(gè)類(lèi)目。總而言之,視企業(yè)具體情況而定,做好平衡即可。

2.標(biāo)簽設(shè)計(jì)內(nèi)容

標(biāo)簽的標(biāo)簽,即元標(biāo)簽的設(shè)計(jì)內(nèi)容主要包括標(biāo)簽類(lèi)目、標(biāo)簽名、標(biāo)簽加工類(lèi)型、標(biāo)簽邏輯、值字典、取值類(lèi)型、示例、更新周期、安全等級(jí)、表名、字段名、負(fù)責(zé)人、完成時(shí)間等。其中“標(biāo)簽類(lèi)目、標(biāo)簽名、標(biāo)簽加工類(lèi)型、標(biāo)簽邏輯、值字典、取值類(lèi)型、示例、更新周期、安全等級(jí)”偏向業(yè)務(wù)方向,主要登記與業(yè)務(wù)所需相關(guān)的指標(biāo);“表名、字段名、負(fù)責(zé)人、完成時(shí)間”偏向技術(shù)方向,主要登記的技術(shù)開(kāi)發(fā)實(shí)施過(guò)程相關(guān)的指標(biāo)。

3.標(biāo)簽設(shè)計(jì)注意事項(xiàng)

1)某具體對(duì)象某標(biāo)簽的標(biāo)簽值,只允許有一條記錄,即對(duì)應(yīng)在數(shù)據(jù)表里,是一個(gè)字段取值。例如人的某個(gè)標(biāo)簽的標(biāo)簽值,在用戶(hù)表里就一個(gè)值一條記錄,不存在多條記錄,人有“性別”這個(gè)標(biāo)簽,每個(gè)人的“性別”取值就一個(gè),要么男,要么女,要么未知,不存在男、女兩條取值記錄。

性別標(biāo)簽容易理解,再舉一個(gè)復(fù)雜一些的例子——“同住時(shí)長(zhǎng)”標(biāo)簽。該標(biāo)簽可能是人的標(biāo)簽,也有可能是同住關(guān)系的標(biāo)簽。如果“同住時(shí)長(zhǎng)”是人的標(biāo)簽,那么標(biāo)簽取值類(lèi)型應(yīng)該是K-V型,記錄的是歷次同住人同住時(shí)長(zhǎng),標(biāo)簽值如“張三:2年;李四:1年”。不允許出現(xiàn)兩條標(biāo)簽取值的記錄,如“2年”和“1年”,因?yàn)闃?biāo)簽和標(biāo)簽之間是相互獨(dú)立的,不存在一個(gè)標(biāo)簽必須依賴(lài)另一個(gè)標(biāo)簽才能使用的情況,因此不能說(shuō)“同住時(shí)長(zhǎng)”必須和“同住人”標(biāo)簽聯(lián)合起來(lái)用。從這里也可以看出標(biāo)簽處理和SQL處理的區(qū)別。當(dāng)然如果“同住時(shí)長(zhǎng)”是同住關(guān)系的標(biāo)簽,那么每一次的同住關(guān)系記錄,就會(huì)有一個(gè)“同住時(shí)長(zhǎng)”的標(biāo)簽,這時(shí)候同住時(shí)長(zhǎng)可以是數(shù)值型的標(biāo)簽。

2)對(duì)于人–物–關(guān)系各對(duì)象標(biāo)簽間的轉(zhuǎn)化,大家可能會(huì)認(rèn)為身份證號(hào)、證件號(hào)是“用戶(hù)”的標(biāo)簽,但實(shí)際上身份證號(hào)、證件號(hào)是“物”的標(biāo)簽,要變成“用戶(hù)”標(biāo)簽,需要轉(zhuǎn)化成“擁有的身份證號(hào)”這個(gè)標(biāo)簽。同時(shí),由于一個(gè)人可能擁有多個(gè)證件(身份證、護(hù)照、軍官證、駕駛證等),因此“擁有的各證件號(hào)”就需要是K-V型,通過(guò)key來(lái)識(shí)別證件類(lèi)型,其標(biāo)簽

值應(yīng)為“身份證:330110********0001;護(hù)照:110*******001”,而不能直接存證件號(hào)碼,否則通過(guò)“擁有的證件號(hào)”取到的號(hào)碼數(shù)值沒(méi)法區(qū)分是什么證件的號(hào)碼。當(dāng)然還有一種處理方式是拆成多個(gè)標(biāo)簽,如“擁有的護(hù)照號(hào)”“擁有的軍官證號(hào)”“擁有的駕駛證號(hào)”。

從以上實(shí)例中可以發(fā)現(xiàn),不管是物的標(biāo)簽還是關(guān)系的標(biāo)簽,都可以按需轉(zhuǎn)化成人的標(biāo)簽,同理也可以實(shí)現(xiàn)其他對(duì)象類(lèi)型間的標(biāo)簽轉(zhuǎn)化。經(jīng)過(guò)以上原則方法,可以設(shè)計(jì)出符合企業(yè)業(yè)務(wù)需要的標(biāo)簽體系。

由于企業(yè)的業(yè)務(wù)在不斷變化,數(shù)據(jù)在不斷變化,業(yè)務(wù)對(duì)標(biāo)簽的訴求以及標(biāo)簽的加工方式也在不斷變化。所以標(biāo)簽體系建設(shè)不是一蹴而就的,而應(yīng)是一個(gè)動(dòng)態(tài)調(diào)整的過(guò)程。不斷更新迭代標(biāo)簽體系,才能更好地支撐業(yè)務(wù),更能體現(xiàn)數(shù)據(jù)價(jià)值


(部分內(nèi)容來(lái)源網(wǎng)絡(luò),如有侵權(quán)請(qǐng)聯(lián)系刪除)
立即申請(qǐng)數(shù)據(jù)分析/數(shù)據(jù)治理產(chǎn)品免費(fèi)試用 我要試用
customer

在線(xiàn)咨詢(xún)

在線(xiàn)咨詢(xún)

點(diǎn)擊進(jìn)入在線(xiàn)咨詢(xún)