- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2019-01-18來源:億信華辰瀏覽數:1365次
一個科學合理的數據治理規范,是數據安全與價值的制度保障,是數據產業健康發展,甚至是國家人工智能戰略實施不可或缺的前提條件。
所謂數據治理,就是對數據資產的治理,屬于公司治理的范疇,是對數據資產所有相關方利益的協調與規范。
具體內容包括但不局限于:
(1)數據資源資產化;(2)數據確權與合規;以及(3)價值創造與人才培養。
第一、數據資源資產化。數據不等于數據資產,數據就是電子化記錄,僅此而已。數據并不天生具備資產屬性。資產需要能夠給企業帶來預期收益。因此,只有滿足一系列必要條件的數據資源,才可能成為數據資產。
第二、數據確權與合規。隱私保護問題越來越受重視。所謂隱私保護就是對隱私數據的保護。最理想的情況是,能夠在產權層面,確立相關個人作為隱私數據的合法的唯一擁有者。這就需要一個法律基礎:對數據產權(包括但不局限于隱私數據)的確定,也就是數據確權。如果暫時做不到數據確權,那么至少要做到,對數據實際控制者的行為嚴加管束,做到合法合規。
第三、價值創造與人才培養。對價值創造而言,數據治理不應該關注太過具體的業務問題,因為業務形態千變萬化,具有極強的不確定性,不可能通過一成不變的規章制度去治理。相反,數據治理應該關注人才團隊的建立與培養,這才是價值創造的沃土。只要精通數據思維的人才沃土在,就一定會開出鮮艷的花朵,結出豐碩的果實。
一、背景介紹
2018年3月16日,中國銀監會發布了《銀行業金融機構數據治理指引(征求意見稿)》,就相關數據治理問題,向全社會公開征求意見。至此銀行業金融機構全面數據治理的大幕拉開。該指引要求銀行業金融機構將數據治理納入公司治理范疇,并根據數據治理情況,評價公司治理水平,甚至與監管評級掛鉤。該指引還鼓勵銀行業金融機構開展制度性探索,并設立專業崗位,為人才團隊的培養建設提供了制度保障。
這是一個非常積極而且重要的事件,對數據產業(不僅限于銀行業金融機構)的健康發展具有重大意義。它帶來兩個重要啟示。
第一、從產業政策層面,作為銀行業金融機構的主管機構,中國銀監會對數據治理的重視與推動,必將對數據產業產生重大而且積極的影響。其影響也許不僅僅局限于銀行業金融機構,還包括其他數據相關的產業。
第二、從理論層面,該指引的發布,驅動學術界從理論上思考:數據治理的內涵到底是什么?它和公司治理之間的關系到底怎樣?數據治理的獨特之處何在?需要一個相對統一的理論框架,便于開展理論研究,并形成同產業實踐的良好互動。
為此,我嘗試根據自己的有限了解,提出一個數據治理的大概理論框架,希望能夠為相關工作提供一些思路參考。更重要的是,希望能夠起到拋磚引玉的作用,吸引更多的政府、產業、學術專家,一起來關注這個重大問題。一個科學合理的數據治理規范,是數據產業健康發展,甚至是國家人工智能戰略實施不可或缺的制度保障。
接下來,將從幾個方面進行討論。第一、銀監會的指引里明確指出,數據治理應該納入公司治理的范疇。為此,需要首先對公司治理有基本的了解。第二、數據作為一種新興資產,它的治理工作,有哪些獨特、重要,且具體的內容?第三、數據資產價值的創造離不開專業的人才。因此,人才團隊的建立與培養也至關重要。
二、公司治理與數據治理
中國銀監會《銀行業金融機構數據治理指引(征求意見稿)》第四條(數據治理總體要求)明確指出:“銀行業金融機構應當將數據治理納入公司治理范疇”。為此,需要先簡單了解一下:什么是公司治理(Corporate Governance)?
從一個更加廣義的角度看,公司治理就是要對公司(作為一個資產)的所有相關者(不僅僅局限于股東和管理層,還包括第三方)利益的協調與規范。
回到數據治理問題的討論,請問:數據治理,治理什么?治理的對象是什么?是數據嗎?答:不是。數據作為一種電子化記錄,無處不在,大多數情況下都無關企業重大利益,并沒有治理的必要。因此,數據治理的對象必須是重要的數據資源,是關乎企業重大商業利益的數據資源。這樣的數據資源可以稱其為“數據資產”。關于數據資產更加詳細的討論將在下一節進行。這里不難獲得一個結論:所謂數據治理,不是對數據的治理,是對能夠為企業帶來商業利益的數據資產的治理。數據資產顯然是公司資產的一部分。
因此,無論是從狹義的角度還是廣義的角度看,數據治理應該屬于公司治理的范疇。所有關于公司治理的典型問題,都可能在數據資產上出現。公司資產會出現所有者與實際經營者分離的問題,數據資產更會出現。數據資產的所有者,跟實際使用經營者,幾乎從來就不是同一個人,或者至少極具爭議。公司資產的實際經營者(例如CEO),有可能用公司資產謀取私利;數據資產的實際控制者(例如數據庫管理員),更有便捷的條件,通過倒賣數據,謀取私利。公司的利益有可能同外部第三方(例如環保主義者)發生沖突;這個問題對數據資產而言更加突出。
以電商平臺為例,除了股東、管理層以外,相關數據資產有一個天生的第三方——消費者。股東管理層對數據的利益訴求,極容易同消費者這個第三方沖突。作為沖突的焦點,數據確權與隱私保護首當其沖。
總結一下,所謂“數據治理”,不是對“數據”的治理,而是對“數據資產”的治理,是對數據資產所有相關方利益的協調與規范。
三、數據資源資產化
數據治理是關于數據資產的治理,那么數據資產又是什么?行業中有一個廣泛流傳的誤解,很多朋友不假思索地認為:“數據就是資產!” 錯!數據不等于數據資產。所謂數據就是電子化記錄,電子化記錄就是數據。但并不是任何數據都可以被稱為資產,因為數據資產的要求更高,只有數據具備了資產屬性后,才可以被稱為數據資產。那么,基礎會計學中,對資產的定義是什么?其對數據資產的定義能有什么啟發?
新《企業會計準則-基本準則》第20條規定:“資產是指企業過去的交易或者事項形成的、由企業擁有或者控制的、預期會給企業帶來經濟利益的資源?!比绻肇埉嫽⑿薷囊幌?,不難獲得一個關于數據資產的定義:“數據資產是指企業過去的交易或者事項形成的,由企業擁有或者控制的,預期會給企業帶來經濟利益的數據資源。”由此可見,數據要成為數據資產,至少要滿足3個核心必要條件:(1)數據資產應該是企業過去的交易或者事項形成的;(2)企業擁有或者控制;(3)預期會給企業帶來經濟利益。
其中(1)似乎不是問題。企業數據資源的獲得無外乎兩種途徑。第一種途徑,是自己過去正常經營的一個自然積累與產出,或者由于業務實施的必要而被實際控制。例如,對電商網站而言,網絡瀏覽日志數據、消費購買數據自然而然就產生了;為了給消費者快遞商品,消費者的姓名、銀行卡、手機號、地址等數據也被記錄了下來,被電商網站實際控制。第二種途徑,就是資源互換??赡苁茿企業通過貨幣(或者等價物)購買了B企業的數據,也可能是A企業的數據同B企業的數據做了等價置換。假設相關操作合法合規,那么這種途徑獲得的數據資源也符合數據資產定義的條件(1)。
但是,(2)似乎是一個很大的問題。根據核心條件(2),數據要成為資產,要么被企業合法合規地擁有,要么被企業合法合規地控制。對于普通資產而言,這似乎不是一個很大的問題,因為普通資產的產權非常明晰。但是對數據資產而言,產權非常不容易界定。還是以電商網站為例,網站積攢大量的關于消費者的消費記錄數據。這些數據的實際控制者是電商網站,但是其合法的產權方是誰?這不是一個容易回答的問題。對于該數據的生產,電商網站提供了軟硬件設備,似乎貢獻巨大。但是,這些數據的內容,卻由消費者生產,并且關乎消費者隱私,消費者也有無可爭議的權益。這其中的矛盾沖突,如何通過科學合理的制度予以規范協調,這是一個極具挑戰,需要大智慧的問題。關于數據確權與合規這個重要問題,后面一節還會進一步討論。
最后,(3)似乎也不是一個容易解決的問題。數據要成為資產,就需要能夠給企業帶來可預期的經濟收益,否則就不是資產。因此,那些被大量存儲,產生可觀存儲成本,但是卻不能給企業帶來可預期經濟收益的數據資源,也不能被稱為數據資產。只有那些能夠給企業帶來可預期經濟收益的數據資源,才能夠被稱為數據資產。什么樣的數據資源才能夠產生可預期的經濟收益?這需要一些必要條件。
第一、記錄電子化。電子化的記錄才是數據,否則連數據都不算,怎么能產生可預期的經濟收益,又怎么能從數據資源變成數據資產?請不要忽視記錄電子化這個卑微的工作,其意義極其重大。因為相關行業中,大量的歷史記錄都沒有被電子化,而這些記錄中蘊藏著海量的寶貴信息。最典型的例子莫過于:病歷!雖然現在的醫院大量采用電子化病歷,但是過去幾十年里可都采用的是紙質病歷。這些病歷上寫滿了只有醫生護士才看得懂的天書。這樣的紙質病歷,一個大型三甲醫院,就有上億份之多!里面蘊藏了無比珍貴的臨床數據。不把這些記錄電子化,就成不了數據,支撐不了科學研究,支撐不了規模化應用,產生不了可預期的經濟價值,因此不是數據資產。
第二、數據聚合。統一的數據聚合平臺,是數據資產化的優質條件。如果沒有統一的數據聚合平臺,每次不同的業務需求,都會產生不一樣的數據提取、整合、清理需求。這些需求常常需要和不同的業務部門溝通,在不同的數據庫上直接操作。這需要高昂的溝通成本,以及不平凡的數據庫操作技能,而這些技能往往是數據需求方(例如:業務方)不具備的。最后只能拜托技術團隊去完成,而技術團隊的時間成本也非常高昂。過高的數據提取整理成本,會抵消數據資源原本應該產生的經濟收益,成為數據資源資產化的巨大障礙。而要消除該障礙,一個統一規范的數據聚合平臺不可或缺。
第三、質量保證。數據分析中有一句名言,叫做:“垃圾進去,垃圾出來 (Garbage in, garbage out)”。它講的道理是,如果數據本身質量很差,如同垃圾一樣,還用做模型輸入,那么無論模型有多高大上,最后出來的結果仍然是垃圾,沒有任何價值??梢?a href="http://www.122re.com/products/esdataclean.html" title="數據質量" target="_blank">數據質量的重要性。數據質量主要表現在以下幾個方面:(1)真實性。虛假數據是沒有任何意義的;真實的數據,常常分散在各個職能部門中。如果沒有合理且強力的制度保障,正常情況下,沒有任何人愿意主動貢獻自己的真實數據,他的利益何在?因此,合理而且強力的制度設計非常重要。(2)完整性。該收集整齊的數據要盡量收集整齊。一套數據對被記錄對象的所有相關指標的完整程度越高,相關模型的預測精度就會越好,數據資源就越有價值。相反,過多的缺失數據會極大地傷害相關模型的預測精度,進而限制數據的應用能力。(3)精準性。有三層含義:第一層含義是數據的邏輯要合理。例如:對于大氣數據而言,由于PM2.5是PM10的一部分,因此,相關數據必須滿足PM10的數值要大于PM2.5,否則就不合邏輯,是錯誤數據。第二層含義是數據的細致程度。同樣的數據,不同的采集方式,不同的存儲方式,帶來的數據細致程度是不一樣的。以車聯網數據為例,數據采集應該細致到每秒?還是每15秒?在不考慮成本的情況下,顯然越細致越好。第三層含義是數據的精確程度。以定位數據為例,應該精確到10米以內?還是1米以內?在不考慮成本的情況下,顯然數據精度越高,對于業務的支撐能力越強。
四、數據確權與合規
隨著社會的發展,隱私保護問題越來越受重視。所謂隱私保護就是要保護關乎個體隱私的數據。個人隱私數據之所以應該受到保護,就是因為這些數據的濫用有可能對個人造成巨大的財產甚至人身傷害。所謂隱私保護,其實就是對隱私數據的保護。一個最理想的情況是,能夠在產權層面,確立相關個人作為隱私數據的合法的唯一擁有者。這就需要一個法律基礎:對數據產權(包括但不局限于隱私數據)的確定,也就是數據確權。如果暫時做不到數據確權,那么至少要做到,對隱私數據實際控制者的行為要嚴加管束,做到合法合規。要避免,因為數據資產的錯誤使用,給任何相關方造成不必要的損失。因此,相關的數據治理規則非常重要,主要關注幾個方面。
第一、數據確權。數據一旦成為資產,就一定有產權方,或者實際控制人,可以把他們統稱為主人。請問:數據資產的主人到底是誰?如同實物資產一樣,如果一不小心,錯用了別人的資產,可能會產生嚴重的法律后果。對于實物資產,確權似乎不是一個問題。因為,無論是桌椅板凳,還是電腦打印機,它們在產權層面是非常明晰的。制造商獨立制造了這些產品,整個制造過程跟消費者無關,制造商獨享產權。制造完成后,消費者通過付費,獲得了這些實物資產的產權。但是,數據的生產過程太不一樣了。以電商為例,大量的消費者數據被電商平臺所掌控(例如:消費者的個人信息、購物信息等),電商平臺事實上在經常使用這些數據為自己的業務服務(例如:支撐電商平臺自己的個性化推薦)。甚至,不負責任的電商可能通過各種灰色交易將數據售賣給了莫名其妙的第三方。但是,這些數據資產的生產過程,可不是電商平臺自己能夠完成的。電商平臺提供了“平臺”,在這個平臺上,消費者通過注冊、瀏覽、訂閱、購買、評論等一系列行為生產了相關的數據。因此,整個數據資產的生產過程,既有電商平臺的貢獻(在線場景、軟硬件環境),也有消費者的貢獻(注冊、瀏覽、訂閱、購買、評論)。這樣的數據資產,其產權歸屬如何確定,其控制權應該如何治理?主人到底是誰?這是一個極具挑戰性,而又非常重要的問題。
第二、數據采集。大量的數據采集來自業務實踐,但相應的數據采集過程是否合法合規?有幾個基本的原則可供參考。第一個原則是“合法正當原則”。顯然,非法采集的數據,通過不正當途徑獲得的數據,是不能采用的。第二個原則是“知情同意原則”。數據作為一種電子化記錄,大量記錄了關乎個人隱私(例如:姓名、手機號、身份證)或者商業機密(股權結構)的信息,因此非常敏感。采集如此敏感的信息,被采集方充分的知情、同意,并且授權,是必不可少的先決條件。第三個原則是“必要性原則”。由于數據可能涉及個人隱私或者商業機密等敏感信息,因此,數據采集應該遵循越少越好的原則。例如,一個電商平臺的APP,采集用戶的姓名、銀行卡、手機號、地址等信息,非常必要。否則,無法完成在線支付、線下快遞等必要業務。但是,如果該APP同時采集你的社交圈信息,還要看你的電話簿記錄,這似乎就違背了數據采集的必要性原則。
第三、使用場景。即使企業對數據擁有100%的產權,或者合法合規的實際控制權,也不能對數據不分場景地任意使用。這個道理其實好懂。
假設你擁有100個雞蛋,你對這100個雞蛋擁有100%的產權。這是否代表你可以對雞蛋做任意處置?不可以!任何處置方式,都必須滿足一個基本前提:不對他人造成不必要的傷害。例如,你可以把這100個雞蛋變成:煮雞蛋、煎雞蛋、蒸雞蛋。但是,你不能拿雞蛋去大馬路上扔汽車的擋風玻璃。這可就太危險了,容易引起交通事故,給他人造成傷害。由于數據記錄了大量關乎機構或者個人的敏感信息,因此數據資產的使用場景,要慎之又慎!
坊間傳聞,騰訊內部對QQ和微信的聊天記錄(數據)給予最高的保密級別,稱為“高壓線”,不準任何人碰這部分數據。原因何在?這部分數據涉及到太多的用戶隱私。這是一個負責任企業自我約束的好例子。因此,數據治理的一個重要工作就是定義數據的使用場景。什么樣的數據,可以應用于什么場景?支持什么產品?誰來使用?使用的前提條件?都需要認真思考,需要必要的規章制度。
第四、使用手段。接下來應該關注的是數據的使用手段。即使企業對于數據擁有了100%的產權,也確定了一個合法合規的使用場景,也要對數據的使用手段非常謹慎。因為數據記錄了敏感信息,因此對數據的每次加工使用,都有泄密的風險。為此,要對數據的使用手段做出必要的合規要求。
這里繼續沿用上面的例子。你對這100個雞蛋擁有100%的產權,并且有一個合規的使用場景:餐廳。餐廳售賣各種加工后的雞蛋,例如:煮雞蛋、煎雞蛋、蒸雞蛋。結果某吃貨發現,你給他提供的單面煎雞蛋里面居然有三個蛋黃,這是一個極少見的“三黃蛋”!沒想到,該吃貨是雞蛋大數據的高手,經過他的大數據分析,最后判斷,世上能夠產三黃蛋的老母雞只能是隔壁家老李雞場的78號老母雞。該吃貨把這個消息在微博微信上大肆宣揚,后果是老李雞場78號老母雞的隱私沒了。其他老母雞都知道78號下三黃蛋,覺得非常奇葩,超級鄙視,議論紛紛。78號老母雞因此患上了嚴重的抑郁癥,失去了產蛋能力,最后被主人老李燉成了一鍋鮮美的雞湯,下場好慘!這個例子說明,粗心大意的數據使用手段,容易產生隱私泄露的風險。因此,必要的隱私保護(或者加密)技術,應該被積極采納。例如,當初廚房的雞蛋治理制度規定:不許加工單面煎雞蛋(能看出三個蛋黃來),而是要求蛋黃蛋清必須打碎攪和均勻后才能做進一步加工(例如:蒸雞蛋、炒雞蛋)蛋,這并不會對雞蛋的美味產生太大的影響,但是卻能夠極小化三黃蛋(一個敏感信息)被識別的可能性,因此78號老母雞的隱私也被保護了。
第五、數據安全。由于大量數據關乎個人隱私、商業機密,因此數據安全是一個非常重要的問題?,F實生活中的數據泄露比比皆是。我自己的經驗是,只要孩子參加了一個課外培訓班(例如:英語),其他同行培訓機構就會跟上來。曾幾何時,有租房經驗的朋友也知道,只要在任何一個房地產中介留下過租房信息,很快就有更多的中介找上門來。我們的個人手機號碼,如此重要的個人數據,是如何泄露的?數據安全是整個數據產業正在面臨的重大問題!數據安全的保障需要必要的軟件和硬件。但是,最需要的是一個合理的數據治理制度。該制度應該對數據從產生、使用、到消亡的整個鏈條進行嚴格治理。具體內容包括但不局限于:存儲安全管理、用戶匿名化、訪問權限管理等。
五、價值創造與人才培養
數據資產作為一種資產的必要條件是產生可預期的經濟收益,或者商業價值。但是,如何才能讓數據資產創造出最大的商業價值,相應的制度保障又是什么?
孤立而純粹的數據沒有價值,哪怕是聚合在統一的數據平臺上的數據資產也沒有價值。數據價值的彰顯必須依賴于具體的、帶有不確定性的業務場景。為此,企業需要:(1)尋找帶有不確定性的業務場景,因為只有“不確定性”這個亂世,才有成就“價值”這個英雄的機會;(2)將該業務問題轉化成為一個,關于Y(因變量)和X(自變量)的數據可分析問題。從此,抽象的業務問題,變成了具體的數據分析技術問題。這是數據資產價值創造的基本套路。為此,企業的經營管理團隊,從上到下,都需要有數據思維的能力,尤其需要有回歸分析的思想。如果業務團隊缺乏數據思維能力,就無法把錯綜復雜的業務問題,轉換成為技術團隊擅長的數據可分析問題;如果技術團隊缺乏數據思維能力,就無法準確理解業務需求,無法設計正確的數據產品;如果企業中層缺乏數據思維能力,樸素的數據價值觀就無法在企業內部樹立,回歸分析標準的Y X語言就難以普及;如果企業高層缺乏數據思維能力,就無法從戰略的高度,理解數據資產的商業價值,將失去開拓優質數據業務戰略新方向的能力,并造成企業價值在資本市場的低估。
由此可見,數據資產價值創造,不是一個人兩個人的事情,是企業全員團隊的事情。需要企業各個崗位的員工、管理者都深諳數據商業價值之道,并在各自的業務實踐中,自覺(甚至不自覺地)尋找可以彰顯數據價值的業務機會。為此,企業需要全員的,以回歸分析思想為核心的數據思維能力。由此可見,價值創造的過程,本質上是一個數據思維培養的過程,是一個全員人才培養的過程。為此,一方面需要對現有人員的數據思維能力做全面的培養提升,另一方面可以考慮在各個核心骨干的業務部門設立專門的崗位。該崗位人員的主要職責不是業務,不是數據,更不是技術,而是應該承擔鏈接業務與數據的橋梁作用。為此,相關人員需要對業務、數據、技術都有足夠的了解。對專業深度要求低一些,但是專業廣度要求更高,而這樣的人才就是商業分析人才。
由此可見,對數據資產的價值創造而言,數據治理應該關注的不是太過具體的業務問題。真實的商業環境千變萬化,帶有極強的不確定性,不可能通過一成不變的規章制度去治理。以銀行業金融機構為例,站在任何一個時間點,都無法絕對準確預測,未來的商業形態會怎樣?業務內容會怎樣?相應的數據分析會怎樣?因此,作為一個綱領性的制度設計,數據治理不應該過分關注具體業務問題。相反,應該關注人才團隊的建立與培養,這才是價值創造的沃土。由于商業環境的變遷,業務形態的變化,數據價值的多樣性,人們對于這片沃土上會結出什么花朵,什么果實,并不確定。但是,只要精通數據思維的人才沃土在,就一定會開出鮮艷的花朵,結出豐碩的果實。因此,培養人才,培養具備數據思維能力的人才,培養企業從上到下精通回歸分析思想的人才,并為此提供科學的制度保障,這才是數據資產治理在價值創造這方面應該關注的重點。