- 產品
- 產品解決方案
- 行業解決方案
- 案例
- 數據資產入表
- 賦能中心
- 伙伴
- 關于
時間:2022-09-24來源:初暖下瀏覽數:710次
摘要:數據及其交易的價值日益凸顯,但缺乏系統、跨學科的理論研究與支持。本文首先對數據界權進行綜述,在場景性公正原則下,針對數據內容和數據產品細分數據權利,明確數據資產化的前提。本文繼而總結數據資產的可復制性、價值不確定性等特點;并對數據的流通方式,以及數字產品、數據產品的交易和定價分別進行綜述。相對于要求企業主動共享數據,若干數據交易技術(尤其是采取第三方交易平臺的方式)更符合經濟理性。數據產品的交易模式和賣方策略受應用場景和買方異質性的影響較大,差異化產品和定價是最主要的思想,區塊鏈技術是完善數據交易的方案之一。最后,本文對數據資產的多種定價原則和方法的適用性和局限性進行綜述。
關鍵詞:數據界權? 數據資產? 數據交易? 數據定價? 數字經濟
世界經濟已從圍繞物品和貨幣流動轉變為圍繞信息流動來組織(Drucker,1992),“數據是新的石油”(Varian,2018)成為共識。《中國互聯網發展報告(2019)》指出,中國2018年的數字經濟規模為31.3萬億元,占國內生產總值的34.8%;且中國的數據要素規模增速領先,預計2025年將成為世界最大的數據圈。黨的十九屆四中全會決議將數據增列為生產要素,要求健全“由市場評價貢獻、按貢獻決定報酬的機制”。2020年4月9日,《中共中央 國務院關于構建更加完善的要素市場化配置體制機制的意見》明確了提升社會數據資源價值、健全要素市場運行機制的方向和重點改革任務,這對于引導各類要素協同向先進生產力集聚,加快完善社會主義市場經濟體制具有重大意義。
數據要素作為數字經濟的微觀基礎具有戰略性地位和創新引擎的作用。促進數據要素跨企業、跨產業的流通和交易有利于數據流向最有價值的地方,將數據對經濟社會的乘數效應推到最大。但迄今為止,數據資產交易仍然面臨大量亟待解決的問題,如數據資產化的前提、數據交易與個人隱私保護的爭議、數據流通方式的選擇、數據資產交易與傳統商品交易的區別、數據資產交易所需要的技術支持、數據交易機制設計、數據資產的價值衡量和定價方式等。本文將通過對數據界權、交易和定價相關文獻的梳理,從數據界權、數據資產特點、數據共享和交易機制設計、數據資產定價幾方面進行綜述,以回答上述問題。
一、數據的權利界定和特點
(一)數據的定義和權利界定
數據權屬界定不清已成為數據要素化的最大制度障礙之一。根據科斯定理,當市場交易存在成本時,如果初始的權利界定不當,很可能影響資源的最終配置并帶來社會福利損失(Coase,1960)。因此,數據權利歸屬于平臺、個體或者政府的初始配置將影響數據市場的發展和社會福利水平。
數據的界權(delimitation of rights)和交易需要平衡數據市場發展和個人權利保護。為了厘清二者的爭議,首先需要梳理數據的定義。根據國際標準化組織(ISO)的定義,信息(information)是關于事實、事件、事物、過程或思想等客體的知識,在特定語境中有特定的含義;數據(data)是信息的一種形式化方式的體現,以達到適合交流、解釋或處理的目的。信息可以在三個層面上被支配和控制,分別是物理層的數據載體(存儲介質)、符號層的數據產品(data goods)以及內容層的數據信息。其中,數據產品是信息整合的表現形式和組織結果,數據信息是數據產品蘊含的信息內容。數據產品存儲在計算機、云盤等數據載體上,數據信息則包括個人信息和非個人信息,個人信息又可分為敏感和非敏感的個人信息。數據產品和數據信息構成廣義上的“數據”(紀海龍,2018)。因此,個人信息和數據產品并不等同,二者的界權形式、交易方式也當有所不同。個人信息屬于數據主體的權利,數據產品則屬于數據產品生產者/持有者的權利。
但是,學界對個人信息中的非敏感信息的賦權結論并不完全一致。一方面,購買歷史、出行方式等通常是個人行為的副產品,其本質上屬于數據主體的權利。Miller & Tucker(2017)的研究也表明,給予消費者對個人數據的控制權有助于促進個人數據的分享與交易。另一方面,大多數研究認為個人或企業擁有數據所有權的優劣沒有絕對的最優解,而是取決于一些關鍵系數,例如數據對企業的價值和消費者貨幣化個人數據的能力,或者取決于消費者對隱私保護與數據交易收益的最優決策。Jones & Tonetti(2019)認為若由消費者掌握數據所有權,數據交易量將接近社會最優化水平(但弱劣于最優);若由企業掌握數據所有權,數據交易量可以達到社會最優交易量,但交易量與數據帶來的創新性破壞程度成反比,企業可能濫用數據交易,也可能交易不足。
根據Nissenbaum(2010)提出的場景性公正(contextual integrity)原則,結合具體的情景、參與者、數據特點、流通原則以及場景中各方的合理預期,如果新的信息流不違背該場景下傳統的民主公平規范或者能更好地實現該場景的價值,那么便應當確定相關主體的數據權益。由于數據要素的人格化稟賦效應、低復制成本,且強勢一方(比如企業)很容易通過合同、協議將個人的數據所有權低價甚至免費“交易”到自己手中,賦予個人絕對權利并不能有效保障個體的數據隱私和安全,且不利于數據要素的租賃和交易。為了解決個人和數據企業的激勵問題和信息悖論問題(Arrow,1962),同時避免數據濫用和壟斷,應當針對不同隱私和風險級別的個人信息,給予數據生產者(自然人)不同級別(可通過行使數據人格權需滿足不同條件的方式來體現)的拒絕權、可攜權、獲取收益等數據控制權,賦予數據產品持有者(例如數據收集者、設備生產者等)有限制的占有權(除所有權之外的收益權、使用權等權益集合)來解決上述問題。美國在不同行業分別制定隱私法,如《財務隱私法》《公平信用報告法》《有線通信信息法》《健康保險攜帶和責任法》等,并與數據市場自由交易相結合,實際上便體現了分類分級保護隱私和鼓勵數據交易的思想。
對于具有較大經濟價值且經脫敏(desensitization)的個人信息,消費者和數據搜集/中介商之間可采取租賃式交易,數據中介商每使用/銷售一次個人數據,對該消費者支付租金;或者采取一次性買賣以及其他隱私補償方法,從而刺激原始數據的生產和交易。另外,可借鑒美國《同意法案》(Consent Act),通過制定額外的規則和程序,促使公司承擔利用消費者提供的個人數據的應盡責任,包括對內容層面的個人數據進行充分的脫敏,以及其他必要的合法處理,例如匿名數據再識別化的風險評估、應急補救等。
(二)數據資產及其特點
基于上述對“數據產品”的賦權,數據產品交易的合法化前提已確立——數據是一種產權可界定、可交易的商品。從直觀呈現的產品類型來區分,數據可分為數字產品(digital goods)和數據產品(Pei,2020)。前者是以數字形式存儲、表現和使用的人類的思想、知識成果,如網易云歌曲、電子文獻、在線課程等;后者是由網絡、傳感器和智能設備等記錄的、可聯結、可整合和可關聯某特定對象的行為軌跡和關聯信息,具有較強的分析價值,如各種機器生產和采集的內容。
數據要素化、數據資產化著重指的是數字化的數據,即數據產品。數據資產化的核心在于通過數據與具體業務融合,驅動、引導業務效率改善從而實現數據價值(何偉,2020)。一般而言,資產的核心特征主要包含三點:未來的收益性、所有者擁有對資產的控制權、由過往交易結果形成。因此,合法獲取的由企業或個人產生的,預計會影響個人或企業未來的行為決策,并為個人或企業帶來經濟收益的各類數據資源都是數據資產。大體量的數據產品集合又稱作大數據資產。數據資產具有與傳統資產、金融資產不同的特點。
1.數據資產具有非競爭性且邊際成本接近于零。數據資產可被無限分享和復制,且被分享和復制的數據資產一定程度上具有非競爭性,即使用者的增多不影響數據資產本身的價值。然而,這給數據資產交易造成了困擾,只有少數情況下,數據產品的分享會給數據擁有者帶來不利競爭(比如與其構成商業競爭關系)。當數據資產的復制既沒有物理成本也不會損害個人或廠商的福利,甚至會給分享者創收時,即便理論上可以進行數據界權,也很難防止用戶將數據資產進行二次轉售,從而損害數據產品創作者的利益,這是數據交易需要克服的難題之一。
數據資產在成本、價格公開的影響方面也與普通資產不同。由于數據整合涉及對不同系統來源的數據信息進行大量的人工干預、翻譯和融合,數據產品首次創作成本高,但根據摩爾定律,隨著大數據技術的發展,數據資產的整合和儲存等成本將進一步降低,數據資產產品的首次創作成本也將下降,而且數據資產的再生產邊際成本接近于零。此外,數據資產還存在價格外部性,數據價格的公開會泄漏數據的價值。
2.數據資產的價值具有很大的不確定性。首先,數據資產具有事前不確定性、協調性、自生性和網絡外部性。買方如果交易前不了解該數據資產的詳細信息,會較難明確該數據能帶來的效用價值;但如果買方了解數據的全部信息,購買該數據對買方的價值將降低,這也就是前文所說的“信息悖論”。協調性是指不同的數據集組合可以帶來不同的價值,這導致數據資產具有范圍經濟的特征。自生性指當同一組織或個人擁有的數據資產組合越多時,這些數據資產彼此之間越可能相互結合而產生新的數據資產,從而帶來更多的價值。網絡外部性指的是數據產品的使用者越多,其價值越高,比如Google、微信等平臺企業,使用個體越多,吸引的使用者越多,平臺的數據資產價值越大。
其次,數據資產的價值與本身的體量、質量、時效性、整合程度之間存在一定的不確定性,與具體的應用場景相關。雖然大多數情況下數據資產具有規模報酬遞增性,即隨著數據產品中包含的有效數據內容的增多,該數據資產帶來的價值越大。但是,部分運用數據進行企業產品需求預測(如亞馬遜)的實證研究發現,數據量對預測和決策改善的價值達到頂峰之后可能下降。一般情況下,數據準確度越高,價值越大,但如果數據的準確程度固定,而使用者知曉該準確度,此信息的納入同樣可以幫助使用者進行決策矯正,從而產生更高的價值。在某些對時效性要求較強的應用場景中,只有最新的數據才有價值,比如消費者的住址、定位。但對于學者研究、行為預測等,歷史數據和當前數據的重要性差別并不大,甚至早期的數據價值更大。另外,通常數據整合度越高,其價值越大,但Goodhue et al(1992)指出數據價值與整合度呈拋物線關系,20%的整合度可以達到80%的效用價值。Azevedo et al (2019)的研究則表明,互聯網搜索中的A/B隨機試驗結果的分布可能是厚尾的:罕見的結果可能有非常高的回報,因而通過許多低質量和低統計能力的小型實驗來測試大量創意反而更有利于發現大的創新。
最后,數據資產的價值與使用者的異質性密切相關。這主要是因為數據資產只有被使用才會產生價值(沒有被使用的數據資產事實上是企業的負債),數據資產的價值在于改變行動、改善數據資產持有者的決策和行為。因此,使用者的目的、知識、能力、私有信息、已有的數據資產不同,會導致同樣的數據資產對不同買方的價值差異很大。所以數據資產的價值評估很難作為一個標準品,由眾多類似于股票交易市場上的買方共同定價。
二、數據資產交易
(一)數據資產的流動方式
數據資本化有賴于數據要素跨企業、跨行業的流通和社會化配置。從數據資產到數據資本是數據要素化過程中一次“質的飛躍”,這類似于馬克思提出的商品到貨幣“驚險一躍”。數據的流動方式主要包括企業主動共享、自留使用和數據交易,企業對這三種方式的選擇依賴于賣方是否與買方存在競爭、買賣雙方的風險偏好水平等因素。
1.數據共享、自留和交易的影響因素。如果數據產品持有者既銷售數據又使用數據(與數據產品買方存在競爭),此時主動共享數據資產違背理性原則。Easley et al(2018)假設了一個古諾競爭、需求不確定、沒有數據資產供應商的基準經濟模型,此時數據共享能促進企業更好地適應消費者的需求,從而改善消費者剩余和社會總福利。但是,企業競爭使得分享數據后企業利潤減少,因此數據資產的“主動共享”對于企業來說是一個囚徒困境,局中人的上策都是不共享自身擁有的數據資產。
數據主體主動共享數據的場景較少。在古諾競爭和需求確定的伯川德競爭中,只有企業面臨的市場需求不相關、市場需求信號完美或者存在戰略互補時,企業才會共享信息。在需求不確定的伯川德競爭中,只有當數據共享后,所有企業知曉其他企業和自身利潤函數之后的策略相關性有利于自身利潤,企業才會共享數據。此外,對具有公共基礎設施、公共價值性質的數據和主體,或者對倫理、安全等有高要求以至于法律限制交易的數據,各區域、各行業之間進行共享才會成為首選。為了在合規的條件下解決數據孤島、整合數據以產生更大的價值,聯邦學習(federated learning)等分布式機器學習方案受到推崇,極大推動了數據價值的共享。
通過法令強制要求企業主動共享數據的方案則會產生額外的社會成本。除去行政成本,企業還將通過各種各樣的策略行為,如給數據加“噪音”、降低數據質量等,減少社會福利。美國證券交易委員會(SEC)2000年曾頒布《金融衍生工具法》(FD),規定上市公司必須向公眾披露重大信息,但是,Bushee et al(2004)和Cohen et al(2014)發現該法案的頒布促使公司們通過各種方式進行合謀,從而控制向公眾發布的數據。Bailey et al(2003)則指出自FD法案頒發后,企業分享的數據質量顯著降低。
當賣方同樣是數據資產的消費者時,數據賣方沒有動機主動共享數據,但選擇數據交易或自留使用則受到買賣雙方風險偏好程度的影響。假設一個將數據資產金融化的場景,賣方將數據產品加工為數據基金進行銷售。如果賣方是風險厭惡的,則賣方傾向于只銷售數據基金,不在二級市場中(例如利用數據資產進一步交易或者投入創新開發)和數據買方進一步競爭。當數據無法被二次銷售(如數據時效性較強)且數據持有者是風險中性時,其不會銷售數據產品,而是傾向自留使用以減少競爭;當數據持有者是風險厭惡的且其他數據交易買方是風險中性時,則持有者傾向于銷售數據產品以平衡風險分攤和競爭加強的影響,而不是自留使用;否則,將選擇銷售數據和自留數據參與后續競爭的混合策略。
2.第三方“數據銷售商”的作用和問題。在平臺或消費者擁有數據資產的寡頭競爭市場中,獨立收集和處理數據的第三方“數據銷售商”可以有效促進消費者、企業之間的數據流通;且相比于單個數據提供者,第三方“數據銷售商”會從多種渠道、多個企業處收集和整合數據產品,從而提供更多元、綜合的數據產品。因此當數據賣方不與買方形成競爭時,賣方通常需要權衡獨自銷售可減少的交易成本和通過第三方銷售可增加的銷量,進而做出最優的銷售渠道選擇。如果數據產品的需求存在網絡外部性,那么原始數據提供者的最優策略為同時采用自我銷售和第三方銷售渠道,并提供差異化數據產品(versioning):在自我銷售渠道上銷售高質量數據產品,在第三方銷售渠道上銷售低質量數據產品。
另外,第三方數據機構還可以幫助數據買方中和風險、增加激勵。在一個兩企業參與、贏者通吃、成功不確定的探索創新模型中(比如專利開發),由于“死胡同”低效性和過早出局低效性普遍存在,由一個獨立的第三方數據銷售商來負責補償創新失敗企業的損失,才能彌補企業激勵不足帶來的社會福利損失。
但目前我國的第三方數據交易平臺普遍存在活躍度低、交易數量不足的問題,原因是多方面的:(1)基于生命周期視角,現階段我國大數據交易產業處于成長期。(2)從制度因素來看,現階段存在數據權屬不清(申衛星,2020),交易標準和規范不明晰等問題,同時《網絡安全法》等法律法規的實施導致中小型數據供需主體的市場合規成本增高等。(3)在技術方面,現有數據交易技術機制尚不成熟,難以兼顧隱私保護與流動。(4)就市場因素而言,一方面互聯網巨頭壟斷數據,“數據自留”行為十分普遍,另一方面現有第三方數據交易平臺僅具備信息撮合功能,尚未培養成熟的數據買賣市場。數據的價值往往來自對數據的加工和挖掘所傳達的有效信息,大量的中小供需主體缺乏這項能力。因而,第三方數據交易平臺可重點撮合專業性的大宗數據資源聚合平臺參與交易。
(二)數據資產的交易設計
與數據產品相比,數字產品的交易和定價市場的發展已較為成熟。數據產品的交易可借鑒數字產品,但由于數據的可復制性、低邊際成本、可整合性和價值不確定性等特點更為明顯,數據交易模式和賣方策略受應用場景、買方異質性和市場結構的影響更大。
1.數字產品交易。數字產品的交易手段主要可分為:捆綁銷售(bundling)、訂閱和租賃式和拍賣(auction)。由于數字產品的低復制成本和買方異質性,對數字產品或服務進行捆綁銷售十分普遍。Daskalakis et al(2017)研究發現,單獨對每單位的數字產品進行定價和大捆綁(grand bundle)都能達到收益最大化。Haghpanah & Hartline(2020)研究表明,如果價格敏感型買家認為產品更具互補性,那么大捆綁是最佳選擇。訂閱指消費者支付固定價格之后可以免費使用一段時間平臺內的數字產品服務,租賃指對單獨每一次使用付費(Alaei et al,2019)。根據客戶的產品使用率和價值的差異,平臺的最大化收入決策有所不同。大多數平臺同時提供訂閱和租賃,并謹慎制定二者的價格,以使得使用率低的客戶盡可能訂閱數字產品,而使用率高的客戶盡可能租賃數字產品(Pei,2020)。
數字產品主要適用的拍賣方式包括贊助搜索拍賣、無限供給拍賣和在線拍賣等。其中,“贊助搜索拍賣”指通過對搜索引擎中的關鍵詞進行競價,從而為廣告商等競得展示內容的位置。“隨機抽樣拍賣”是無限供應的數字產品實現真實反映競拍者估值的典型方法,類似于“第二價格拍賣”。這是因為數字產品的邊際成本很低,“第二價格”很可能接近零。隨機抽樣拍賣將買方隨機分為兩部分,分別進行最優拍賣定價,各部分的買方最終能否成功競得數據取決于其投標價格是否高于另一部分買方拍賣所定的最優價格。此時,買方的出價與是否獲得標的無關,只有按照真實支付意愿出價才可能獲得標的。數字產品在線上進行交易時,不同客戶往往在不同時間出價,“在線拍賣”系統將在每個出價到達時做出競拍成功與否的決定。Lavi & Nisan(2000)等分別對有限供給和無限供給條件下的數字產品的在線拍賣提出了激勵相容的在線拍賣機制。
2.數據產品交易。數據交易按照應用場景可分為營銷、風險規避和人員搜索三大類。其中營銷是指運用數據列表(data lists)和數據追加集等對消費人群進行分割、匹配、定位、營銷分析和消費預測。風險規避主要應用于個人和機構等進行信用等級構建和詐騙檢測。人力資源數據則多用于人員搜索應用場景。
盡管應用場景、具體的交易機制可能不同,數據交易賣方策略的核心思想主要是差異化產品和價格,或只選擇部分買方進行交易,其核心在于區分買方異質性,真實反映買方的效用。如果交易方的風險容忍度不同而賣方可以完全歧視,賣方傾向于對風險容忍度更高的買方收取更高的價格;如果賣方不能實現。
根據賣方對數據資產加工整合的精細程度,數據交易可分為直接交易和間接交易。直接交易指賣方直接提供未經加工的原始數據,如消費者的年齡、收入等數據,這是大多數潛在客戶開發公司和一些金融數據銷售公司采用的方式。間接交易指的是賣方通過對數據的整合再加工形成一定程度的標準品或數據資產組合。直接交易和間接交易都可以實現價格歧視。
(1)直接交易。當數據產品的價值可預期、部分可知時,可以采取直接交易方式。此外,當數據的負外部性相對較小而買方的異質性過大,例如私有信息和需求不同導致買方對數據的組合要求迥異,導致賣方無法設計足夠多的數據產品來滿足所有買方的要求,也可考慮直接交易。數字產品的捆綁銷售、訂閱租賃以及各種拍賣方式均可一定程度上運用于數據產品的直接交易。例如,賣方可將不同質量的數據產品捆綁銷售,通過低價銷售或免費贈送低質量的數據產品,將支付意愿和質量需求高的買方導流到高質量付費產品上,從而獲取更高的利潤。賣方也可通過租賃或銷售“部分數據”的方式來識別高價值和低價值買方,因為高價值買方對部分數據的價值評估很低,傾向于高價訂閱完全數據。
直接交易還可通過交互式協議(interactive ?protocol)進行動態機制設計。假設市場僅存在一個壟斷的數據產品賣方、一個購買數據追加集來優化營銷和避險決策的買方,雙方的私有信息分別是數據(關于世界狀態的信息)和買方的估值。賣方主要有三種協議方式可選擇:其一,通過密封信封機制向買方透露產品價格,買方決定是否購買,此定價方式下的數據產品被視為一般商品。其二,買方支付一定的價格可以獲得賣方提供的數據隨機樣本,再決定是否購買(pricing mapping)。其三,賣方先向買方提供一部分隨機數據樣本,買方基于這部分樣本判斷整體數據的價值,再決定是否購買(pricing outcomes)。這種方式使得賣方可以根據買方的事后選擇來判斷買方類型并進行價格歧視。
(2)間接交易。間接交易主要適用于數據的網絡外部性為負、外部性較強、買方相對風險寬容時。此外,當賣方處于寡頭或完全競爭市場時,由于賣方之間對彼此擁有的數據產品的信息不完全,沒有賣方可以通過直接交易攫取更大的剩余,此時買方可采取眾包、眾籌等模式,賣方可在競標成功后進行間接交易設計。根據買方的異質性需求,賣方可以通過設計不同成本-收益的數據產品來篩選買方類型。以買方購買數據追加集進行風險規避和市場營銷活動(比如是否對某個消費者借貸或推送廣告)為例,Bergemann et al(2018)指出,在賣方壟斷、買方異質的市場中,由于買方交易前擁有不同的數據資產,且對銷售數據產品質量的預判不一,買方對賣方手中的數據追加集的價值評估不同。賣方可以將這些數據追加集設計成不同的統計實驗(假設檢驗)來篩選買方,買方是貝葉斯決策者,由此賣方可以通過買方選擇的“一類錯誤、二類錯誤組合水平”來識別買方的私有信息,本質上是二級價格歧視。
結合數據產品價格和使用的負外部性,即數據資產價格對數據價值的泄漏、數據資產的使用價值隨使用者增多而降低的特點,數據供應商可通過設立基金、制定兩部定價法(每股價格和固定費用相結合的方式)來實現任意數據資產的組合銷售。數據價格的外部性越高,每股價格更高,兩部定價法獲利越大。如果買方是異質的,且可能和賣方構成競爭,那么具有一定市場力量的賣方將同時參與數據基金的銷售和二級市場的交易。此時,賣方的利潤不僅源于數據基金的銷售額,也包括通過數據基金參與二級市場的投資收益。
在雙邊市場中,可由統一的第三方機構或市場機制來提供間接交易的數據產品。此時,多個買方需要不同準確度程度的訓練數據集,多個數據賣方共同出售各自的數據,價格真實反映買方估值、賣方收益最大化、收入公平分配給合作提供數據集的不同賣家、無套利等目標非常重要。Agarwal et al(2019)提出由統一的在線市場設計不同的數據產品,并基于特定數據組合產品的零后悔拍賣機制來激勵買方透露真實的價值評估。繼而根據以上結果對買方銷售不同的數據產品和收取價格,同時按照賣方的邊際貢獻來公平分配數據產品的總銷售收入。在充分競爭的雙邊市場中,賣方沒有足夠大的市場力量來控制市場,只能提供真實的數據,而非增加噪音或者復制數據濫竽充數。
在直接和間接交易中,賣方亦可能只選擇買方中的一部分人進行交易。Bergemann et al(2018)指出,當滿足一定條件時(比如賣方提供給高、低類型買方的差異化產品的邊際收益相等),賣方將僅向部分買方銷售數據產品。考慮到數據的可復制性、易于轉售等問題,數據交易最可能采取的方式是“價高者得”,也就是最終只有使用價值最大、支付意愿最高的企業能夠使用該數據資產。但“價高者得”是一個次優決策,并不能實現利潤最大化。另外,隨機抽樣拍賣方式也是通過隨機選擇一部分買方的方式來促使買方反映自我的真實價值。
(3)數字產品和數據產品的差異。雖然數字產品和數據產品的交易模式存在相似之處,但二者也存在顯著區別(Pei,2020)。首先,數字產品的最小一單位,如一部電影、一篇電子文獻本身是有價值的,而數據產品的最小一單位,例如一條匿名化的消費者購買數據記錄,其本身的價值卻微乎其微。因而數字產品可僅出售最小單位的量,而數據雖可以按條數計價,但大都以數據集出售。其次,數據產品的可整合性極高,與不同的數據集整合可形成不同的數據產品,因而防止數據套利是數據交易需要考慮的因素。數字產品雖然也因低復制成本而將不同數量、類型捆綁銷售,但捆綁與數據的整合有本質差異。最后,數字產品可以折舊后再消費、轉售,且基本不影響使用價值,而數據產品的轉售則至少存在兩種情形:一方面,數據內容本身可以被復制、整合成完全不一樣的數據產品進行再消費和轉售;另一方面,間接交易、“一對一”制定的差異化數據產品的轉售卻可能受到極大限制。
(4)數據交易技術和區塊鏈的應用。針對數據交易存在的信息悖論、二次轉售、道德風險等問題,傳統交易技術和方法在一定程度上可以幫助解決部分問題。例如,運用預覽、專家評估、聲譽建設等方法,可以解決數據資產的信息悖論問題。運用密封信封技術和專利權,通過審計、統計跟蹤系統,可以幫助解決數據資產的可復制性問題。另外還可以接受數據產品的可復制性,將數據商品與銷售者希望廣泛傳播的其他數據進行捆綁銷售,如投放廣告來賺取額外收益。但是,這些傳統手段并不能從根本上解決問題,隨著區塊鏈和智能合約等技術的發展,上述問題得到了更有效的解決。
區塊鏈(blockchain)技術方案可以通過賦權、“零知識證明”、完整記錄交易過程、提供可信的執行環境等來緩解上述交易問題。區塊鏈系統中的任意多個節點可以通過密碼學算法,將一段時間內發生在系統中全部信息交流的數據計算和記錄到一個數據塊(block)上,并且生成該數據塊的指紋用于鏈接(chain)下個數據塊和校驗。此時,系統所有參與節點將共同認定該記錄是否為真,同時,每個參與區塊鏈的節點的合法性可以得到認可,保證了交易節點的真實性和合法性。通過區塊鏈上私鑰和公鑰的雙認證技術,可以有效驗證數據交易方的身份,確認交易環節是否如約進行。另外,區塊鏈技術生成數字時間戳(timestamp)可以對數據資產進行界權,同時有效地記錄交易的時序。由于每個數據資產可以擁有獨特的哈希值(hash value)和時間戳,數據資產一旦在區塊鏈上被界權,后續的每一步操作都會被實時記錄,很難被更改和刪除,這也為解決數據資產二次轉售無跡可尋的難題提供了思路。
區塊鏈和智能合約的結合對解決數據交易的“信息悖論”問題和行為規范方面起到了不可忽視的作用。當智能合同通過區塊鏈實施時,一旦交易前定下的條件得到滿足,協議將自動執行,減少數據交易的欺詐可能性,規范交易秩序。Hrner & Skrzypacz(2016)提出,假設賣方銷售有關某狀態好或者差的信號數據,買方對此數據產品的價值評估是公開信息,賣方可以設計自我執行合同來解決買方的失信問題。Su et al(2020)提出了一個基于區塊鏈網絡和可信執行交易環境來保證數據商品和支付的可信交易框架,避免了傳統第三方交易平臺截留數據進行轉賣、買賣雙方彼此欺瞞等道德風險問題。Sabbagh(2019)則針對數據音樂作品的版權保護問題提出了利用The Music Modernization Act (MMA)建立的音樂作品數據庫,結合區塊鏈和智能合同來實施強制許可方案。Banerjee & Ruj(2019)提供了一個較詳細的交易流程的理論方案,同時納入法規來保證該設計具有可監管性。
當然,區塊鏈技術和智能合約本身亦存在數據隱私、可擴展性和互操作性等各類挑戰。區塊鏈和智能合約目前尚無法完全解決數據資產的轉售等問題。比如,數據持有人仍可以對原有數據稍做改變生成新的數據,雖然數據有所失真,但此時哈希值和時間戳并不能完全消除未經授權的轉售等道德風險問題。
三、數據資產定價
(一)數字產品的定價方法
數字產品的收入主要有三個來源,包括直接的貨幣收入、個人數據/隱私收入和時間/注意力收入,這三種收入流往往存在此消彼長的關系。向客戶銷售數字產品和服務,如電子書、網易云音樂等,可以獲取貨幣收入,也可以獲取采集、使用消費者的個人數據的權益,還可以向廣告商等出售其在數字產品中的空間和位置來獲取消費者的時間/注意力收入。數字產品銷售商需要在定價方案中考慮它們的最佳組合方式。例如,視頻或新聞平臺通過投放廣告可獲得時間/注意力收入,若消費者為避免廣告選擇充值,則平臺現金收入增多,但價格敏感型的消費者也可能直接離開該平臺。過度采集或者不當使用個人數據可能會帶來客戶的流失,而適度放棄現金流,例如采取低端產品或樣品免費模式則可能會培育起一個長期客戶池。
數字產品常見的定價方式主要包括按離散單位計價、按使用量和時長計價和混合定價等類。根據市場結構(市場競爭的強弱、是否為壟斷市場等)、產品粘性、消費者價格敏感性和需求彈性等方面的差異,使用量的邊際定價趨勢有所區別。例如,百度網盤的普通會員收費為10元/月,比非會員額外增加3T的容量空間,超級會員收費為25元/月,比非會員額外增加5T,邊際支付是遞增的;而大多數電子游戲的定價則隨著使用時長而遞減。訂閱和租賃屬于典型的多因素混合計價,例如亞馬遜Prime影音服務,單個數字產品的費用隨基礎訂閱費的等級有所差異,但均會低于實體替代產品的價格。
(二)數據產品的定價原則和方法
數字產品的定價方式大多數可以直接借鑒到數據產品上,這主要是因為二者都擁有低復制成本、較大的價格歧視空間,而且在定價對象方面存在重合之處。例如,數字產品銷售商通過提供數字產品或服務的方式獲取消費者個人數據的授權,換一個角度便是商家對個人數據內容支付的對價。因此,數據產品通常也可通過提供部分免費數據來獲取數據買方流量;或者根據使用量計費,例如根據使用條數計價;再或者收取訂閱和租賃費的混合價格。由于數據價值的不確定性,對數據資產的價格進行統一規定幾乎是不現實的,應該在界權基礎上由市場去發現數據資產的價格。同時,數據要素的定價離不開具體交易場景,需要根據典型應用場景有針對地核算數據要素價值。
數據資產定價的主要原則包括:價格可以真實地反映買家的效用、賣方收入最大化、收入公平分配給合作提供數據集的不同賣家、無套利、隱私保護和計算效率。具體的定價方法基本體現了以上原則的取舍和融合。例如,Koutris et al (2013)對查詢式數據制定出一套線性規劃方案,可以同時滿足賣方收入最大化、無套利、公平分配原則。隨機抽樣拍賣定價方式能有效促進價格真實地反映買家效用,但不一定能使得賣方整體收入最大化。而一些能最大限度滿足無套利原則的定價方法可能需要較大的計算量。以下將對主要的定價方法及其適用場景進行介紹。
1.傳統會計學定價。收益法、成本法和市場法等可以適用于不同類型的數據。收益法關注商品的效用價值或現值,其收益可以依靠合同定期支付。對以原始數據直接交易的數據資產的定價,可以通過收益現值法,根據買方的實際收益所得、使用次數或時間等,按比例支付給賣方,但選擇合適的折現率比較困難。收益法的典型應用場景包括基于項目數量和用戶數量制定比例租賃費用的訂閱方式,根據買方的質詢、模型訓練精度定價等方式。Bergemann & Bonatti(2015)曾提出,對于用以廣告精準推送的消費者行為數據,可通過廣告的收益和成本的線性定價來獲取最大收入,且該價格與市場集中度負相關,與該數據集的協同性(不同信息產品之間的合作產生的增量價值)正相關。
成本法易于操作且定價相對直觀,但如果僅依靠成本法則忽略了買方異質性和數據特點所產生的價值,很可能會低估數據的價值。因此,成本法比較適用于買方差異不大、制作成本幾乎是公開信息、供給競爭激烈的數據產品,同時也適用于對個人數據的隱私補償定價。Fleischer & Lyu(2012)針對個人的隱私數據定價提出了“公布價格”機制,賣方以接受或拒絕合同的方式來獲取數據的隱私成本收入。對于搜集和加工邊際成本遞減的數據類型,成本法給出的數據資產的價格應該比平均成本更低。
市場價格法則強調數據資產的交易價格,主要考慮重置成本(用新資產替換已有資產的成本)、當前成本(用類似用途的資產替換資產的成本)或可變現凈值(資產可以出售的金額減去出售成本)。大多類似知識產權的數據都可適用市場法,但其運用限制也較為明顯,比成本法更費時和昂貴,且還要求市場上已有類似的數據交易作為參照。
但是,傳統會計評估法可能會低估數據集的價格,這是因為擁有數據資產的企業一般會進行相機決策。如果現有數據集質量不佳或市場需求疲軟等,企業可能會放棄或延遲開發數據集。這也意味著當企業計劃將數據要素納入生產環節中時,數據資產具有了隱含期權的特征。因而,可考慮將實物期權理論融入數據資產定價,但此方面的研究仍有待進一步發展。
2.基于“信息熵”定價。根據Shannon(1948)的信息論,“信息熵”表示信息中排除冗余后的平均信息量,是與買家關注的某事件發生的概率相關的相對數量。信息熵越大,某事件發生的不確定性越小,正確估計它的概率越高。因而,熵越大,信息內容的有效性越大,交易價格越高。“信息熵”定價在傳統金融、期權領域運用廣泛,主要通過不同時間的歷史數據來預測未來時期的期權價值。因此,通過對數據元組(組成數據集的小單位)的隱私含量、被引用次數、供給價格、權重等因素的結合,可以對數據資產的信息熵進行動態定價。Shen et al(2019)提出了對個人數據的信息熵定價方法。信息熵定價法充分考慮了數據資產的稀缺性,且相對于數據的內容和質量,更關注數據的有效數量和分布。
3.數據資產價值的多維度定價。根據數據資產價值的多個維度進行定價可以兼顧賣方、買方和數據資產本身的核心關注點。數據資產價值的評估要素主要應考慮數據成本、數據質量、數據產品的層次和協同性、買方的異質性等。數據資產的采集、存證、傳輸、加工、營銷均會產生成本。數據質量的指標主要包括完整性、獨特性、時效性、有效性、準確性和一致性。數據產品的層次主要指其技術含量、稀缺性等,協同性則指的是不同信息產品之間的合作產生的增量價值。一般以上指標與數據價值成正比,而買方異質性則使得數據價值的方差很大。不同的買方擁有不同的風險厭惡程度、數據偏好、信息使用成本和變現能力,即便是相同的數據,價值差異也很大。因此,如果買方異質性較強,企業一般會先篩選買方類型,再進行價值評估和差異化定價。
Sajko et al(2006)提出可對數據的現值、成本、數據本身的特征和質量等多個維度的重要性和價值展開定量評級,再結合群組決策和價值矩陣等定性分析方法,得到數據在每個維度的價值,最后得到綜合價值。同時,可以結合Zeithaml(1988)提出的價格價值、競爭價值、情感價值、功能價值和社會價值五個維度,設計客戶感知價值定價模型。另外,可以借助人工智能提高大規模數據產品定價的計算效率。人工智能定價在醫學圖像數據、自然語言處理等對決策模型的精度和準確度有特殊要求的領域的應用將越來越普遍。
綜上,在對數據資產內容的定價時,為了保護數據內容,防止內容泄漏造成數據價值降低,賣方可利用上述各種資產估值方法對隨機抽樣部分的內容進行價值評估,進而對整體數據資產內容進行定價。對大數據型的數據資產,則可以不按內容計價,而是在數據標準化的基礎上,以“盒”為單位,通過一般性價值評估對標準化的單位“盒”數據估值,進而按件計價交易。
四、結論
數據要素是數字經濟的微觀基礎和創新引擎,促進數據要素的流通和交易是未來產業發展的大趨勢。數據界權、交易和定價機制的明晰有利于保護數據主體權益并維護數據安全,同時引導數據要素協同向先進生產力集聚,從而促進完善社會主義市場經濟體制。本文綜合經濟學、計算機科學、法學等跨專業學科文獻,對數據資產界權、交易和定價進行綜述。
本文首先通過區分數據內容和數據產品,提出數據自然人享有個人數據內容的分級分類的數據控制權,數據文件持有者則享有數據產品有限制的占有權(經濟所有權或用益數權),這有利于解決個人數據權益和數據流通的爭議。接著,本文總結了數據資產的可復制性、價值不確定性等特征,數據資產的交易和定價與傳統資產、金融資產不同。繼而通過對數據交易、自我保留、數據共享三種數據流通方式的比較總結,本文指出了數據交易的合理性、第三方數據售賣商對數據流通的重要性和現階段數據交易不足的原因。隨后,本文比較了數字產品和數據產品的交易和定價,著重說明了數據產品直接交易和間接交易的具體方式、賣方策略,并指出其受應用場景、買方異質性和市場結構的影響。差異化產品和定價是數據產品交易的核心思想,可以通過線性定價、兩部定價法、拍賣、機制設計等多種方式進行。同時,本文還分析了區塊鏈和智能合約等技術方案在解決數據交易二次轉售、“信息悖論”和行為規范方面的作用和不足。最后,本文比較分析了數據資產的定價原則,以及包括傳統會計定價、多維度綜合定價、信息熵定價等在內的多種方法,并將其運用于數據資產內容和大數據型資產的價值評估中。
通過上文的綜述和分析,本文針對數據交易產業發展和政策制定提供以下建議。第一,完善數據要素界權,在場景性公正原則下針對數據內容和數據產品細分數據權利,加強數據安全和隱私保護,充分挖掘和釋放數據要素的價值。第二,以應用需求為導向建設第三方大數據交易平臺,提升其協調、服務數據買賣方的技術和能力,鼓勵專業性的數據聚合企業通過直接交易和間接交易方式,“一對多”與其他數據需求企業開展匹配交易。第三,重視區塊鏈技術在數據交易中的應用,制定統一的技術標準及規則,規范數據交易技術和市場。第四,構建數字生態,堅持市場主導原則,完善市場監督。