兩個富豪狹路相逢,如何在互不透底的情況下比較出來到底誰更富有?姚期智院士在1982年提出了這個經典問題,同時也給出了“多方安全計算”的技術解決方案。這個方案經過近四十年的演變,在當前數字經濟的背景下,與其他前沿技術相結合,逐漸形成了一個全新的火熱賽道——“隱私計算”。
什么是隱私計算?
我們可以參考上面的“富翁問題”來形象地理解其本質,即如何在保證數據提供方不泄露原始數據的前提下,對數據進行分析計算,讓數據在流通與融合過程中“可用不可見”。目前的隱私計算主要是以多方安全計算、聯邦學習、可信執行環境為代表,混淆電路、秘密分享、不經意傳輸等作為底層密碼學技術,同態加密、零知識證明、差分隱私等作為輔助技術的技術體系。
01、歷經演變隱私計算迎來大爆
權威國際咨詢機構IDC中國發布的 《IDC Perspective: 隱私計算全景研究》報告中透露,2021年中國隱私計算市場規模突破8.6億元人民幣,未來有望實現110%以上的市場增速。艾瑞咨詢發布的《2022年中國隱私計算行業研究報告》預測,2025年中國隱私計算市場規模將達到145.1億元,2030年中國隱私計算市場規模將達800~900億元。隱私計算演變發展至今,為何在近年突然大火?這不得不提到數據安全這一把一直懸在數據流通領域的“達摩克利斯之劍”。

數字經濟飛速發展,數據要素的重要性已然確立,然而目前的數據基礎設施、數據交易生態并不完善。再加之數據安全相關的法律法規與市場監管趨嚴,我國分別于2021年9月1日和11月1日實施《數據安全法》和《個人信息保護法》,使得在數據共享和利用中保護數據和隱私安全成為必要條件。于是,數據所有者對于數據流通往往是保守的,不敢給也不愿給:這一方面是出于數據合規方面的謹慎考慮;另一方面則是出于將數據視作資產的競爭與保密意識。
要解決這一矛盾,就得解決數據的安全性問題,讓數據隱私在得到保障的情況下,安全地流通。對此,隱私計算無疑是一個能兼顧數字經濟發展和數據隱私保護的較好方案。
隱私計算的核心能力在于讓數據可用不可見,它一方面能通過密碼學和隱私保護技術來保證數據傳輸的私密性,從而更好地保證原始數據的安全;另一方面又能通過隱私計算的“數據不動,模型和結果移動”來讓各方在數據不離開本地數據庫的前提下,完成數據的交互,碰撞和建模,從而保障數據資產的安全性,促進數據要素的流通與價值的發揮。
02、實現數據“可用不可見”的技術體系
那么,數據的“可用不可見”是如何通過隱私計算實現的呢?
這主要是依賴于技術手段,排除掉傳統的人為權限控制的不可控性,通過完全不泄露計算過程中的任何中間信息作為隱私保護手段,讓數據“可算不可識”,從而實現數據在參與方之間的“可用不可見”。
目前,主流的隱私計算技術分三大方向:一是以多方安全計算為代表的基于密碼學的隱私計算技術,二是以可信執行環境為代表的基于可信硬件的隱私計算技術,三是以聯邦學習為代表的人工智能和隱私保護融合衍生的技術。
1、多方安全計算
多方安全計算不是單一的技術,它包括秘密分享、不經意傳輸、混淆電路、同態加密、零知識證明等多種技術。它是通過密碼學協議的方式構建虛擬的計算框,從而解決各方間的信任問題。其原理是在數據的擁有方布置一些計算節點,在節點之間設置多方安全計算協議進行交互,最后得到計算結果。
由于密碼學原理的復雜性,多方安全計算的性能相對較低且技術開發難度較大,近幾年產業界的高度關注使得其性能得以迅速提升,技術可用性得到很大的提升。

2、可信執行環境
可信執行環境的核心思想是構建一個獨立于操作系統而存在的可信的、隔離的機密空間,數據計算僅在該安全環境內進行,通過依賴可信硬件來保障其安全。其具體操作是,用硬件構建一個安全保險箱,數據擁有方把數據用公鑰加密后放到該安全保險箱中,硬件中的可信執行環境用私鑰對數據進行解密,然后計算結果。TEE技術的核心在于硬件技術,該技術未來的產業方向在于打造自主可控、安全可靠的國產TEE芯片等安全產品。
3、聯邦學習
聯邦學習是一種新興的人工智能基礎技術,在 2016 年由谷歌最先提出,其設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私前提下,在多參與方或多計算結點之間開展高效率的機器學習。
聯邦學習的本質是分布式的機器學習,在保證數據隱私安全的基礎上,實現共同建模,提升模型的效果。聯邦學習同樣構建了一個安全保險箱,但安全程度沒有那么高。該技術會刻意做一些安全性上的退讓和妥協,從而極大提高計算的性能,但不可避免會泄露部分中間信息。
03、新興技術賽道廣泛行業應用
通過以上的技術邏輯,隱私計算為區塊鏈、AI、物聯網等技術帶來了新的發展方向,在一定程度上實現了數據的流通,推動了數據的價值應用,在許多行業均有相關應用。目前,隱私計算技術較為成熟應用的行業有金融、政務、醫療等有剛性需求的行業,主要的應用場景有有金融風控、醫療健康、身份驗證等。
1. 金融
隨著《要素市場化配置綜合改革試點總體方案》、央行《金融科技發展規劃2022—2025》等頂層設計文件相繼出爐,加之去年落地的《個人信息保護法》的助推,能解決數據安全合規流通問題的隱私計算在金融行業應用前景廣闊。
在金融領域,為了進行風控管理,金融機構需要融合多方機構的數據,構建有效而準確的風控模型,但是數據泄露風險和數據安全保護趨嚴使得傳統的風控方式受到了限制。同時,在資產營銷方面,面對現有的客戶,金融機構無法僅通過自己單方的數據判斷客戶的相關信息,跨機構信息又很難獲取。以征信系統為例,銀行、小貸公司等金融機構需要通過多個信息渠道對潛在用戶的歷史記錄進行多維度計算分析。但由于這些數據具有很高的隱私性,且很多信息渠道并不具備足夠安全可靠的信息傳輸管控技術,征信系統的數據豐富性不足或者維度缺失。

? ??
運用隱私計算技術,可以幫助金融機構優化風控模型,防范金融詐騙,支撐融資貸款等服務,也可以通過跨機構、跨行業的數據安全融合,發掘特定客戶,進行精準營銷。
2. 政務
2022《政府工作報告》提到,要建設數字信息基礎設施,推進5G規模化應用,促進產業
數字化轉型,發展智慧城市、數字鄉村。政務數據涉及醫保、社保、公積金、稅務、司法、交通等方方面面,隱私安全尤為重要,如能利用隱私計算技術打通政務數據、挖掘數據潛能,那么智慧城市、智慧鄉村建設將如虎添翼。舉例來說,隱私計算技術可以提供政府數據與電信企業、互聯網企業等社會數據融合的解決方案,比如可以聯合多部門的數據對道路交通狀況進行預判,實現車輛路線導航的最優規劃,減緩交通堵塞。
因此,政務方面,國內多地已將隱私計算納入城市數字化發展規劃(如數字政府、數字社會建設)中。據公開報道,廣東省去年7月發布的《廣東省數據要素市場化配置改革行動方案》中,就提出了構建包含隱私計算在內的新型數據基礎設施;成都也將在全國率先建設基于超算中心的隱私計算平臺。
3. 醫療
在醫療領域,數據較為敏感,并且基于醫療數據的各項科學研究通常需要大量樣本,單一數據源的數據量很難滿足海量的數據需求,而數據共享過程中又會帶來隱私泄露的風險。應用隱私計算技術進行多方協同過程中,能夠有效的防止關聯敏感信息的醫療數據被泄露,保證數據安全。
隱私計算在醫療領域的典型應用場景主要有醫療機構間的數據共享和跨機構跨域的醫療數據開放兩大類。前者屬于醫療機構、制藥企業、基因測序機構、科研機構之間的橫向場景,以增加樣本數量進行建模;后者則納入了保險公司、運營商、政務系統、互聯網等外部數據,以增加樣本特征進行建模。

IDC判斷,隨著合規標準的逐步細化與推出,制造業、能源等行業對隱私計算的需求也將穩步上升。同時隨著醫療領域將模型方面完善、信息化建設跟進,這一市場將迎來高速增長生物醫療,是下一個競爭市場與爆發點。
04、風口之下這些問題仍待解決
毋庸置疑,隱私計算已迎來其發展應用落地的黃金時期,但風口之下,仍處于行業應用初期的隱私計算,仍有許多待完善的地方。
就拿目前大約占據了隱私計算市場七到八成的份額的金融行業來說,其實其在隱私計算落地應用的步伐,也并不大:相關招標項目的金額有限,多在幾十萬元到數百萬元,超過300萬元的項目已是少數。究其背后原因,則是隱私計算技術在從實驗室走向工程化、生產級輸出過程中,面臨的技術限制、流通限制、產業生態、商業模式等一系列問題。

? ? ??
1、技術限制
(1)效率問題
盡管隱私計算單一技術理論基礎完善,但應對龐大的數據體量,隱私計算的性能和算力上也相應受到掣肘。隱私計算作為一種“密文計算”,相對于“明文計算”的效能仍舊有限,比如同態計算的密文擴張規模可達1到4個數量級。雖然技術發展已經大幅提升了密文運算的算力,但在本地建模上相較明文計算,密文運算要慢5~10倍,特別是在對多方海量數據的生產級運算方面。
(2)安全性問題
在安全性上,隱私計算單一技術并不是萬無一失。以聯邦學習為例,IDC通過調查發現,聯邦學習是隱私計算重要發展方向。但是聯邦學習技術仍然較為新興,在安全性、去中心化架構、模型可解析性等各方面,仍然任重道遠。
諸多隱私計算技術的應用,從側面反映出并沒有任何一項技術能夠解決所有場景下出現的問題,每項技術本質都是在計算的精度、計算性能和計算安全性上做折中和妥協。未來只有技術能力能夠支撐較大規模的計算和良好的安全性后,才能使隱私計算真正助力整個數據要素市場流動。
2、 流通限制
隱私計算的核心目標是安全地鏈接并發揮
數據價值,因此互聯互通是隱私計算大規模落地應用前亟待解決的問題。
一是與需方原有系統的聯通。許多需方往往經過多年的技術積淀已有較為成熟的系統架構,且各系統間緊密鏈接,對現有系統的改造牽一發而動全身。這就導致隱私計算技術的使用很多時候只能從一個迷你的測試場景做起,再逐漸過渡到一個新的系統。
二是不同廠商間的聯通。目前,隱私計算的技術種類龐雜,且相關廠商眾多,各廠商實行的架構不同,不同技術、廠商架構之間如何聯通成為難題。
三是數據流通的所屬權問題。用于豐富數據模型的數據特征等產品的所屬權問題也存在爭議,解決誰授權、向誰付費將會是隱私計算在更廣行業領域中應用的門檻。
3、 產業生態
首先是產業應用的豐富度不足。目前隱私計算的各個廠商大多處在同質化競爭的階段,尚未形成產業生態。不過,相信未來隨著整個行業的發展,慢慢會有新的角色分工出現,基于開放設計,每個角色都能夠在生態位上找到適合自己的商業模式。
再者就是有價值的數據源較為稀缺。當前無論是出于對數據安全性的擔憂,還是法律法規的確權問題,都導致沒有很多有價值的數據源進入市場、推動數據市場的開放,因此隱私計算的市場需求也會受到壓制。
4、商業模式
從商業模式上來看,目前隱私計算平臺是作為第三方平臺存在的,這在一定程度上仍然會存在數據安全問題。
而且盡管數據合規需求從根本上鞭策了相關企業進行數據安全的改造和升級,但當前隱私計算的商業模式還處于早期探索期。從收入形態來看,通過搭建隱私計算技術基礎設施,產品售賣和平臺搭建是主要來源;另一類是通過提供SaaS服務,主要面向中小客戶群體,比如多中心的隱私計算保護需求或者跨域分析、咨詢服務等商業模式已初具雛形。更多的模式還在探索期,在市場逐步成熟的條件下,營業模式也將與時俱進。
05、小結
隨著大數據發展和應用的不斷深入,市場各方對跨源、跨領域、跨用戶的數據流通共享需求日益增大,隱私計算技術在近幾年得到了廣泛關注和迅速發展。然而,隱私計算技術要實現大規模的落地應用,仍需要在性能、技術融合、安全等方面進一步提升,并且在一些非技術因素上形成相關配套。
相信在健全完善的法律法規、豐富多樣的應用實踐、成熟可用的開源技術等多方生態共同作用下,隱私計算行業將迎來蓬勃發展,隱私計算平臺有望成為數據合規流通基礎設施的關鍵一環,在保證安全的前提下持續有效釋放數據要素價值,促進數字經濟高質量發展。
(部分內容來源網絡,如有侵權請聯系刪除)