日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

為什么說下一代存算分離是大數據建設的必然趨勢?

時間:2022-04-28來源:成全新的幸福瀏覽數:310

根據Starburst聯合創始人賈斯汀·伯格曼的經驗,想要讓企業數據架構經得起時間的考驗,關鍵之一就是擁抱存算分離。

著名開源數據庫TiDB創始人黃東旭在《近十年數據庫流行趨勢縱覽!存儲計算分離、ACID 全面回歸......》一文中,也將存算分離放在近年數據庫流行趨勢的第一位。

Facebook根據自己的業務需求,研發了一套存算分離的架構來支撐上億用戶產生的大數據。各大企業尤其是互聯網行業也都開始采取存算分離作為數據庫的解決方案,理論和實踐都在向我們闡述存算分離的正確性,因此我們想研究兩個問題:

為什么存算分離會成為歷史的必然選擇?

為什么向存算分離的下一代演進是大勢所趨?

01?為什么存算分離會成為歷史的必然選擇?

想要了解企業數據架構向存算分離演進的必然性,首先要了解企業每一次數據架構變遷的背景和理由。

回顧歷史,我們會發現,數據架構變遷往往是因為當時技術暴露種種缺點,與企業新的發展需求不匹配。

這些變遷,最早可以追溯到上世紀90年代——

20世紀90年代,一些企業開始部署開源數據庫以支持 Web 應用程序,因為免費,所以在當時大受歡迎;

進入21世紀初期,開始面臨“數據多,很難在一臺物理機器上分析數據”的難題,企業開始采用大規模并行處理?(MPP)?驅動的新型數據庫系統。

發展到2010?年前后,因為新興業務的不斷產生,而MPP數據庫缺乏現代分析和數據科學所需的靈活性,企業再次轉向另一種新技術:Hadoop,即采用節點本地存儲的設計,由此形成計算和存儲耦合(即存算一體)的架構。

同樣地,來到今天,隨著5G、IoT等技術不斷發展,數據量激增,存儲空間和計算能力與數據增長不匹配,存算耦合的缺點也逐漸暴露:

1. 資源利用率低

從節點本身承接的業務來看,日志留存類的服務,數據很少被調用分析,因此CPU利用率較低,造成計算資源浪費,而且當計算或存儲達到瓶頸,服務器的可靠性也會大大降低。從集群整體來看,由于存算一體煙囪式建設,資源完全獨立不能共享,導致多個Hadoop集群無法隨不同時段業務需求的波動而均衡負載(平均資源利用率在25%以下)。

2. 成本高

當存算按某一比例強制綁定在一起,就意味著無法彈性擴容,同時為保證可靠性,采用三副本模式,造成大集群下高昂的存儲成本。

3. 運維困難

隨著業務復雜度的增加和新業務上線的速度加快,對服務器資源配比的要求也會隨之增加,如果服務器款型繁雜,維護難度就會增大,同時導致機房空間占用多、能耗大。

基于上面的背景分析,存算分離進入大家的視野。

可以說,存算分離針對存算一體的弊端進行優化,為企業控制成本和提升數據運行的效率提供了新的思路,具體來說:

1. 提升資源利用率,節約成本

實現計算和存儲彈性擴展、按需分配,降低了系統部署和擴展成本,同時將CPU和磁盤充分調度起來,解決了資源利用不均衡的問題。

2. 簡化運維,提升可靠性

使用外置共享存儲方便備份恢復,提高SSD的使用壽命,從而提高數據庫解決方案整體的可靠性,同時解決運維能力不足造成的硬件冗余。

隨著企業數字化建設的深入和業務訴求的升級,如果僅僅滿足于存算分離1.0時代,還遠遠不夠。

02 為什么向存算分離的下一代演進是大勢所趨?

如前文所說,存算分離1.0時代的解決方案聚焦成本,解決海量數據激增下企業如何重新定義大數據建設架構的問題,但仍未解決數據鏈路長、數據孤島、數據搬遷難等問題。

為了應對大數據時代下融合+實時分析數據的需求,企業IT架構向下一代存算分離演進勢在必行。

當傳輸協議和帶寬能力已不再是IO瓶頸,下一代大數據存儲應該向湖倉一體、一湖多云演進,更多以數據為中心,聚焦數據用得好的問題,以數據驅動融合分析、統一存儲,進一步驅動數據價值實時變現。

那么,以數據為中心的下一代存算分離,與1.0時代有什么不同?

首先通過實現計算和存儲資源的單獨擴容,然后將原本分散的數據實現集中存儲,打造統一的數據湖(Data lakehouse)。

同時,實現一湖多云對接。新一代數據庫,尤其是分布式數據庫,普遍采用云計算部署方式。下一代存算分離可以將數據存儲保留在本地,將機器學習等計算資源部署在公有云。這樣既能保證數據的安全性,又能實現計算的敏捷。

換句話說,下一代存算分離方案通過性能優化、元數據統一管理,實現以數據為中心的高效跨云協同、跨云管理。

以華為的OceanStor Pacific為例,作為國內大數據下一代存算分離的解決方案先行者之一,在存儲層實現了原生HDFS語義接口的存算分離方案,打破了傳統大數據平臺計算存儲的部署架構。同時率先在存儲上支持湖倉融合的新興數據格式,在下一代存算分離架構下,基于一份數據支持接數據湖、數據倉庫同時訪問。提供以業務為中心的高彈性大數據計算,以數據為中心的高性能海量存儲,用戶無感知的原生HDFS和S3兼容能力。

據了解,OceanStor Pacific不僅算力密度在業界領先30%,而且做到一站式交付、一鍵式部署,可以有效匹配企業大數據快速迭代發展。

更重要的是,對不同的行業和企業來說,下一代存算分離方案可以真正把技術落到實處,發揮作用。

對金融企業來說,這可以提升數據共享便捷度,減少數據重復存儲和搬遷,縮短數據加工鏈路,大大提高了數據分析的效率。

對政務平臺來說,可以從推動政務管理大數據向城市運行大數據演進,讓平臺在辦理業務時可以在不同應用間共享數據,彈性調度不同資源,滿足不同時間段的需求。

對運營商來說,使用下一代存算分離解決方案可以降本增效,提高資源利用率,降低運營成本,實現全國算力網絡統一布局。

根據鳳凰科技的報道,中國聯通基于華為 OceanStor Pacific 海量存儲的大數據平臺于2020年7月正式上線。承載互聯網分析、loT、日志等系統15PB的數據量,實現聯通各省公司2/3/4/5GxDR等數據的接入分析,日導入數據量超過70TB,取得了實質性的突破。

其實,時代和技術,始終在進步。

企業也一直向前發展,需求在不斷更新。

但通過以上種種分析和舉例,我們至少可以說——

為了擴大數據分析架構的規模、提高數據分析的靈活性和敏捷性,存算分離是目前降低數據分析成本的第一步,向下一代存算分離演進,則是更重要的一步。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢