大數據時代,數據驅動決策。處理不好龐大、復雜的數據,其價值將大打折扣。可以想象一本沒有圖片的教科書。沒有圖表、圖形或是帶有箭頭和標簽的插圖或流程圖,那么這門學科將變得更加難以理解。人類天生就是視覺動物,而視覺效果對于分析數據、傳達實驗結果甚至做出驚人的發現至關重要。
工作中我們可能會接觸到很多業務數據,需要在總結匯報中展示呈現,俗話說“字不如表,表不如圖”,想學好
數據可視化分析就必須多做項目,多實戰,只有這樣才能把平時學的統計學,概率論知識、
數據分析模型等真正用起來。
那么從哪找數據可視化的練習數據呢?小億今天和大家聊聊這些。
一、數據可視化的數據類型
數據的作用不一,當我們有不同的需求時就需要不同的數據。如需要宏觀經濟相關的指標或者某個市場整體的數據,這些數據是有所不同的。
內部數據是在企業或者行業的業務運轉中產生,比如常見的用戶數據、產品數據、銷售數據、內容數據等等。獲取內部數據我們可以安裝在線軟件或者或者進行調查以收集數據。內部的數據相對來說更加完善、規整,作用也更加細膩。搭建起內部數據模型對于企業來說是有必要也是具有重大意義的,就像
億信ABI能夠為企業搭建起一個從數據接入到數據分析的一體化數據工具,從而打通企業內部數據壁壘,整合好企業內部數據。
但也有很多時候我們需要利用的是外部數據。當進行市場調研,競品分析,或者輸出報告的時候,外部數據的分析是必不可少的。外部數據就多種多樣了,有GDP、行業總值、行業發展狀況等等,這些外部數據幫助我們了解一個行業,并對此進行分析。
一般來說,可視化數據分析中的數據包括以下幾類:
1、交易數據(TRANSACTION DATA)、
大數據平臺能夠獲取時間跨度更大、更海量的結構化交易數據,這樣就可以對更廣泛的交易數據類型進行分析,不僅僅包括POS或電子商務購物數據,還包括行為交易數據,例如Web服務器記錄的互聯網點擊流數據日志。
2、人為數據(HUMAN-GENERATED DATA)
非結構數據廣泛存在于電子郵件、文檔、圖片、音頻、視頻,以及通過博客、維基,尤其是社交媒體產生的數據流。這些數據為使用文本分析功能進行分析提供了豐富的數據源泉。
3、移動數據(MOBILE DATA)
能夠上網的智能手機和平板越來越普遍。這些移動設備上的App都能夠追蹤和溝通無數事件,從App內的交易數據(如搜索產品的記錄事件)到個人信息資料或狀態報告事件(如地點變更即報告一個新的地理編碼)。
4、機器和傳感器數據(MACHINE AND SENSOR DATA)
這包括功能設備創建或生成的數據,例如智能電表、智能溫度控制器、工廠機器和連接互聯網的家用電器。這些設備可以配置為與互聯網絡中的其他節點通信,還可以自動向中央服務器傳輸數據,這樣就可以對數據進行分析。機器和傳感器數據是來自新興的物聯網(IoT)所產生的主要例子。來自物聯網的數據可以用于構建分析模型,連續監測預測性行為(如當傳感器值表示有問題時進行識別),提供規定的指令(如警示技術人員在真正出問題之前檢查設備)。
二、數據可視化的數據來源
要做實戰學習數據可視化,就要掌握數據來源的網站,小億根據不同的數據類型給大家推薦一些網站。
1、金融財經數據源網站
(1)、世界銀行
世界銀行的公開數據庫,免費并公開獲取世界各國的發展數據。

(2)、國際貨幣基金組織(IMF):

(3)、CEIC:
CEIC擁有最完整的,超過128個國家的經濟數據,能夠精確查找GDP, CPI, 進口,出口,外資直接投資,零售,銷售,以及國際利率等深度數據。

(4)、Wind(萬得):?
萬得被譽為中國的Bloomberg,在金融業有著全面的數據覆蓋,金融數據的類目更新極快,很受國內的商業分析者和投資人的親睞,但是部分數據是收費的。

(5)、同花順數據中心:
提供股票債券等金融數據

(6)、金融數據網:
提供每日的黃金、匯率、農產品、汽油價格的相關數據,友情鏈接中國人民銀行、中國證監會、金牛理財網,中國藍網等網站。

2、互聯網趨勢分析數據源網站
(7)、TalkingData移動觀象臺:
覆蓋到七大模塊的內容——應用排行、公眾號排行、App Store排行、終端指數、數據報告、市場洞察、人跡地圖。包含各種數據報告。

(8)、199IT:
容納眾多互聯網數據報告,其導航網站收集了眾多數據相關的網站鏈接,例如IBM商業研究院的2021年CIO調研報告;巨量算數的2021國民財富生活白皮書(附下載);中國信通院:2021年中國智慧農業發展研究報告(附下載);艾瑞咨詢:2021年中國場景音樂用戶洞察白皮書(附下載)等等。

(9)、艾瑞網:
艾瑞網能夠查看較新的數據報告,主攻網絡媒體、電子商務、網絡游戲等新經濟領域
3、汽車行業數據源網站
(10)、中國汽車工業協會:
主要是新車數據,包括產銷和進出口情況,沒有二手車數據。

(11)、中國汽車流通協會:
相比中國汽車工業協會網站包含了二手車數據。
(12)、易車指數:
主要面向購車者、汽車從業者,針對國內汽車銷售市場,為購車者或汽車從業者提供參考的數據指數。
4、房產行業數據源網站
(13)、房天下產業網:
網站數據來源于中國指數研究院和CREIS中指數據,展示國內房地產數據情況
(14)、國信房地產信息網:
國家信息中心主辦的網站,含有1400w+數據。
(15)、中指研究院:
主要研究房地產的各項數據,包括房地產行業、企業研究。
5、綜合性數據源網站
(16)、鏑數聚:
提供了12大類、50多萬個數據和數據報告,基本上覆蓋了市面上所有細分行業。可以點擊分類查看也可以通過數據關鍵詞查詢。網站大部分數據都可以免費下載。
(17)、中國統計信息網:
國家統計局的官方網站,上面匯集了海量的全國各級政府各年度的國民經濟和社會發展統計信息,可以在上面找到國家階段發展數據、統計分析、主要統計指標排行等。
(18)、中國產業信息網:
包含了能源、電力、冶金、化工、機電、電子汽車、物流等各個行業相關的數據,所有的數據全部免費,做行業分析經常用到的。
三、數據可視化的注意事項
可視化的首要任務是準確地展示和傳達數據所包含的信息。根據預期和需求,提供有效輔助手段以方便用戶理解數據,從而完成有效的可視化。所以數據可視化也有一些注意事項:
1. 數據可視化系統的服務模型
當數據尺寸大、結構復雜時,有限的空間大大限制了靜態可視化的效果,有限的可視化空間和數據過載之間的處理是非常復雜的。有時我們會通過物理環境的變化來改變服務模型,但更多的時候是通過交互設計來完成對復雜信息的處理。交互可提高可視化系統的效率,幫助用戶處理更多的數據,完成更復雜的任務。
然而,實現交互本身也有額外成本。互動的系統可以使用戶能探索更大的信息空間,但隨之而來的成本是用戶需要花費更多的時間與精力去瀏覽和探索數據。如果用戶需要逐一試探每個數據點,那么可視化系統就成為了完全依靠人力的信息檢索系統。因此,可視化系統應當采用數據挖掘算法自動發現用戶可能會關心的數據或者模式;并通過可視化呈現給用戶,用戶在這個基礎上通過互動進行更深入的挖掘。另一方面,如果一個任務完全可以通過自動算法得出用戶需要的結論,交互也就不再需要了。
互動的可視化系統,特別是可視分析系統中的自動分析和用戶交互分析是相互補充的兩個部分,權衡兩者的作用與成本,從而達到一個合理的平衡。設計師的設計決定了系統的可理解性,一旦掌握了這個邏輯,在復雜的頁面也會變得有條不理。另外是我們自己對產品的一套理解力和技巧,可理解性和理解力是對可視化系統復雜問題處理上兩個決定性要素。
2. 數據可視化系統的視覺設計
在信息可視化設計中,配色方案關系到可視化結果的信息表達和美觀性。好的配色方案的可視化結果能帶給用戶愉悅的心情,有助于用戶更有興趣地探索可視化所包含的信息;反之,則會造成用戶對可視化的抵觸。另外,和諧的配色方案也能增加可視化結果的美觀性。
在設計可視化的配色方案時,設計者需要考慮很多因素:可視化所面向的用戶、群體、可視化結果是否需要被打印或復印(轉為灰階)、可視化本身的數據組成及其屬性等,這里我想重點提出配色與服務模型的關聯關系。目前市面大部分的運營監控系統采用的是深色背景色的配色方式。這種配色的優勢是:深色背景與高亮度數據、表格產生高對比度,更容易凸顯數據,使人更容易感知到數據。但如果生產方式是需要長時間使用系統觀察數據分析時,會使人很容易產生視覺疲勞,所以應該結合場景考慮視覺設計風格。
四、小結
要做數據可視化必然離不開數據,也只有結合數據可視化用數據說話的目的才能達到,所以各種網站的數據對于數據可視化來說是很有用也很重要的。
(部分內容來源網絡,如有侵權請聯系刪除)