日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

億信ABI

一站式數據分析平臺

ABI(ALL in one BI)是億信華辰歷經19年匠心打造的國產化BI工具,技術自主可控。它打通從數據接入、到數據建模與處理、再到數據分析與挖掘整個數據應用全鏈路,可滿足企業經營中各類復雜的分析需求,幫助企業實現高效數字化轉型。

億信ABI

一站式數據分析平臺

億信華辰深耕商業智能十多年,
打造一體化的填報、處理、可視化平臺。

大數據研究員:數據科學很大,在你身邊很小

時間:2019-03-04來源:億信華辰瀏覽數:737

大數據

21世紀什么最貴?葛優在《天下無賊》里告訴我們,答案是人才,但他沒想到的是,短短八年后的2012年,奧巴馬向全世界宣布,數據才是新時代下最有價值的存在,對數據的占有和控制甚至將成為陸權、海權、空權之外的另一種國家核心資產,“數據是未來的新石油”。

與不可再生的石油不同,海量的數據仍在每天以驚人的速率增長,而在之江實驗室網絡空間大搜索研究中心研究員安靜斌看來,在可見的未來,數據將繼續以指數型的趨勢實現爆炸式的增長,“我們以后會有量子計算、有5G、6G的信息基礎設施、有各種各樣的可穿戴設施和物聯網,這些都是可以看到的未來,它們所帶來的龐大數據量是現在遠遠不能比的。”

如何從海量且依舊在爆炸增長的數據中,挖掘出更多能夠轉化為實際效益的“黃金”,這實際上就是人們口中的“大數據”、安靜斌所稱的“數據科學”所希望探索的重要課題,而對于普通人而言,這些經過分析、轉化之后的數據信息,最終如同逐漸匯聚的涓涓細流,潛移默化中影響我們生活的方方面面。

聯通孤島

“數據科學的誕生,實際上是數據量暴增的必然結果,也就是我們所說的量變產生質變,而隨著大數據時代的到來,除了海量性之外,數據也產生了新的特性,包括多元性、易構性、稀疏性。”從一個計算機專業畢業的博士開始,經歷了從數據庫時期到大數據時代的轉變,安靜斌與數據打了20余年的交道,他深刻感知著這些變化的軌跡。

安靜斌回憶,在信息化時代的初期,數據其實十分簡單,政府部門、企業部門對內部員工的信息登記和管理,構成了最早的數據,“簡單來說,就是把員工的姓名、身份證號碼、聯系方式這些數據,和建檔案一樣,以文件的形式一個個保存起來,但是沒有相應的工具,檢索起來很麻煩,需要一個一個打開去查找。”

其后,伴隨著互聯網的普及,數據量開始增加,為了方便快速檢索、提高數據的管理效率,出現了數據庫的技術,安靜斌介紹,作為信息管理系統最底層的一個核心技術,數據庫有著很強的目標性,“這數據庫中,每一個字段的含義是非常確切的,而且數據都是有用的。”

以一個銀行的數據系統為例,在最早的銀行數據管理系統中,用戶的賬戶余額是最核心的數據,也就是說,銀行除了保存用戶的身份信息數據,實時更新用戶的賬戶余額數據之外,對于用戶的轉賬、收入、支出等等業務都不會記錄。

而到了大數據時代,銀行會把用戶賬戶上的轉賬、業務、資金流轉等數據保存下來。

在這樣的情況下,數據的價值不再像原本那樣集中,但海量的數據中,隱藏著用戶的消費習慣、收入支出水平、潛在的業務辦理可能等等信息,例如,一個經常在轉入余額后短時間內就完成消費的賬戶,可能就是推廣貸款業務的潛在客戶。“這些海量的數據就像是沙子,數據科學現在要做的,就是利用我們現在信息系統的高處理能力,在里面淘金。”

之江實驗室網絡空間大搜索研究中心副研究員許浩將原本的數據管理系統中,數據相互沒有聯通、各自沉淀的狀況稱為“孤島”,關于同一個目標的不同數據沉積在不同的孤島中,當人們試圖對這個目標進行數據化的分析,就需要一點一點去提取數據,才能看到目標的全貌。

許浩舉例,政務處理是一個非常典型的案例,也是之江實驗室正在與杭州市政府合作探尋的新方向,“比如說,一個剛剛來到杭州工作的人,他想看看自己有沒有落戶的資格,那么他的居住信息在公安局,工作信息、社保信息在社保局,教育信息在教育部,通過大數據,可以把這些信息打通。現在杭州是最多跑一次,以后我們說一次都不用跑,所有的信息都整合在一起,查詢、辦理全部數字化、電子化,打破這些孤島。”

思維變革

一個也許會令很多人吃驚的事實是,如今的大數據行業,早已不是人們印象中IT技術男的天下。

安靜斌認為,數據科學發展到如今,已經不再是局限于IT領域的一種技術,而是一個綜合性的學科,成為了一種支撐性的技術,“比如說醫學出身的,做智能診斷、電子病歷,生物學出身的,研究基因測序、基因分析,管理學出身的,就在做智慧城市這些。”

許浩就是一個“跨界大數據”的典型例子,他攻讀了經濟學博士后,選擇從事數據科學,“這其實是一個必然的趨勢,數據科學的發展,對于經濟學以及其他很多學科,都產生了巨大的沖擊。”

以經濟學領域為例,在傳統的經濟學模型中,需要在特定的條件下,對一定數量的樣本進行數據分析,而在大數據的支撐下,即使是用非常簡單數據數學模型,也可以在擺脫原本的一些特定條件的前提下,通過對全樣本的數據分析,得到更加有價值的結論。

許浩認為,這實際上是對傳統思維和方法論的變革,“我們可以看到,越來越多最頂級、最前沿的經濟學家金融學家,他們發表的論文已經超出了常規的一些方法和數據,用全量的數據來做研究,這是跟傳統方式完全不同的數據來源,就好像原來我們需要非常精準精密、設計好的實驗環境,但現在不管在哪里,我們都可以做這個實驗。”

在科研領域之外,數據科學作為一門應用科學和革命性的技術,正在對許多行業進行重構洗牌,例如,在我們如今頻頻提起的新零售領域,大數據的挖掘是供應鏈得以優化的關鍵,在電商平臺,利用大數據為用戶提供定制化、個性化產品和服務已經卓有成效,而在餐飲、服裝等等行業中,利用數據分析選址、研發新產品、定價也成了重要趨勢。

這樣的趨勢下,傳統企業除了關注自身發展之外,也需要外部數據系統來判定行業形勢,從而做出理性的決定,這是運營思維上的徹底改變,“從小了來說,阿里巴巴的一個商鋪,他可以通過購買一些數據增值服務,了解到商品的季節波動、定價區間,從而明白如何打敗自己的競爭對手,更廣泛一些的話,制造業、工業等等,都受到了影響。”

這些細密瑣碎的變化,其實只是大數據帶來的一部分,安靜斌笑言:“從人類歷史的這樣一個角度出發,我們本身作為從業者而言,能夠參與到這樣一個革命性的行業中去,這是一件很有成就感的事情。”

野蠻生長

作為下一代革命性技術人工智能的重要依托技術,國內的大數據行業在全球走在了前列。

安靜斌稱,得益于中國龐大的互聯網經濟體量,以及總的人口規模,中國每年的數據增長量在全球排名前列。2018年5月,中國工信部副部長陳肇雄在貴陽“數博會”上表示,預計到2020年,中國數據總量全球占比將達20%,將成為數據量最大、數據類型最豐富的國家之一。

國家級發展戰略的高度定位,是大數據行業得以快速發展的重要原因。2015年9月,國務院發布《促進大數據發展行動綱要》,提出要從頂層設計層面,加強對大數據行業的支持,此后,各部委密集發文,從各個維度全力支持大數據行業的發展。

在政策的高度關注下,國內大數據行業增長迅猛,智研咨詢發布的《2018-2024年中國大數據行業發展趨勢及投資戰略研究報告》顯示,2012年,我國大數據市場規模約為35億元,而2017年,大數據市場規模達到358億元,增長十倍,預計到2020年,大數據行業市場規模將達到730億元。

由大數據技術帶來的企業規模增長及社會效益則更難以估量,“我們的政府在變得智能化、數字化,我們的企業在探索中優化,包括媒體也在做數字化轉型,大數據帶來的沖擊是方方面面的,未來還會有更多的新應用、新技術落地。”

在生長與探索之中,一些過快發展留下的問題不可避免。

在許多關于大數據的討論中,隱私問題繞之不去,曾被“莆田系”、“血友吧”事件纏身的百度李彥宏發表過這樣的言論,“中國人更加開放,對隱私問題沒有那么敏感,很多情況下他們愿意用隱私交換便利性,那我們就可以用數據做一些事情。”

實際上,國內更多大數據公司的做法與李彥宏所言并無區別,許浩表示,由于國內在相關立法方面相對滯后,國內的大數據公司正在野蠻生長,“為什么叫野蠻生長?拿到數據就是王,他們不會管這個數據是從哪來的,數據有沒有道德或是法律上的風險,在他們的思維里,拿到了數據就可以賺錢。”

對于一個年輕的行業而言,這并非可以持續的常態。安靜斌稱,“大數據這個行業還遠遠未能達到它的上限,還在一個發展期,我們希望政府、相關部門可以看到這一點,在給予它更多照顧的同時,也應該對它進行一些約束。”


(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢