
大數(shù)據(jù)(Big Data)是指在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)包括兩部分:數(shù)據(jù)的存儲,數(shù)據(jù)的利用。數(shù)據(jù)的存儲,相比以前的“關(guān)系型數(shù)據(jù)庫”,只是數(shù)據(jù)量大了,數(shù)據(jù)格式豐富了,存儲方式不同了。數(shù)據(jù)的利用,相比“
商業(yè)智能", 同樣是對數(shù)據(jù)的分析利用,只是由于數(shù)據(jù)豐富了,所以應(yīng)用前景更大了。從本質(zhì)上講,沒有太大區(qū)別。大數(shù)據(jù)的應(yīng)用的數(shù)據(jù)來源包括結(jié)構(gòu)化數(shù)據(jù),如各種數(shù)據(jù)庫、各種結(jié)構(gòu)化文件、消息隊列和應(yīng)用系統(tǒng)數(shù)據(jù)等,其次才是非結(jié)構(gòu)化數(shù)據(jù)。
BI(BusinessIntelligence)即商業(yè)智能,它是一套完整的解決方案,用來將企業(yè)中現(xiàn)有的數(shù)據(jù)進行有效的整合,快速準確的提供報表并提出決策依據(jù),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策。
商業(yè)智能BI在數(shù)據(jù)架構(gòu)中處于前端分析的位置,其核心作用是對獲取數(shù)據(jù)的多維度分析、數(shù)據(jù)的切片、數(shù)據(jù)的上鉆和下鉆、cube等。通過ETL數(shù)據(jù)抽取、轉(zhuǎn)化形成一個完整的
數(shù)據(jù)倉庫、然后對數(shù)據(jù)倉庫的數(shù)據(jù)進行抽取,而后是商業(yè)智能的前端分析和展示。
商業(yè)智能不能等同于不是大數(shù)據(jù)。大數(shù)據(jù)和商業(yè)智能BI的關(guān)系從應(yīng)用上來講,BI即商業(yè)智能,是一套完整 解決方案,用來將企業(yè)中現(xiàn)有的數(shù)據(jù)進行有效的整合,快速準確的提供報表并提出決策依據(jù),幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策。大數(shù)據(jù)的側(cè)重點在于數(shù)據(jù)海量處理,主要是對非結(jié)構(gòu)化的數(shù)據(jù)進行處理。大數(shù)據(jù)是傳統(tǒng)數(shù)據(jù)庫、數(shù)據(jù)倉庫、BI概念外延的擴展,手段的擴充,不存在取代的關(guān)系,也并不是互斥的關(guān)系。考慮實用性的話,傳統(tǒng)商業(yè)智能指基于傳統(tǒng)數(shù)據(jù)倉庫進行分析以輔助決,可以說
BI工具會更適合一般企業(yè),這是未來趨勢。兩者是不一樣的概念,BI相對于大數(shù)據(jù)更傾向于決策,適合支持經(jīng)營指標支撐類的問題,大數(shù)據(jù)則內(nèi)涵更廣,傾向于刻畫個體,更多的在于個性化的決策。
現(xiàn)今,大型互聯(lián)網(wǎng)企業(yè)采用hadoop一類的大數(shù)據(jù)架構(gòu)——數(shù)據(jù)倉庫——自己研發(fā)的報表、OLAP分析等,或者前端選用成熟的商業(yè)智能報表和BI分析軟件,傳統(tǒng)企業(yè),小型的公司沒有那么多的業(yè)務(wù)分析的需求,大多尋求excel、業(yè)務(wù)系統(tǒng)的簡單報表功能或者專業(yè)的
報表工具來解決問題;一般中大型企業(yè)數(shù)據(jù)量大時會構(gòu)建數(shù)據(jù)倉庫,用BI在前端分析展現(xiàn)。當然很多傳統(tǒng)企業(yè)針對特定業(yè)務(wù)(比如用戶畫像、風控分析)采用大數(shù)據(jù)技術(shù)。
整體來講,選擇大數(shù)據(jù)還是BI依據(jù)需求來定,大數(shù)據(jù)組件大多開源,需要大量的人力開發(fā)。BI大多商用,需要一定資金和一定時間的項目實施。
(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)