網站數據分析的一些問題2
來源:解決方案 2012-09-10
上一篇——網站數據分析的一些問題1中主要羅列了一些關于網站數據分析行業與數據分析師這個職業相關的一些問題,這篇是第二篇,主要想羅列一些關于BI的問題
BI(Business Intelligence,商業智能),先看一下維基百科上面對BI的定義:
Business intelligence (BI) is defined as the ability for an organization to take all its capabilities and convert them into knowledge.
BI提供大量有價值的信息引導企業尋找新的發展機遇,當企業認識到潛在的機遇并成功地實施相應戰略決策的時候,BI就能幫助企業在市場建立競爭優勢并維持企業持續地發展BI時常跟決策支持系統(Decision Support System, DSS)聯系在一起,其實BI最主要的目標就是實現對企業的決策支持
下面就探討幾個BI方面的問題:
Q1、BI與數據倉庫(DW)之間的關系是怎么樣的?(知乎)
首先可以明確的是BI的重點在于對數據的應用上,讓數據變成有價值的信息,而所有的基礎數據基本都是來源于數據倉庫
BI有兩個方向的定義:廣義的BI是包含數據倉庫的,廣義的BI包括數據的獲取、處理、儲存,到之后的分析、挖掘、展現變成有價值信息的整個過程,組成了一套完整的系統,當然在這個系統中數據倉庫擔當著從數據獲取之后的處理和存儲的職責,是基礎組成部分;狹義的BI僅僅包括上層的數據應用,包括數據的展現、分析、挖掘等,所以不包括數據倉庫
因為BI的定義更側重于數據應用,而隨著數據量的不大擴大,數據倉庫更多地被作為一項獨立的技術被抽離出來,所以當前BI和數據倉庫的定義更傾向于分離,整個系統被叫做“DW/BI”的解決方案
Q2、BI系統主要是為了幫助企業解決什么樣的問題?(知乎)
BI最初的目標就是優化企業的決策支持,實現從數據到有價值的信息的轉化,輔助企業商業戰略和決策的制定所以BI的最終目標是獲取商業的Insight
BI首先實現的是企業數據的透明化,原始的數據報表就是為了從數據的角度定量地掌握企業的運營狀態,有了數據的支撐,很多決策的制定就會有了參考依據隨著商業和信息技術的不斷發展,BI不再僅僅停留在報表的領域,數據除了展現以外被更多地用于商業分析,而商業分析的基礎組成就是統計、預測和優化,這些對企業的運營決策起到了更加關鍵的作用但隨著信息膨脹,數據量的劇增,BI也不斷面臨挑戰,我們需要花更多的成本去處理和存儲數據,需要花更多的精力去分析和應用數據
所以,最終還是要把握BI的輸出是有價值的信息,無論中間的處理方式是查詢、報表,還是分析、挖掘,最終要得出的是有價值的結論
Q3、目前BI的應用或組件主要有哪些?(知乎)
這里簡單地歸納了一下,可能會有遺漏,希望大家能夠在評論中補充這里僅僅包括狹義BI中基于數據應用層面的一些功能,數據倉庫的數據處理方面的應用不在這里羅列
首先是報表、圖表和Dashboard,目前的報表和圖表除了更加豐富以外,跟傳統報表還有一個關鍵的區別就是可交互性目前的報表基本都提供簡單的數據篩選、排序等功能,Dashboard的出現實現了按需整合報表和圖表的功能
再則是OLAP,OLAP一度被當做BI的核心功能,不得不承認OLAP是分析數據最有效的手段,尤其是基于多個維度多個層面的分析,這些是一兩張報表圖表所無法做到的OLAP一般都是基于已經設計成型的多維模型以及存放多維模型的數據集市(Data Mart),數據集市和OLAP跟業務層面有著很多關聯,這個使數據集市跟底層的數據倉庫有了區分
然后是數據的查詢和分析,有時基于既定的模型的OLAP無法滿足分析的需求,所以就有了數據查詢的需求,一般直接查詢數據倉庫的細節數據;BI中的Ad-hoc Query則是對既定多維模型的靈活查詢,可以自由組合維度和度量
最后是報表的發布和數據預警,這都是屬于BI平臺的推送功能,一般可以通過郵件訂閱的形式定期把組合的報表推送給相關的人員,而通過預警的設定,可以監控數據的變化趨勢,掌握數據可能出現的異常
另外BI還有很多新奇的功能,如基于GIS的地圖數據、基于Flash實現的動態圖表及對數據挖掘功能的集成等
Q4、BI中的多維數據模型和OLAP的實用價值在哪?(知乎)
之前有關于多維數據模型和OLAP的介紹,可以參考數據倉庫的多維數據模型和數據立方體與OLAP這兩篇文章中的內容
其實多維數據模型和OLAP最主要的是解決了如何有效地觀察數據的問題,傳統關系模型很難直接對數據進行觀察分析,而多維模型為數據觀察者提供了清晰的視角,就如平常我們從多個角度看待事物一樣,多維模型維度的設計就很好地提供了這些角度的選擇而OLAP的幾個操作形式正是體現了“分析”這個詞本身的含義,從總體到細節,結合多個維度的交叉分析,讓我們具備了對整個數據集進行全景觀測的能力
OLAP最關鍵的技術除了多維模型設計還有就是預計算(Precomputation),或者叫預聚合,預計算解決了數據快速獲取的問題,基于一定的規則或者算法對數據集進行預計算之后,OLAP的操作性能可能得到有效地提升,從而使對大量數據的快速靈活的分析操作成為可能
Q5、目前市場上主流的BI產品主要有哪些?(知乎)
市場上主要的商業BI產品包括IBM的Cognos,另外IBM有自己的DB2可以建立數據倉庫,在2010年收購SPSS之后,讓其在數據分析和數據挖掘的領域也更加具有競爭力、SAP的Business Objects(BO),另外SAP有BW(Business Information Warehouse),作為傳統的ERP方案提供商在數據集成方面有獨特的優勢、Oracle的BI(企業級的叫BIEE,Oracle Business Intelligence Enterprise Edition),Oracle借助其強大的關系型數據庫建立數據倉庫有獨特的優勢
這3大商業BI都屬于整合型的BI,再加上微軟借助Sql Server數據庫提供的SSIS、SSAS和SSRS也是屬于整合型的BI解決方案另外也有獨立的BI公司,如SAS,傳統優勢在數據挖掘領域、Micro Strategy的BI解決方案、開源強大的BI系統Pentaho(之前幾年還有很多開源的BI系統,但因為BI在技術上有一定的門檻和成本,所以目前很多開源BI 都會包括開源版本和商業版本,Pentaho也不例外),國內也有用友的BQ軟件也是屬于BI產品
歸納一下就是目前的BI產品主要以商業產品為主,而且整套的BI產品一般都是重量級的,在購買、部署和使用上都需要一定的成本投入
文章來源:網站數據分析,轉載請注明出處
文章編輯: 365webcall網頁客服系統(www.365webcall.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 | ![]() |