當前位置:首頁 » 網頁前端 » 前端開發和bi開發
擴展閱讀
結構體數組存儲學生學號 2022-08-13 01:19:42
航天信息a6顯示腳本錯誤 2022-08-13 01:18:15

前端開發和bi開發

發布時間: 2022-08-06 10:57:34

㈠ #bi開發工程師#Bi行業發展前景感覺技術要求不高,不知道怎麼走

bi技術要求不高😓,大數據的半壁江山就是bi,前景相當高,它是給企業得出發展策略的行業,與產品業務結合緊密!可以干產品方面的工作或者干運營方面的工作,如果特別能吃苦,那就干技術方面的吧! 來自職Q用戶:李先生
你具體是做BI哪方面?從技術上來講,BI是一個從後端到前端,從數據倉庫到動態web頁面設計都需要了解甚至深入的行業。從非技術角度看,必須熟知業務與公司戰略之間關系,分析業務數據,並運用統計分析方法給出有價值的洞見供決策者參考。後者也需要掌握基本的數據抽取和分析技術,熟悉常用的分析軟體(如,spss, sas, matlab等,很多,這里不具體展開)。
那麼,問題來了,你所說的BI開發工程師,聽著是偏技術的,技術要求不高不知道怎麼理解?你是負責過數據倉庫項目,處理過億萬級數據量的報表開發需求,還是設計過高並發、高柔性的BI數據後台架構?又或者參與開發可訂制化的商務儀表盤BI web應用?如果只是應用Excel, tableau, power BI這些工具做過一些報表,由此得出題中感覺,那應該是對BI的范疇還不甚了解吧! 來自職Q用戶:計先生

㈡ BI工程師是做什麽的

BI工程師:主要是報表開發,需要有一定的資料庫經驗,掌握SQL查詢優化方法,精通Oracle、SQL Server、MySQL等主流資料庫的應用設計、性能調優及存儲過程的開發。掌握BI相關工具,如ETL工具(如SSIS)、OLAP工具(如SSAS)和前端展示工具。熟悉ETL邏輯、OLAP設計和數據挖掘相關演算法。

BI工程師與資料庫管理員的工作內容不同,前者是負責開發工作,後者是從事管理和維護資料庫管理系統(DBMS)的相關工作。

資料庫管理員(Database Administrator,簡稱DBA),是從事管理和維護資料庫管理系統(DBMS)的相關工作人員的統稱,屬於運維工程師的一個分支,主要負責業務資料庫從設計、測試到部署交付的全生命周期管理。

DBA的核心目標是保證資料庫管理系統的穩定性、安全性、完整性和高性能。

在國外,也有公司把DBA稱作資料庫工程師(Database Engineer),兩者的工作內容基本相同,都是保證資料庫服務7*24小時的穩定高效運轉,但是需要區分一下DBA和資料庫開發工程師(Database Developer):

1) 資料庫開發工程師的主要職責是設計和開發資料庫管理系統和資料庫應用軟體系統,側重於軟體研發;

2) DBA的主要職責是運維和管理資料庫管理系統,側重於運維管理。

拓展資料:

數學與應用數學專業培養掌握數學科學的基本理論與基本方法,具備運用數學知識、使用計算機解決實際問題的能力,受到科學研究的初步訓練,能在科技、教育和經濟部門從事研究、教學工作或在生產經營及管理部門從事實際應用、開發研究和管理工作的高級專門人才。

數學與應用數學專業屬於基礎專業。無論是進行科研數據分析、軟體開發,還是從事金融保險,國際經濟與貿易、化工制葯、通訊工程、建築設計等,都離不開相關的數學知識。可見數學與應用數學專業是從事其他相關專業的基礎。隨著科技事業的發展和普及,數學專業與其他相關專業的聯系將會更加緊密,數學知識將會得到更廣泛的應用。

㈢ 求助,Bi前端到底做的是什麼

資料庫管理員(簡稱DBA),是一個負責管理和維護資料庫伺服器的人。資料庫管理員負責全面管理和控制資料庫系統。 BI工程師需要有一定的資料庫經驗,掌握SQL查詢優化方法,精通Oracle、SQL Server、MySQL等主流資料庫的應用設計、性能調優及存儲...

㈣ bi工程師是做什麼的

bi工程師是做報表開發的,需要有一定的資料庫經驗,掌握SQL查詢優化方法,精通Oracle、SQL Server、MySQL等主流資料庫的應用設計、性能調優及存儲過程的開發。掌握BI相關工具,如ETL工具(如SSIS)、OLAP工具(如SSAS)和前端展示工具。熟悉ETL邏輯、OLAP設計和數據挖掘相關演算法。

bi工程師必備知識:

1、有數學和統計學、計算機方面相關的基礎。

2、會數據整理及分析。

3、對數據敏感,思維活躍、邏輯性強。

4、學習掌握各種行業知識,了解數據分析需求。

5、帶領團隊實施分析方案,並對成果進行檢驗和評價。

㈤ BI開發的基本步驟是什麼

專門用來支持初級用戶的原始數據訪問,不包括適用於專業人士的成品報告生成工具 2.OLAP工具。提供多維數據管理環境,其典型的應用是對商業問題的建模與商業數據分析。OLAP也被稱為多維分析 3.數據挖掘(Data Mining)軟體。使用諸如神經網路、規則歸納等技術,用來發現數據之間的關系,做出基於數據的推斷。 4.數據集市(Data Mart)和數據倉庫(Data Warehouse)產品。包括數據轉換、管理和存取等方面的預配置軟體,通常還包括一些業務模型,如財務分析模型。 5.主管信息系統(EIS,Executive Information System) 這個定義應該是比較學術了,客戶多半不明白。 其實BI通俗來講就是收集相關信息並加以分析,以幫助您做決策。成功的BI系統多採用了數據倉庫技術。 然後,再看看數據倉庫是什麼: 數據倉庫數據倉庫是在企業管理和決策中面向主題的、集成的、與時間相關的、不可修改的數據集合 數據倉庫,英文名稱為Data Warehouse,可簡寫為DW。 數據倉庫之父Bill Inmon在1991年出版的「Building the Data Warehouse」一書中所提出的定義被廣泛接受——數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策(Decision Making Support)。 ◆面向主題:操作型資料庫的數據組織面向事務處理任務,各個業務系統之間各自分離,而數據倉庫中的數據是按照一定的主題域進行組織的。 ◆集成的:數據倉庫中的數據是在對原有分散的資料庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關於整個企業的一致的全局信息。 ◆相對穩定的:數據倉庫的數據主要供企業決策分析之用,所涉及的數據操作主要是數據查詢,一旦某個數據進入數據倉庫以後,一般情況下將被長期保留,也就是數據倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、刷新。 ◆反映歷史變化:數據倉庫中的數據通常包含歷史信息,系統記錄了企業從過去某一時點(如開始應用數據倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。 數據倉庫是一個過程而不是一個項目。 數據倉庫系統是一個信息提供平台,他從業務處理系統獲得數據,主要以星型模型和雪花模型進行數據組織,並為用戶提供各種手段從數據中獲取信息和知識。 從功能結構化分,數據倉庫系統至少應該包含數據獲取(Data Acquisition)、數據存儲(Data Storage)、數據訪問(Data Access)三個關鍵部分。 什麼是數據倉庫 目前,數據倉庫一詞尚沒有一個統一的定義,著名的數據倉庫專家W.H.Inmon在其著作《Building the Data Warehouse》一書中給予如下描述:數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策。對於數據倉庫的概念我們可以從兩個層次予以理解,首先,數據倉庫用於支持決策,面向分析型數據處理,它不同於企業現有的操作型資料庫;其次,數據倉庫是對多個異構的數據源有效集成,集成後按照主題進行了重組,並包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。 根據數據倉庫概念的含義,數據倉庫擁有以下四個特點: 1、面向主題。操作型資料庫的數據組織面向事務處理任務,各個業務系統之間各自分離,而數據倉庫中的數據是按照一定的主題域進行組織。主題是一個抽象的概念,是指用戶使用數據倉庫進行決策時所關心的重點方面,一個主題通常與多個操作型信息系統相關。 2、集成的。面向事務處理的操作型資料庫通常與某些特定的應用相關,資料庫之間相互獨立,並且往往是異構的。而數據倉庫中的數據是在對原有分散的資料庫數據抽取、清理的基礎上經過系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關於整個企業的一致的全局信息。 3、相對穩定的。操作型資料庫中的數據通常實時更新,數據根據需要及時發生變化。數據倉庫的數據主要供企業決策分析之用,所涉及的數據操作主要是數據查詢,一旦某個數據進入數據倉庫以後,一般情況下將被長期保留,也就是數據倉庫中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的載入、刷新。 4、反映歷史變化。操作型資料庫主要關心當前某一個時間段內的數據,而數據倉庫中的數據通常包含歷史信息,系統記錄了企業從過去某一時點(如開始應用數據倉庫的時點)到目前的各個階段的信息,通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。 企業數據倉庫的建設,是以現有企業業務系統和大量業務數據的積累為基礎。數據倉庫不是靜態的概念,只有把信息及時交給需要這些信息的使用者,供他們做出改善其業務經營的決策,信息才能發揮作用,信息才有意義。而把信息加以整理歸納和重組,並及時提供給相應的管理決策人員,是數據倉庫的根本任務。因此,從產業界的角度看,數據倉庫建設是一個工程,是一個過程。 整個數據倉庫系統是一個包含四個層次的體系結構,具體由下圖表示。 數據倉庫系統體系結構 ·數據源:是數據倉庫系統的基礎,是整個系統的數據源泉。通常包括企業內部信息和外部信息。內部信息包括存放於RDBMS中的各種業務處理數據和各類文檔數據。外部信息包括各類法律法規、市場信息和競爭對手的信息等等; ·數據的存儲與管理:是整個數據倉庫系統的核心。數據倉庫的真正關鍵是數據的存儲和管理。數據倉庫的組織管理方式決定了它有別於傳統資料庫,同時也決定了其對外部數據的表現形式。要決定採用什麼產品和技術來建立數據倉庫的核心,則需要從數據倉庫的技術特點著手分析。針對現有各業務系統的數據,進行抽取、清理,並有效集成,按照主題進行組織。數據倉庫按照數據的覆蓋范圍可以分為企業級數據倉庫和部門級數據倉庫(通常稱為數據集市)。 ·OLAP伺服器:對分析需要的數據進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,並發現趨勢。其具體實現可以分為:ROLAP、MOLAP和HOLAP。ROLAP基本數據和聚合數據均存放在RDBMS之中;MOLAP基本數據和聚合數據均存放於多維資料庫中;HOLAP基本數據存放於RDBMS之中,聚合數據存放於多維資料庫中。 ·前端工具:主要包括各種報表工具、查詢工具、數據分析工具、數據挖掘工具以數據挖掘及各種基於數據倉庫或數據集市的應用開發工具。其中數據分析工具主要針對OLAP伺服器,報表工具、數據挖掘工具主要針對數據倉庫。 目前,數據倉庫一詞尚沒有一個統一的定義,著名的數據倉庫專家W.H.Inmon在其著作《Building the Data Warehouse》一書中給予如下描述:數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策。對於數據倉庫的概念我們可以從兩個層次予以理解,首先,數據倉庫用於支持決策,面向分析型數據處理,它不同於企業現有的操作型資料庫;其次,數據倉庫是對多個異構的數據源有效集成,集成後按照主題進行了重組,並包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。多維 數據倉庫的組成 數據倉庫資料庫 是整個數據倉庫環境的核心,是數據存放的地方和提供對數據檢索的支持。相對於操縱型資料庫來說其突出的特點是對海量數據的支持和快速的檢索技術。 數據抽取工具 把數據從各種各樣的存儲方式中拿出來,進行必要的轉化、整理,再存放到數據倉庫內。對各種不同數據存儲方式的訪問能力是數據抽取工具的關鍵,應能生成COBOL程序、MVS作業控制語言(JCL)、UNIX腳本、和SQL語句等,以訪問不同的數據。數據轉換都包括,刪除對決策應用沒有意義的數據段;轉換到統一的數據名稱和定義;計算統計和衍生數據;給缺值數據賦給預設值;把不同的數據定義方式統一。 元數據 元數據是描述數據倉庫內數據的結構和建立方法的數據。可將其按用途的不同分為兩類,技術元數據和商業元數據。 技術元數據是數據倉庫的設計和管理人員用於開發和日常管理數據倉庫是用的數據。包括:數據源信息;數據轉換的描述;數據倉庫內對象和數據結構的定義;數據清理和數據更新時用的規則;源數據到目的數據的映射;用戶訪問許可權,數據備份歷史記錄,數據導入歷史記錄,信息發布歷史記錄等。 商業元數據從商業業務的角度描述了數據倉庫中的數據。包括:業務主題的描述,包含的數據、查詢、報表; 元數據為訪問數據倉庫提供了一個信息目錄(informationdirectory),這個目錄全面描述了數據倉庫中都有什麼數據、這些數據怎麼得到的、和怎麼訪問這些數據。是數據倉庫運行和維護的中心,數據倉庫伺服器利用他來存貯和更新數據,用戶通過他來了解和訪問數據。 訪問工具 為用戶訪問數據倉庫提供手段。有數據查詢和報表工具;應用開發工具;管理信息系統(EIS)工具;在線分析(OLAP)工具;數據挖掘工具。 數據集市(DataMarts) 為了特定的應用目的或應用范圍,而從數據倉庫中獨立出來的一部分數據,也可稱為部門數據或主題數據(subjectarea)。在數據倉庫的實施過程中往往可以從一個部門的數據集市著手,以後再用幾個數據集市組成一個完整的數據倉庫。需要注意的就是再實施不同的數據集市時,同一含義的欄位定義一定要相容,這樣再以後實施數據倉庫時才不會造成大麻煩。 數據倉庫管理:安全和特權管理;跟蹤數據的更新;數據質量檢查;管理和更新元數據;審計和報告數據倉庫的使用和狀態;刪除數據;復制、分割和分發數據;備份和恢復;存儲管理。 信息發布系統:把數據倉庫中的數據或其他相關的數據發送給不同的地點或用戶。基於Web的信息發布系統是對付多用戶訪問的最有效方法。 設計數據倉庫的九個步驟 1)選擇合適的主題(所要解決問題的領域) 2)明確定義fact表 3)確定和確認維 4)choosingthefacts 5)計算並存儲fact表中的衍生數據段 6)roundingoutthedimensiontables 7) 8) 9)確定查詢優先順序和查詢模式。 技術上 硬體平台:數據倉庫的硬碟容量通常要是操作資料庫硬碟容量的2-3倍。通常大型機具有更可靠的性能和和穩定性,也容易與歷史遺留的系統結合在一起;而PC伺服器或UNIX伺服器更加靈活,容易操作和提供動態生成查詢請求進行查詢的能力。選擇硬體平台時要考慮的問題:是否提供並行的I/O吞吐?對多CPU的支持能力如何? 數據倉庫DBMS:他的存儲大數據量的能力、查詢的性能、和對並行處理的支持如何。 網路結構:數據倉庫的實施在那部分網路段上會產生大量的數據通信,需不需要對網路結構進行改進。 實現上 建立數據倉庫的步驟 1)收集和分析業務需求 2)建立數據模型和數據倉庫的物理設計 3)定義數據源 4)選擇數據倉庫技術和平台 5)從操作型資料庫中抽取、凈化、和轉換數據到數據倉庫 6)選擇訪問和報表工具 7)選擇資料庫連接軟體 8)選擇數據分析和數據展示軟體 9)更新數據倉庫 數據抽取、清理、轉換、和移植 1)數據轉換工具要能從各種不同的數據源中讀取數據。 2)支持平面文件、索引文件、和legacyDBMS。 3)能以不同類型數據源為輸入整合數據。 4)具有規范的數據訪問介面 5)最好具有從數據字典中讀取數據的能力 6)工具生成的代碼必須是在開發環境中可維護的 7)能只抽取滿足指定條件的數據,和源數據的指定部分 8)能在抽取中進行數據類型轉換和字元集轉換 9)能在抽取的過程中計算生成衍生欄位 10)能讓數據倉庫管理系統自動調用以定期進行數據抽取工作,或能將結果生成平面文件 11)必須對軟體供應商的生命力和產品支持能力進行仔細評估 主要數據抽取工具供應商:Prismsolutions.Carleton'sPASSPORT.InformationBuildersInc.'s EDA/SQL.SASInstituteInc. 數據倉庫帶來了什麼 每一家公司都有自己的數據。並且,許多公司在計算機系統中儲存有大量的數據,記錄著企業購買、銷售、生產過程中的大量信息和客戶的信息。通常這些數據都儲存在許多不同的地方。 使用數據倉庫之後,企業將所有收集來的信息存放在一個唯一的地方——數據倉庫。倉庫中的數據按照一定的方式組織,從而使得信息容易存取並且有使用價值。 目前,已經開發出一些專門的軟體工具,使數據倉庫的過程實現可以半自動化,幫助企業將數據倒入數據倉庫,並使用那些已經存入倉庫的數據。 數據倉庫給組織帶來了巨大的變化。數據倉庫的建立給企業帶來了一些新的工作流程,其他的流程也因此而改變。 數據倉庫為企業帶來了一些「以數據為基礎的知識」,它們主要應用於對市場戰略的評價,和為企業發現新的市場商機,同時,也用來控制庫存、檢查生產方法和定義客戶群。 每一家公司都有自己的數據。數據倉庫將企業的數據按照特定的方式組織,從而產生新的商業知識,並為企業的運作帶來新的視角。 為何要建立數據倉庫 計算機發展的早期,人們已經提出了建立數據倉庫的構想。「數據倉庫」一詞最早是在1900年,由Bill Inmon先生提出的,其描述如下:數據倉庫是為支持企業決策而特別設計和建立的數據集合。 企業建立數據倉庫是為了填補現有數據存儲形式已經不能滿足信息分析的需要。數據倉庫理論中的一個核心理念就是:事務型數據和決策支持型數據的處理性能不同。 企業在它們的事務操作收集數據。在企業運作過程中:隨著定貨、銷售記錄的進行,這些事務型數據也連續的產生。為了引入數據,我們必須優化事務型資料庫。 處理決策支持型數據時,一些問題經常會被提出:哪類客戶會購買哪類產品?促銷後銷售額會變化多少?價格變化後或者商店地址變化後銷售額又會變化多少呢?在某一段時間內,相對其他產品來說哪類產品特別容易賣呢?哪些客戶增加了他們的購買額?哪些客戶又削減了他們的購買額呢? 事務型資料庫可以為這些問題作出解答,但是它所給出的答案往往並不能讓人十分滿意。在運用有限的計算機資源時常常存在著競爭。在增加新信息的時候我們需要事務型資料庫是空閑的。而在解答一系列具體的有關信息分析的問題的時候,系統處理新數據的有效性又會被大大降低。另一個問題就在於事務型數據總是在動態的變化之中的。決策支持型處理需要相對穩定的數據,從而問題都能得到一致連續的解答。 數據倉庫的解決方法包括:將決策支持型數據處理從事務型數據處理中分離出來。數據按照一定的周期(通常在每晚或者每周末),從事務型資料庫中導入決策支持型資料庫——既「數據倉庫」。數據倉庫是按回答企業某方面的問題來分「主題」組織數據的,這是最有效的數據組織方式。 數據倉庫和數據集市 有關決策支持型資料庫的數據集市是面向企業中的某個部門或是項目小組的。一些專家顧問將數據集市的建造描述為建立數據倉庫全過程中的一步。首先,一個儲存企業全部信息的數據倉庫被創建,其中,數據均具備有組織的、一致的、不變的格式。數據集市隨後被創立,其目的是為不同部門提供他們所需要的那部分信息。數據倉庫聚集了所有詳細的信息,而數據集市中的數據則是針對用戶們的特定需求總結而出的。 而另外一些專家則認為數據集市的建立並不需要首先建立一個數據倉庫。在這個模型中,數據直接由事務型資料庫轉入數據集市中。一個公司可能建立有多個數據集市,而彼此之間毫無聯系。 這種不在建立數據倉庫的基礎上創建數據集市的方式會更便宜、更快速,因為它的規模更加易於管理。 第二種觀點的缺陷在於無法實現最初創建數據倉庫的最主要的目的——將企業所有的數據統一為一致的格式。現有的事務處理系統的數據往往是不一致、冗餘的。

㈥ 各位大神這種bi數據分析系統web前端怎麼做

——BI系統,又稱商業智能系統。所謂智能就是說它可以根據數據分析為你提供支持決策的信息。哪些我說不上來,我只用過帆軟的finebi,去年部署的,大大提高了效率。

㈦ BI工程師是干什麼的

BI工程師主要是是做商業智能分析,對Sap的企業管理數據做分析,為領導決策,做預算,做企業戰略分析用的工具等。

商業智能作為一個工具,是用來處理企業中現有數據,並將其轉換成知識、分析和結論,輔助業務或者決策者做出正確且明智的決定。是幫助企業更好地利用數據提高決策質量的技術,包含了從數據倉庫到分析型系統等。

(7)前端開發和bi開發擴展閱讀:

能夠滿足用戶需要的BI產品和方案必須建立在穩定、整合的平台之上,該平台需要提供用戶管理、安全性控制、連接數據源以及訪問、分析和共享信息的功能。BI平台的標准化也非常重要,因為這關繫到與企業多種應用系統的兼容問題,解決不了兼容問題,BI系統就不能發揮出應有效果。

這里我們通過對一個實驗室的BI系統模型(我們將其稱為D系統)進行功能解剖,來介紹BI系統。D系統是一個面向終端使用者,直接訪問業務數據,能夠使管理者從各個角度出發分析利用商業數據,及時地掌握組織的運營現狀,作出科學的經營決策的系統。

㈧ web前端開發工程師(BI)是做什麼的

首先,先了解一下web
前端開發工程師是什麼。web前端開發工程師,其工作崗位主要職責是利用(X)HTML/CSS/JavaScript/DOM/Flash等各種Web技術進行產品的界面開發。製作標准優化的代碼,並增加交互動態功能,同時結合後台開發技術模擬整體效果,進行豐富互聯網的Web開發,致力於通過技術改善用戶體驗,使得web界面可以更加友好的與用戶交互。

其次,我們需要知道Web前端工程師崗位所需要的技術知識庫有哪些。如何為網站上提供的產品和服務實現一流的Web界面,優化代碼並保持良好兼容性、懂得Web前端表現層及與前後端交互的架構設計和開發、JavaScript程序模塊開發,通用類庫、框架編寫以及利用各種Web技術模擬開發產品原型和配合後台開發人員實現產品界面和功能、Web新技術調研和資訊整理。

除此之外,還需要精通HTML/XHTML、CSS,熟悉頁面架構和布局,精通Ajax、JavaScript、DOM等前端技術,掌握面向對象編程思想。並且熟悉一種以上後台開發語言(如PHP/Java以及一種資料庫(如MySQL/Oracle)。

綜上所述,web前端工程師是具備產品的界面開發、製作標准優化代碼、懂增加交互動態功能、與後端工作人員做哈哈工作協調的技術管理人員。

㈨ BI,數據倉庫,ETL,大數據開發工程師有什麼區別

准確的來說,商業智能BI不僅僅包含前端可視化分析、報表展現的能力,更包含了底層數據倉庫的建設過程。

Gartner 在上世紀九十年代就已經提到了商業智能 Business Intelligence,它更多的認為BI是一種數據類的技術解決方案,將許多來自不同企業業務系統的數據提取有分析價值的數據進行清洗、轉換和載入,就是抽取Extraction、轉換 Transformation、載入Loading 的ETL過程,最終合並到一個數據倉庫中,按照一定的建模方式例如Inmon 的3NF 建模、Kimball 的維度建模或者兩者都有的混合式架構模型,最終在這個基礎上再利用合適的分析展現工具來形成各種可視化的分析報表為企業的管理決策層提供數據決策支撐。

所以,可以從這里能夠看到數據倉庫Data Warehouse 的位置是介於可視化報表和底層業務系統數據源之間的這一層,在整個BI項目解決方案中起到的是一個承上啟下的作用。所以,BI在前端可視化分析層面要玩出各類精彩的動作,沒有數據倉庫這個核心力量的支撐是很難做到的。

很多企業認為只要買一個前端BI分析工具就可以解決企業級的BI所有問題,這個看法實際上也不可行的。可能在最開始分析場景相對簡單,對接數據的復雜度不是很高的情況下這類BI分析工具沒有問題。但是在企業的BI項目建設有一個特點,是一個螺旋式上升的建設過程。因為對接的業務系統可能會越來越多,分析的深度和廣度會越來越多,數據的復雜度也會越來越有挑戰性,這個時候沒有一個很好的數據倉庫架構支撐,光靠前端BI分析工具基本上是無法搞定的。

所以在企業中,我們需要明確我們的BI建設是面向企業級的還是個人和部門的分析工作。如果是個人數據分析師,使用這類前端BI分析工具就足夠了。如果是需要構建一個企業級的BI項目,就不能只關注前端可視化分析能力這個層面,更應該關注到底層數據架構的構建,也就是數據倉庫這個層面。