新聞中心

EEPW首頁 > 手機與無線通信 > 設(shè)計應(yīng)用 > 數(shù)據(jù)倉庫在移動通信企業(yè)經(jīng)營分析系統(tǒng)中的應(yīng)用

數(shù)據(jù)倉庫在移動通信企業(yè)經(jīng)營分析系統(tǒng)中的應(yīng)用

作者: 時間:2009-08-28 來源:網(wǎng)絡(luò) 收藏

1.2.4 樣本

樣本庫是的一種有趣的、混雜的形式,它只是真實檔案數(shù)據(jù)或輕度綜合數(shù)據(jù)的子集。術(shù)語“樣本”源于它是更大數(shù)據(jù)庫的子集(即樣本)這一事實,并需要進行定期刷新。

1.2.5 數(shù)據(jù)中的數(shù)據(jù)組織

數(shù)據(jù)中最簡單最常用的數(shù)據(jù)組織形式也許是簡單堆積結(jié)構(gòu),從操作型環(huán)境中取出每天的事務(wù)處理,然后綜合成數(shù)據(jù)倉庫記錄,這個綜合可根據(jù)顧客、帳戶或者任何組織到數(shù)據(jù)倉庫的主題領(lǐng)域來進行。這里的事務(wù)處理是以天來進行綜合。數(shù)據(jù)通過與前面相同的處理方法從操作型環(huán)境輸入到數(shù)據(jù)倉庫環(huán)境中。只是在輪轉(zhuǎn)綜合文件中的數(shù)據(jù)才被輸入到不同的結(jié)構(gòu)形式中。第一周的7天中的活動被逐一綜合到7個每日相應(yīng)的位置,到第八天,將7個每日位置的數(shù)據(jù)加到一起,并放人第一周的數(shù)據(jù)位置中。然后,第八天的每日總計加到第一個每日數(shù)據(jù)位置。

1.2.6 元數(shù)據(jù)

數(shù)據(jù)倉庫環(huán)境中一個重要方面是元數(shù)據(jù)。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。只要有程序和數(shù)據(jù),元數(shù)據(jù)就是信息處理環(huán)境的一部分。但是在數(shù)據(jù)倉庫中,元數(shù)據(jù)扮演一個新的重要角色。也正因為有了元數(shù)據(jù),可以最有效地利用數(shù)據(jù)倉庫。元數(shù)據(jù)使得最終用戶/DSS員能夠探索各種可能性。元數(shù)據(jù)在數(shù)據(jù)倉庫的上層,并且記錄數(shù)據(jù)倉庫中對象的位置。

1.2.7 數(shù)據(jù)索引與監(jiān)視

數(shù)據(jù)倉庫的靈魂就在于靈活性和對數(shù)據(jù)的不可預(yù)測的訪問。數(shù)據(jù)倉庫中的數(shù)據(jù)如果不能方便和有效地檢索,那么建立數(shù)據(jù)倉庫這項工作就不成功。當(dāng)然,設(shè)計者可以利用許多方法來使數(shù)據(jù)盡可能的靈活,例如利用雙重粒度級和數(shù)據(jù)分割。但這些技術(shù)一定要支持方便的索引,如二級索引、稀疏索引、動態(tài)索引、臨時索引等。而且建立和索引的費用不能太高。同時數(shù)據(jù)倉庫中的數(shù)據(jù)也應(yīng)能隨意地被監(jiān)視,監(jiān)視數(shù)據(jù)的費用也不能太高,過程不能太復(fù)雜,監(jiān)視程序在需要時應(yīng)能隨時運行。

1.2.8 數(shù)據(jù)周期

所謂數(shù)據(jù)周期是指從操作型環(huán)境數(shù)據(jù)發(fā)生改變起,到這個變化反映到數(shù)據(jù)倉庫中所用的時間。原則上從操作型環(huán)境知道數(shù)據(jù)的改變到這個變化反映到數(shù)據(jù)倉庫中至少應(yīng)該經(jīng)歷24 h。沒有必要急于把這個變化轉(zhuǎn)入信息倉庫中去,原因在于如果操作型環(huán)境與數(shù)據(jù)倉庫相互之間結(jié)合得越緊密,那么所需的費用就越昂貴,技術(shù)也越復(fù)雜。24 h的時間間隔以現(xiàn)有技術(shù)來說將很容易被實現(xiàn)。更有說服力的一個原因是,時間間隔給環(huán)境附加了一個特殊的限制。間隔24 h,使得在數(shù)據(jù)倉庫中不必做操作型處理;在操作型環(huán)境中不必做數(shù)據(jù)倉庫處理。時間間隔的另一個好處是在轉(zhuǎn)入數(shù)據(jù)倉庫之前,數(shù)據(jù)能達到穩(wěn)定。

1.2.9 數(shù)據(jù)

數(shù)據(jù)技術(shù)是指一種能夠在數(shù)據(jù)倉庫基礎(chǔ)之上,進行業(yè)務(wù)分析的數(shù)學(xué)方法。在現(xiàn)階段主要包括OLAP技術(shù)、數(shù)據(jù)挖掘技術(shù)、統(tǒng)計分析技術(shù)、聯(lián)機挖掘等內(nèi)容。

OLAP技術(shù)也叫聯(lián)機分析處理。是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉(zhuǎn)化出來的、能夠真正為用戶所理解、并真實反映企業(yè)維特性的信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更加深入了解的一類軟件技術(shù)。

OLAP技術(shù)的技術(shù)核心就是維。如地理維、時間維等。維也可以分層次的。例如時間維可以向下分成日期、月份、季節(jié)、年等不同的層次;地理維可以向下劃分為區(qū)、省、市、縣、鄉(xiāng)等層次。
2 數(shù)據(jù)處理方案的選擇

對于而言,數(shù)據(jù)倉庫的實施是對分析管理的一次提升,因此要謹慎地選擇適合需要的數(shù)據(jù)倉庫數(shù)據(jù)處理與分析產(chǎn)品。目前主流數(shù)據(jù)倉庫的數(shù)據(jù)處理專業(yè)工具有:CA,NCR,IBM,Informix(IBM),Oracle和SAS。

經(jīng)過采樣測試和對用戶的調(diào)查,SAS效率較其他工具高,ETL的效果較好,適合分析領(lǐng)域的數(shù)據(jù)處理。在國際學(xué)術(shù)界有條不成文的規(guī)定:凡是SAS統(tǒng)計分析的結(jié)果,可以不說明算法。通過對SAS 8.0的使用,發(fā)現(xiàn)SAS的人機對話界面很友好,既可以通過編程進行數(shù)據(jù)的處理,也可以通過在對話框選擇命令來間接得到數(shù)據(jù)處理代碼。但SAS數(shù)據(jù)處理的劣勢是它的數(shù)據(jù)倉庫是一種比較落后的數(shù)據(jù)集模式。

由于SAS數(shù)據(jù)處理的效率性能和相關(guān)功能及對分析的針對性都優(yōu)于其他專業(yè)工具。最終決定選擇SAS作為數(shù)據(jù)處理的工具,為彌補SAS數(shù)據(jù)庫技術(shù)的落后,數(shù)據(jù)倉庫的存儲還是采用最流行的Oracle。

3 數(shù)據(jù)分析方案的選擇

市場上流行的主要有Cognos,Business Objects,Brio等數(shù)據(jù)倉庫前端分析工具。對于經(jīng)營分析,除了要有基本的旋轉(zhuǎn)、切片、鉆取功能等OLAP功能以外,關(guān)鍵是有功能強大完整的Web端。Brio可以支持Web/Intranet環(huán)境,并且報表生成速度快,支持多種數(shù)據(jù)導(dǎo)出格式,如excel,pdf,txt,html,csv等。其離線分析方式也保證了經(jīng)營分析的性能不會受到用戶的增加而減弱。Brio在這些方面比較合適企業(yè)經(jīng)營分析的要求,所以我們選擇Brio作為移動經(jīng)營分析系統(tǒng)的數(shù)據(jù)分析工具。



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉