新聞中心

EEPW首頁(yè) > 手機(jī)與無(wú)線通信 > 設(shè)計(jì)應(yīng)用 > 數(shù)據(jù)倉(cāng)庫(kù)在移動(dòng)通信企業(yè)經(jīng)營(yíng)分析系統(tǒng)中的應(yīng)用

數(shù)據(jù)倉(cāng)庫(kù)在移動(dòng)通信企業(yè)經(jīng)營(yíng)分析系統(tǒng)中的應(yīng)用

作者: 時(shí)間:2009-08-28 來(lái)源:網(wǎng)絡(luò) 收藏

通信業(yè)是典型的密集型行業(yè),隨著通信體制改革的深化,通信業(yè)的競(jìng)爭(zhēng)也日趨激烈。與其他行業(yè)相比,通信行業(yè)擁有更多的有關(guān)用戶的。誰(shuí)能正確地這些所得到有用的信息,誰(shuí)就能更好地向用戶提供服務(wù),也就能夠發(fā)現(xiàn)更多的商機(jī),從而在競(jìng)爭(zhēng)中獲勝。數(shù)據(jù)可以將移動(dòng)的這些數(shù)據(jù)變?yōu)橛杏玫男畔?lái)支持決策,因此,數(shù)據(jù)在移動(dòng)通信業(yè)中有重要的價(jià)值。

本文引用地址:http://butianyuan.cn/article/157869.htm

現(xiàn)在絕大多數(shù)的企業(yè)都在走信息化這條路,但光有綜合業(yè)務(wù)自動(dòng)化或者決策支持卻沒(méi)有完善的數(shù)據(jù)支持都屬于粗放型,只算是達(dá)到了企業(yè)分析的自動(dòng)化,還不能算是經(jīng)營(yíng)分析信息化??梢酝ㄟ^(guò)移動(dòng)通信業(yè)邏輯數(shù)據(jù)模型,建立一個(gè)集中的、一致的和可擴(kuò)展的數(shù)據(jù),以保證移動(dòng)運(yùn)用先進(jìn)的經(jīng)營(yíng)分析系統(tǒng)建立戰(zhàn)略性的競(jìng)爭(zhēng)優(yōu)勢(shì)。

1 數(shù)據(jù)倉(cāng)庫(kù)的概念及技術(shù)

1.1 數(shù)據(jù)倉(cāng)庫(kù)的概念

數(shù)據(jù)倉(cāng)庫(kù)之父Bill Inmon對(duì)數(shù)據(jù)倉(cāng)庫(kù)所下的定義是:數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)集合,用以支持管理決策的過(guò)程。這個(gè)定義概括了數(shù)據(jù)倉(cāng)庫(kù)的實(shí)質(zhì)。從存儲(chǔ)方式和技術(shù)方面,數(shù)據(jù)庫(kù)領(lǐng)域著名的學(xué)者韓家煒教授給出另外一個(gè)描述:數(shù)據(jù)倉(cāng)庫(kù)是一種多個(gè)異種數(shù)據(jù)源在單個(gè)站點(diǎn)以統(tǒng)一的模式組織的存儲(chǔ),以支持管理決策??梢?jiàn),數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)支持決策的過(guò)程,它有這樣一些特性:面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的,多個(gè)異種數(shù)據(jù)源在單個(gè)站點(diǎn)以統(tǒng)一的模式組織存儲(chǔ)的。

1.2 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)

1.2.1 數(shù)據(jù)處理

數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)處理(ETL)包括數(shù)據(jù)的抽取、清理、轉(zhuǎn)換與加載。把數(shù)據(jù)從操作型環(huán)境轉(zhuǎn)換到數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的數(shù)據(jù)抽取要實(shí)現(xiàn)技術(shù)上的變化。這種變化不僅指的是一種DBMS的變化,還包含源于操作系統(tǒng)的變化、硬件的變化、數(shù)據(jù)結(jié)構(gòu)的變化。

把數(shù)據(jù)從操作型環(huán)境載入到數(shù)據(jù)倉(cāng)庫(kù)環(huán)境時(shí),如果數(shù)據(jù)以一種非集成狀態(tài)到達(dá)數(shù)據(jù)倉(cāng)庫(kù),它就不能被用來(lái)支持?jǐn)?shù)據(jù)的企業(yè)視圖。數(shù)據(jù)的企業(yè)視圖是體系結(jié)構(gòu)設(shè)計(jì)環(huán)境的本質(zhì)之一。

數(shù)據(jù)并非只是注入數(shù)據(jù)倉(cāng)庫(kù),它在數(shù)據(jù)倉(cāng)庫(kù)中也有自己的生命周期。到了一定時(shí)候,數(shù)據(jù)將從倉(cāng)庫(kù)中清除。數(shù)據(jù)清理問(wèn)題是數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)人員無(wú)法回避的基本設(shè)計(jì)問(wèn)題之一。從某種意義上講,數(shù)據(jù)根本不是從數(shù)據(jù)倉(cāng)庫(kù)中清除,而僅是上升到更高的綜合級(jí)。

1.2.2 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型

一個(gè)企業(yè)數(shù)據(jù)模型建造時(shí)不考慮現(xiàn)存的操作型系統(tǒng)與數(shù)據(jù)倉(cāng)庫(kù)之間的差別,企業(yè)數(shù)據(jù)模型只包含原始數(shù)據(jù)。要建造一個(gè)單獨(dú)的現(xiàn)存數(shù)據(jù)模型,需要從企業(yè)數(shù)據(jù)模型開(kāi)始。當(dāng)企業(yè)數(shù)據(jù)模型用于操作型系統(tǒng)時(shí),幾乎不用做什么改動(dòng)。但是,企業(yè)數(shù)據(jù)模型用到數(shù)據(jù)倉(cāng)庫(kù)中要做相當(dāng)多的改動(dòng)。首先要做的是除去純粹用于操作型環(huán)境的數(shù)據(jù);然后在企業(yè)數(shù)據(jù)模型的鍵碼結(jié)構(gòu)中增加時(shí)間元素;導(dǎo)出數(shù)據(jù)加到企業(yè)數(shù)據(jù)模型中,在那里導(dǎo)出數(shù)據(jù)作為公用并只計(jì)算一次,而不重復(fù)計(jì)算;最后,操作型系統(tǒng)中的數(shù)據(jù)關(guān)系在數(shù)據(jù)倉(cāng)庫(kù)中就轉(zhuǎn)變?yōu)椤叭斯りP(guān)系”。

有3個(gè)層次的數(shù)據(jù)建模:高層建模(ERD,實(shí)體關(guān)系層),中間層建模(DIS,數(shù)據(jù)項(xiàng)集),底層建模(物理層)。

1.2.3 數(shù)據(jù)倉(cāng)庫(kù)的性能特性

確定性能特性是設(shè)計(jì)的重要一步,在數(shù)據(jù)倉(cāng)庫(kù)的情況下,意味著決定數(shù)據(jù)的粒度與分割。

粒度 粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或綜合程度的級(jí)別。在早期建立的操作型系統(tǒng)中,粒度是用于訪問(wèn)授權(quán)的。當(dāng)詳細(xì)的數(shù)據(jù)被更新時(shí),幾乎總是把它存放在最低粒度級(jí)上。但在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,對(duì)粒度不作假設(shè)。在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中粒度之所以是主要的設(shè)計(jì)問(wèn)題,是因?yàn)樗钌钣绊懘娣旁跀?shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量的大小,以及數(shù)據(jù)倉(cāng)庫(kù)所能回答的查詢類型。在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量大小與查詢的詳細(xì)程度之間要作出權(quán)衡。

分割 人們常說(shuō),如果粒度和分割都做得很好的話,數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)和實(shí)現(xiàn)的幾乎所有其他問(wèn)題都容易解決。但是,假如粒度處理不當(dāng)并且分割也沒(méi)有認(rèn)真地設(shè)計(jì)與實(shí)現(xiàn),這將使其他方面的設(shè)計(jì)難以真正實(shí)現(xiàn)。對(duì)當(dāng)前細(xì)節(jié)數(shù)據(jù)進(jìn)行分割的總體目的是把數(shù)據(jù)劃分成小的物理單元。數(shù)據(jù)分割的重要性在于小的物理單元能為操作者和設(shè)計(jì)者在管理數(shù)據(jù)時(shí)提供比對(duì)大的物理單元更大的靈活性。

物理I/O 物理設(shè)計(jì)因素的中心在于物理I/O(輸入/輸出)。對(duì)性能來(lái)說(shuō)I/O事件如此重要是因?yàn)榇鎯?chǔ)器和計(jì)算機(jī)之間的數(shù)據(jù)傳輸速度比計(jì)算機(jī)運(yùn)算速度要慢大約2~3個(gè)數(shù)量級(jí)。計(jì)算機(jī)內(nèi)部運(yùn)算速度以毫微秒計(jì),而數(shù)據(jù)的傳輸速度是以毫秒計(jì)。因此,物理I/O是主要影響性能的因素。為了提升性能,應(yīng)在系統(tǒng)中盡量減少物理I/O。


上一頁(yè) 1 2 3 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉