新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 帶寬 前端總線 QPI總線

帶寬 前端總線 QPI總線

作者: 時間:2016-12-15 來源:網(wǎng)絡(luò) 收藏
帶寬(band width)又叫頻寬,是指在固定的的時間可傳輸?shù)馁Y料數(shù)量,亦即在傳輸管道中可以傳遞數(shù)據(jù)的能力。在數(shù)字設(shè)備中,頻寬通常以bps表示,即每秒可傳輸之位數(shù)。在模擬設(shè)備中,頻寬通常以每秒傳送周期或赫茲 (Hz)來表示。

頻寬對基本輸出入系統(tǒng) (BIOS ) 設(shè)備尤其重要,如快速磁盤驅(qū)動器會受低頻寬的總線所阻礙。
對于帶寬的概念,比較形象的一個比喻是高速公路。單位時間內(nèi)能夠在線路上傳送的數(shù)據(jù)量,常用的單位是bps(bit per second)。計算機網(wǎng)絡(luò)的帶寬是指網(wǎng)絡(luò)可通過的最高數(shù)據(jù)率,即每秒多少比特。
嚴格來說,數(shù)字網(wǎng)絡(luò)的帶寬應(yīng)使用波特率來表示(baud),表示每秒的脈沖數(shù)。而比特是信息單位,由于數(shù)字設(shè)備使用二進制,則每位電平所承載的信息量是1(以2為底2的對數(shù),如果是四進制,則是以2為底的4的對數(shù),每位電平所承載的信息量為2)。因此,在數(shù)值上,波特與比特是相同的。由于人們對這兩個概念分的并不是很清楚,因此常使用比特率來表示速率,也正是用比特的人太多,所以比特率也就成了一個帶寬事實的標準叫法了。
描述帶寬時常常把“比特/秒”省略。
例如,帶寬是10M,實際上是10Mb/s。
這里的M 是10^6。
“帶寬”有以下兩種不同的意義:
1.指信號具有的頻帶寬度。信號的帶寬是指該信號所包含的各種不同頻率成分所占據(jù)的頻率范圍。
2.在計算機網(wǎng)絡(luò)中,帶寬用來表示網(wǎng)絡(luò)的通信線路所能傳送數(shù)據(jù)的能力,因此網(wǎng)絡(luò)帶寬表示在單位時間內(nèi)從網(wǎng)絡(luò)中的某一點到另一點所能通過的“最高數(shù)據(jù)率”。
在網(wǎng)絡(luò)中有兩種不同的速率:
信號(即電磁波)在傳輸媒體上的傳播速率(米/秒,或公里/秒)
計算機向網(wǎng)絡(luò)發(fā)送比特的速率(比特/秒)
這兩種速率的意義和單位完全不同。
在理解帶寬這個概念之前,我們首先來看一個公式:帶寬=時鐘頻率x總線位數(shù)/8,從公式中我們可以看到,帶寬和時鐘頻率、總線位數(shù)是有著非常密切的關(guān)系的。其實在一個計算機系統(tǒng)中,不僅顯示器、內(nèi)存有帶寬的概念,在一塊板卡上,帶寬的概念就更多了,完全可以說是帶寬無處不在。
那到底什么是帶寬呢?帶寬的意義又是什么?簡單的說,帶寬就是傳輸速率,是指每秒鐘傳輸?shù)淖畲笞止?jié)數(shù)(MB/S),即每秒處理多少兆字節(jié),高帶寬則意味著系統(tǒng)的高處理能力。為了更形象地理解帶寬、位寬、時鐘頻率的關(guān)系,我們舉個比較形象的例子,工人加工零件,如果一個人干,在大家單個加工速度相同的情況下,肯定不如兩個人干的多,帶寬就像是加工零件的總數(shù)量,位寬仿佛工人數(shù)量,時鐘工作頻率相當于加工單個零件的速度,位寬越寬,時鐘頻率越高則總線帶寬越大,其好處也是顯而易見的。
主板上通常會有兩塊比較大的芯片,一般將靠近CPU的那塊稱為北橋,遠離CPU的稱為南橋。北橋的作用是在CPU與內(nèi)存、顯卡之間建立通信接口,它們與北橋連接的帶寬大小很大程度上決定著內(nèi)存與顯卡效能的大小。南橋是負責(zé)計算機的I/O設(shè)備、PCI設(shè)備和硬盤,對帶寬的要求,相比較北橋而言,是要小一些的。而南北橋之間的連接帶寬一般就稱為南北橋帶寬。隨著計算機越來越向多媒體方向發(fā)展,南橋的功能也日益強大,對于南北橋間的連接總線帶寬也是提出了新的要求,在INTEL的9X5系列主板上,南北橋的帶寬將從以前一直為人所詬病的266MB/S發(fā)展到空前的2GB/S,一舉解決了南北橋間的帶寬瓶頸。
帶寬是顯示器非常重要的一個參數(shù),能夠決定顯示器性能的好壞。所謂帶寬是顯示器視頻放大器通頻帶寬度的簡稱,一個電路的帶寬實際上是反映該電路對輸入信號的響應(yīng)速度。帶寬越寬,慣性越小,響應(yīng)速度越快,允許通過的信號頻率越高,信號失真越小,它反映了顯示器的解像能力。該數(shù)字越大越好。
帶寬是代表顯示器顯示能力的一個綜合指標,指每秒鐘所掃描的圖素個數(shù),即單位時間內(nèi)每條掃描線上顯示的頻點數(shù)總和,以MHz為單位。帶寬越大表明顯示控制能力越強,顯示效果越佳。
帶寬的詳細計算公式如下:理論上帶寬 B=r(x) ×r(y) ×V
r(x)表示每條水平掃描線上的圖素個數(shù)
r(y)表示每楨畫面的水平掃描線數(shù)
V 表示每秒畫面刷新率(即場頻)
B 表示帶寬
再來說說顯卡,玩游戲的朋友都曉得,當玩一些大制作游戲的時候,畫面有時候會卡的比較厲害。其實這就是顯卡帶寬不足的問題,再具體點說,這是顯存帶寬不足。眾所周知,目前當?shù)赖腁GP接口是AGP 8X,而AGP總線的頻率是PCI總線的兩倍,也就是66MHz,很容易就可以換算出它的帶寬是2.1GB/S,在目前的環(huán)境下,這樣的帶寬就顯得很微不足道了,因為連最普通的ATI R9000的顯存帶寬都要達到400MHZ X 128Bit/8=6.4GB/s,其余的高端顯卡更是不用說了。正因為如此,INTEL在最新的9X5芯片組中,采用了PCI-Express總線來替代老態(tài)龍鐘的AGP總線,與傳統(tǒng)PCI以及更早期的計算機總線的共享并行架構(gòu)相比,PCI Express最大的特點是在設(shè)備間采用點對點串行連接,如此一來即允許每個設(shè)備都有自己的專用連接,不需要向整個總線請求帶寬,同時利用串行的連接特點將能輕松將數(shù)據(jù)傳輸速度提到一個很高的頻率。在傳輸速度上,由于PCI Express支持雙向傳輸模式,因此連接的每個裝置都可以使用最大帶寬。AGP所遇到的帶寬瓶頸也迎刃而解。
為了在實際使用計算機的過程中得到更多總線帶寬,根據(jù)帶寬的計算公式,一般會采取兩種辦法,一是增加總線速度,比如INTEL的P4 CPU和賽揚CPU就是最好的例子,一個是400總線,一個是533/800總線,在實際應(yīng)用的效能就有了很大的區(qū)別(當然,二級緩存也是一個重要的因素)。另外一個常用的方法是增加總線的寬度,如果當它的時鐘速度一樣時,總線的寬度增加一倍,那么盡管時鐘下降沿同未改變之前是相同而此時每次下降沿所傳輸?shù)臄?shù)據(jù)量卻是以前的兩倍,這一點在相同核心,但是顯存位寬卻不一樣的顯卡上表現(xiàn)特別明顯。

本文引用地址:http://butianyuan.cn/article/201612/330170.htm

什么是前端總線:“前端總線”這個名稱是由AMD在推出K7 CPU時提出的概念,但是一直以來都被大家誤認為這個名詞不過是外頻的另一個名稱。我們所說的外頻指的是CPU與主板連接的速度,這個概念是建立在數(shù)字脈沖信號震蕩速度基礎(chǔ)之上的,而前端總線的速度指的是數(shù)據(jù)傳輸?shù)乃俣?,由于?shù)據(jù)傳輸最大帶寬取決于所有同時傳輸?shù)臄?shù)據(jù)的寬度和傳輸頻率,即數(shù)據(jù)帶寬=(總線頻率×數(shù)據(jù)位寬)÷8。目前PC機上所能達到的前端總線頻率有266MHz、333MHz、400MHz、533MHz、800MHz、1066MHz、1333MHz幾種,前端總線頻率越大,代表著CPU與內(nèi)存之間的數(shù)據(jù)傳輸量越大,更能充分發(fā)揮出CPU的功能?,F(xiàn)在的CPU技術(shù)發(fā)展很快,運算速度提高很快,而足夠大的前端總線可以保障有足夠的數(shù)據(jù)供給給CPU。較低的前端總線將無法供給足夠的數(shù)據(jù)給CPU,這樣就限制了CPU性能得發(fā)揮,成為系統(tǒng)瓶頸。

前端總線的英文名字是Front Side Bus,通常用FSB表示,是將CPU連接到北橋芯片的總線。選購主板和CPU時,要注意兩者搭配問題,一般來說,如果CPU不超頻,那么前端總線是由CPU決定的,如果主板不支持CPU所需要的前端總線,系統(tǒng)就無法工作。也就是說,需要主板和CPU都支持某個前端總線,系統(tǒng)才能工作,只不過一個CPU默認的前端總線是唯一的,因此看一個系統(tǒng)的前端總線主要看CPU就可以。

北橋芯片負責(zé)聯(lián)系內(nèi)存、顯卡等數(shù)據(jù)吞吐量最大的部件,并和南橋芯片連接。CPU就是通過前端總線(FSB)連接到北橋芯片,進而通過北橋芯片和內(nèi)存、顯卡交換數(shù)據(jù)。前端總線是CPU和外界交換數(shù)據(jù)的最主要通道,因此前端總線的數(shù)據(jù)傳輸能力對計算機整體性能作用很大,如果沒足夠快的前端總線,再強的CPU也不能明顯提高計算機整體速度。數(shù)據(jù)傳輸最大帶寬取決于所有同時傳輸?shù)臄?shù)據(jù)的寬度和傳輸頻率,即數(shù)據(jù)帶寬=(總線頻率×數(shù)據(jù)位寬)÷8。目前PC機上所能達到的前端總線頻率有266MHz、333MHz、400MHz、533MHz、800MHz幾種,前端總線頻率越大,代表著CPU與北橋芯片之間的數(shù)據(jù)傳輸能力越大,更能充分發(fā)揮出CPU的功能?,F(xiàn)在的CPU技術(shù)發(fā)展很快,運算速度提高很快,而足夠大的前端總線可以保障有足夠的數(shù)據(jù)供給給CPU,較低的前端總線將無法供給足夠的數(shù)據(jù)給CPU,這樣就限制了CPU性能得發(fā)揮,成為系統(tǒng)瓶頸。顯然同等條件下,前端總線越快,系統(tǒng)性能越好。

QPI
intel的全新架構(gòu),Bloomfield將采用全新的LGA 1366 Socket,Package Size為42.5 x 45mm,散熱器設(shè)計雖然和LGA 775類似,但Mounting Holes為80mm,相較LGA775的72mm2更大,因此散熱器不能另相兼容,VRM采用全新的11.1版本,最高TDP為130W 。
利用雙向串聯(lián)點對點傳輸,它可提供與FSB相近的Latency,可讓軟件及操作系統(tǒng)管理,并且針對部份Streams(Threading、ISOC、LT/VT)及out of order requests作出了優(yōu)化,單向最高速度暫 定為6.4GT/s,雙向最高速合共10.8GT/s,相比AMD采用的Hyper-Transport 3.0的速度更高。

Intel的QuickPath Interconnect技術(shù)縮寫為QPI,譯為快速通道互聯(lián)。事實上它的官方名字叫做CSI,Common System Interface公共系統(tǒng)界面,用來實現(xiàn)芯片之間的直接互聯(lián),而不是在通過FSB連接到北橋,矛頭直指AMD的HT總線。無論是速度、帶寬、每個針腳的帶寬、功耗等一切規(guī)格都要超越HT總線。

QPI最大的改進是采用單條點對點模式下,QPI的輸出傳輸能力非常驚人,在4.8至6.4GT/s之間。一個連接的每個方向的位寬可以是5、10、20bit。因此每一個方向的QPI全寬度鏈接可以提供12至16BG/s的帶寬,那么每一個QPI鏈接的帶寬為24至32GB/s。(不過,這仍是遜色于AMD的Hypertransport3---單條連接最大傳輸帶寬可以達到45GB/s,但我們相信未來英特爾仍會對QPI進行進一步提速改進。)在早期的Nehalem處理器中,Intel預(yù)計使用20bit的鏈接位寬,大約能提供25.6GB/s的數(shù)據(jù)傳輸能力。這個數(shù)字是Intel在上一季IDF中公布的。舉例來說,在X48芯片組中,F(xiàn)SB的速度為1600MHz,這是目前為止規(guī)格最高的FSB總線了。不過最初的QPI總線具備25.6GB/s的吞吐量,這個值相當于1600MHz FSB帶寬的2倍。

QPI技術(shù)特點——效率更高

此外,QPI另一個亮點就是支持多條系統(tǒng)總線連接,Intel稱之為multi-FSB。系統(tǒng)總線將會被分成多條連接,并且頻率不再是單一固定的,也無須如以前那樣還要再經(jīng)過FSB進行連接。根據(jù)系統(tǒng)各個子系統(tǒng)對數(shù)據(jù)吞吐量的需求,每條系統(tǒng)總線連接的速度也可不同,這種特性無疑要比AMD目前的Hypertransport總線更具彈性。

例如,針對服務(wù)器的Nehalem處理器將擁有至少4組QPI傳輸,可至少組成包括4枚處理器的4路高端服務(wù)器系統(tǒng)(也就是16枚運算內(nèi)核至少32線程并行運作)。而且在多處理器作業(yè)下,每顆處理器可以互相傳送資料,并不需經(jīng)過芯片組,從而大幅提升整體系統(tǒng)性能。隨著未來Nehalem架構(gòu)的處理器集成內(nèi)存控制器、PCI-E 2.0圖形接口乃至圖形核心,QPI架構(gòu)的優(yōu)勢將進一步發(fā)揮出來。

為了降低QPI總線的延遲,Intel打算在4路處理器以上的系統(tǒng)中使用一種叫做粘貼緩存的技術(shù)。它主要是倚靠更大容量的二級高速緩存來存儲南橋和北橋的數(shù)據(jù),使處理器不必反復(fù)通過QPI總線來讀取南北橋信息。同時,為了更高提升數(shù)據(jù)處理效率,英特爾還將在處理器內(nèi)部集成內(nèi)存控制器(IMC)。QPI和IMC結(jié)合,可以讓Intel更輕松地擴展多路系統(tǒng)和高性能計算(HPC)應(yīng)用,而Intel現(xiàn)有的處理器架構(gòu)更關(guān)注于指令執(zhí)行引擎和緩存架構(gòu),以便在單線程應(yīng)用中提高性能,導(dǎo)致雙路服務(wù)器平臺性能受限,也無法在對內(nèi)存帶寬需求甚高的HPC中發(fā)揮作用。對于第一代采用QPI總線的Nehalem Xeon來說,集成了3通道的DDR3內(nèi)存控制器,這樣在搭配DDR3 1066的情況下,每個處理器自己就能得到25.6GB/s的內(nèi)存帶寬,大概是現(xiàn)在Tigerton系統(tǒng)的5倍,并且這個帶寬數(shù)量隨著處理器插座的增長而增長,對于四插座系統(tǒng),總的帶寬將增長到恐怖的102.4GB/s。強大的內(nèi)存性能將保證即使每個插座上邊采用8核心的處理器,內(nèi)存帶寬也不會成為性能發(fā)揮的瓶頸。需要說明的是在QPI中,對于四路系統(tǒng)來說,任何兩個處理器之間都可以直接通信,這樣,一個處理器可以很方便的訪問到其他處理器控制的內(nèi)存,這可以大大提升效率。另外,由于在QPI系統(tǒng)下不同處理器可以直接通信,同步緩存稱為很方便的事情,再也不用通過北橋的內(nèi)存讀寫來進行了。

結(jié)語:

隨著QPI的正式推出,英特爾主導(dǎo)的QPI及AMD的HT 兩大未來總線系統(tǒng)將會正面沖突。為了讓多核心的系統(tǒng)更高效的工作,我們相信今后的芯片組會更加復(fù)雜,多條系統(tǒng)總線連接才是今后系統(tǒng)總線發(fā)展的王道。需要說明的是,英特爾在季秋IDF是已經(jīng)在展示了可以工作的、首個采用QPI互聯(lián)架構(gòu)的Nehalem平臺。我們有理由相信,QPI將沖破內(nèi)存性能帶來的樊籬,實現(xiàn)性能的新飛躍。



關(guān)鍵詞: 帶寬前端總線QPI總

評論


技術(shù)專區(qū)

關(guān)閉